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ELŐSZÓ A MAGYAR KIADÁSHOZ 


Ön a , Mesterséges intelligencia: modern megközelítésben" könyv második kiadásának 
fordítását tartja a kezében. Az első kiadás óta sok év telt el, és közben a mesterséges 
intelligencia területe folyamatosan fejlődött tovább. Számos problémakör és módszer 
átértékelődött, új távlatok nyíltak. és különösen a nagy komplexitású problémák meg- 
oldásánál egyre nagyobb hangsúlyt kaptak az olyan megoldási megközelítések, ame- 
lyek különböző ismeretek együttes felhasználásán alapulnak. A szerzők úgy gondolták, 
hogy e kihívásoknak csak úgy tudnak megfelelni, ha a könyvnek egy új, jelentősen 
átdolgozott változatát készítik el. 

Az első kiadás szakmai színvonalára jellemző, hogy az átdolgozás és a bővítés nem 
érintette a könyv lényegi szakmai vonulatát. A könyvben ezúttal több helyet kaptak az 
utóbbi években intenzívebben művelt területek. A könyv több témakörrel bővült, illet- 
ve több témakör — amely az első kiadásban csak érintőlegesen szerepelt — az új kiadás- 
ban nagyobb teret kapott. Így önálló fejezet foglakozik a kényszerkielégítési problé- 
mákkal, teljesen új arculatot kaptak a tervkészítés fejezetei is, de szinte minden, az 
első kiadásban is érintett terület bővebben, a legújabb eredményeket is bemutatva jele- — 
nik meg. Hogy a szerzők célkitűzése minél hitelesebb legyen, átdolgozták az összes 
fejezet irodalmi összefoglalóját és gyakorló feladatait. Az irodalmi összefoglalókban 
igyekeztek a fejezetek mondanivalóját a legfrissebb kutatási eredményekhez kapcsol- 
va bemutatni. 

A második kiadás magyar fordítását megelőzte a könyv olasz nyelvre való lefordí- 
tása. A könyv így már öt (világynyelven terjeszti az informatika egyik legizgalmasabb 
területének vívmányait. Folyamatosan bővült az olvasók köre. Új egyetemek új kurzu- 
sokban fogadták el a könyvet mint meghatározó, alapvető irodalmat. Már Magyarorszá- 
gon is az informatikus egyetemi hallgatók több , generációja" használta tankönyvként. 
Reméljük, hogy az új kiadás magyar változata az ő tanulmányi munkájukat is jobban 
fogja segíteni. 

A második kiadás egyáltalán nem jelentett könnyebb fordítási munkát. A szerzők az 
anyag bővítését végiggondoltan tették meg. A könnyebb olvashatóság és a logikusabb 
gondolatvezetés érdekében átdolgozták azon fejezetek anyagát is, amelyek szakmai 
szempontból az első kiadással majdnem teljesen azonosak. Az új kutatási eredmények- 
kel együtt így ismét olyan új fogalmak jelentek meg, amelyeknek elfogadott magyar 
szóhasználata még nem létezett. Nyelvújító jelleggel megkíséreltük ilyenkor a lényeget 
legjobban megragadó anyanyelvi megfelelőt megtalálni. A második kiadás fordításában 
erőteljesen támaszkodtunk az első fordítás tapasztalataira, így ezúttal is köszönettel 
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tartozunk mindazoknak, akik akkor az anyanyelvi szókészlet kialakításában segítsé- 
günkre voltak. A második kiadáshoz is mellékelünk egy magyar nyelvű irodalom- 
jegyzéket, hogy az angol nyelvben kevésbé jártas olvasóknak is segítséget adjunk 
egyes részterületek bővebb tanulmányozásához. Az irodalomjegyzék kialakításához 
Sántáné Tóth Edit segítségét kértük, akinek széles körű ismeretei és személyes va- 
rázsa elengedhetetlen volt, hogy a magyar , MI társadalmat" feltérképezze, és akinek 
a sok hónapos intenzív munkájáért ezúttal is köszönetet mondunk. 


Budapest, 2005. május A fordítók és a lektor 
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A mesterséges intelligencia (MD) nagyon nagy terület, és ez a könyv is igen terjedel- 
mes. A könyvben megkíséreltük e területet teljes szélességében feltárni: átölelve a 10- 
gikát, a valószínűség-számítást, a folytonos matematikát, az érzékelést, a következtetést, 
a tanulást, a cselekvést, valamint mindent, a mikroelektronikától a világűrt kutató 
robotokig. A könyv azért is terjedelmes, mert bizonyos mértékig el is mélyedünk az 
eredmények tárgyalásában, miközben az egyes fejezetek központi részében csak a leg- 
lényegesebb gondolatokat igyekszünk bemutatni. További eredményekre az egyes fe- 
jezetek végén található irodalmi feljegyzésekben mutatunk rá. 

A könyv alcíme , modern megközelítésben". E talán önmagában üres szófordulat 
szándékolt jelentése az, hogy az ismert eredményeket egy közös keretbe szintetizálva 
igyekeztük bemutatni, ahelyett hogy az MI egyes részterületeit külön-külön a saját 
történelmi hátterükben tárgyaljuk. Elnézést is kérünk mindazoktól, akik a saját szak- 
területüket így a szokásosnál kevésbé ismerik fel. 

A könyv fő egységesítő motívuma az intelligens ágens koncepciója. Felfogásunk- 
ban az MI egyszerűen a környezetüket észlelő és cselekvő ágensek tanulmányozása. 
Minden ilyen ágens egy érzékeléseket cselekvésekre leképező függvényt valósít meg. 
A könyvben e függvénykapcsolat többféle reprezentációjával foglalkozunk, olyan 
reprezentációkkal, mint például a produkciós rendszerek, a reaktív ágensek, a valós 
idejű feltételes tervkészítő rendszerek, a neurális hálók és a döntéselméleti rendsze- 
rek. A továbbiakban bemutatjuk a tanulás szerepét, mint a rendszertervezőnek azt a 
módszerét, amivel ismeretlen környezeteket is képes figyelembe venni, és megmutat- 
juk, hogy a tanulás milyen korlátozásokat jelent az ágens tervezésében, kiemelve az 
explicit tudásreprezentáció és a következtetés szerepét. A robotikát és a gépi látást 
nem függetlenül definiált problémaként tárgyaljuk, hanem mint a cél eléréséhez szük- 
séges szolgáltatásokat. Külön hangsúlyozzuk a feladatkörnyezet fontosságát az ágens 
megfelelő megtervezése szempontjából. 

A fő célunk azokat a gondolatokat átadni, amelyek az MI-kutatás elmúlt 50 évé- 
ben és a kapcsolódó területeken az elmúlt kétezer évben születtek. E gondolatok be- 
mutatásánál, miközben a precizitás megtartására törekedtünk, igyekeztünk kerülni 
a túlzott formalizmust. Ahol alkalmasnak találtuk, pszeudokód szintű algoritmuso- 
kat is közöltünk, hogy a gondolatok konkrét alakot öltsenek. Az általunk használt 
pszeudokódot röviden a B) függelékben írjuk le. A különböző programozási nyelve- 
ken implementált algoritmusokat az olvasó a http://aima.cs.berkeley.edu webolda- 
lon találja meg. 
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A könyvet alapvetően egy alapképzésbeli tárgyhoz vagy tárgysorozathoz szántuk. 
Ugyanakkor használható a graduális képzés tárgyaiban is (esetleg az irodalmi meg- 
jegyzésekben javasolt források némelyikének hozzáadásával). A széles témalefedés 
és a nagyszámú részletezett algoritmus miatt a könyv alapreferenciaként szolgálhat 
az MI-szakos végzős hallgatók és a szűkebb kutatási területükből kitörni kívánó szak- 
emberek számára. Egyetlen feltétel a számítógépes tudományok alapvető fogalom- 
szintű ismerete (algoritmusok, adatstruktúrák, komplexitás) egy első-másodéves 
hallgató szintjén. Az analízis alsóbb éves szintű ismerete jól jön a neurális hálók és 
a statisztikai tanulás részleteinek megértéséhez. A szükséges matematikai háttér egyes 
részeit az A) függelékben adjuk meg. 


A KÖNYV ÁTTEKINTÉSE 


A könyv nyolc részből áll. Az I. rész, a Mesterséges intelligencia az MI-kutatások 
olyan megközelítését adja, amely az intelligens ágens elképzelés köré szerveződik. 
Egy olyan rendszer köré, amely képes eldönteni, hogy mit cselekedjen és amely 
cselekedni is képes. A II. rész. a Problémamegoldás olyan döntési módszerekkel 
foglalkozik, amikor néhány lépésre előre kell gondolkodni. Ilyen pl. a sakk vagy a 
nyílt terepen történő navigálás. A III. rész, a Tudás és következtetés a világról alko- 
tott tudás reprezentálásával foglalkozik, valamint azzal, hogy hogyan működik egy 
ilyen reprezentáció, milyen reprezentációkat ismerünk, hogyan befolyásolhatjuk eze- 
ket a cselekvésünkkel, és hogy ezzel a tudással hogyan lehet logikusan következtetni. 
Ennek folytatásaként a IV. rész, a Tervkészítés e következtetési módszerek haszná- 
latát mutatja a cselekvés eldöntésében, pontosabban a tervek készítésében. Az V. rész, 
a Bizonytalan tudás és következtetés hasonlít a III. és IV. részekre, de a bizonyta- 
tanságok melletti következtetésre és döntéshozatalra koncentrál. Ilyen problémákra 
Pl. az orvosi diagnosztizáló és kezelő rendszerekben kell számítani. 

A II.-tól az V. részig az anyag az intelligens ágenseknek azzal a komponensével fog- 
lalkozik, amely a döntéshozatalért felelős. A VI. rész, a Tanulás a döntéshozó kompo- 
nens által igényelt tudás megszerzési módszereit írja le. A VII. rész, a Kommuniká- 
ció, észlelés és cselekvés olyan módszereket tár fel, amelyekkel az intelligens ágens 
a környezetét érzékelheti — látás, tapintás, hallás vagy akár nyelvmegértés révén — 
abból a célból, hogy megtudja, mi történik körülötte. továbbá olyan módszerekkel fog- 
lalkozik, melyek képesek az ágens terveit igazi cselekvéssé alakítani, ahol a cselekvés 
lehet egy robotmozgás, de akár nyelvi közlés is. Végül a VIII. rész, al Konklúziók az 
MI múltját és jövőjét, valamint a filozófiai és etikai következményeit elemzi. 







VÁLTOZÁSOK AZ ELSŐ KIADÁSHOZ KÉPEST 


Az első kiadás óta az MI sok változáson ment át, és ez a könyv is sokat változott, Lé- 
nyegében át is írtunk minden fejezetet abból a célból, hogy a könyv tükrözze a kutatás 
legújabb eredményeit, a korábbi munkáknak az új eredményekhez jobban illeszkedő 
értelmezését adhassa, valamint hogy a gondolatok folyamának oktató jellege még job- 
ban érvényesülni tudjon. Az MI követőit bátorítani szeretnénk, hogy a mai módszerek 
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sokkal praktikusabbak, mint az 1995-ösek. A tervkészítést példának véve az első 
kiadás algoritmusai néhány tíz lépésből álló tervek generálására voltak képesek, e ki- 
adás algorítmusai több tízezer lépésnyi tervekre skálázhatók fel. Hasonló nagyságrendi 
javulás tapasztalható a valószínűségi következtetés, a nyelvfeldolgozás és más területek 
esetében is. A könyvben az alábbiak a legfontosabb változások: 


s  AzlI. részben méltatjuk a szabályozáselmélet, a játékelmélet, a gazdaságtan és a neu- 
rális tudományok történelmi szerepét. Ez segíti, hogy e gondolatokat a következő 
fejezetekben integráltabb módon tudjuk tárgyalni. 

s  AII. részben az online keresési algoritmusokkal foglalkozunk, és egy új, a korlá- 
tozáskielégítésről szóló fejezetet is beiktattunk. Ez utóbbi természetes átmenetet 
képez a logikával foglalkozó anyagrészek felé. 

s A III. részben az ítéletkalkulus, amit az első kiadásban az elsőrendű logika felé ve- 
zető lépcsőnek tekintettünk, itt mint egy önálló hasznos reprezentációs nyelv kerül 
bemutatásra, gyors következtetési eljárásokkal és áramköralapú ágensfejlesztéssel. 
Az elsőrendű logikával foglalkozó fejezetet átszerveztük, hogy az anyag áttekinthe- 
tőbb legyen és alkalmazási példaként az internetes vásárlás tárgyterülettel bővítettük. 

s A IV. részben foglalkozunk olyan újabb módszerekkel, mint a GRAPHPLAN És a 
kielégítésalapú tervkészítés. Bővült az ütemezés, a feltételes tervkészítés, a hierarchikus 
tervkészítés és a többágenses tervkészítés bemutatása. 

s Az V. részben a valószínűségi hálók anyagát új algoritmusokkal bővítettük, mint 
például a változóeliminálás és Markov lánc Monte Carlo algoritmusok. Egy, a bí- 
zonytalan temporális következtetésekkel foglalkozó új fejezetet írtunk, ahol rejtett 
Markov-modellekről, Kalman-szűrőkről és dinamikus valószínűségi hálókról van 
szó. Mélyebb a Markov döntési folyamat tárgyalása, új alfejezetek foglalkoznak 
a játékelmélettel és a mechanizmustervezéssel. 

s A VI. részben kapcsoljuk össze a statisztikai, a szimbolikus és a neurális tanulást 
továbbá a boosting algoritmusokkal, az EM algoritmussal, a példányalapú tanu- 
lással és a kernelmódszerekkel (support vector machines, szupport vektor gépek) 
foglalkozó részekkel bővítjük anyagot. 

s A VII. részben a nyelvfeldolgozás tárgyalását a párbeszédmegértéssel és a nyelvtan- 
indukálással bővítjük. Új rész foglalkozik a nyelv valószínűségi modellezésével, az 
információ-visszakeresési és fordítási alkalmazásokkal. A robotika tárgyalásánál ki- 
emeljük a bizonytalan szenzoradatok egyesítését. A látással foglalkozó anyagrész 
objektumfelismeréssel bővült. 

s A VIII. részben egy új alfejezetben az MI etikai következményeivel foglalkozunk. 


A KÖNYV JAVASOLT HASZNÁLATA 


A könyvnek 27 fejezete van, mindegyik nagyjából egyhetes előadásnyi anyagot je- 
lent. Az egész könyv feldolgozása két félévet tenne így ki. A tanfolyamot azonban a 
szűkebb hallgatói és előadói érdeklődéshez is szabhatjuk. Mivel a könyv széles terü- 
letet fed le, jó háttéranyag lehet egy rövid bevezető alapkurzushoz. de felhasználható 
egyes témaköröket magasabb szinten bemutató specializált graduális kurzusokhoz is. 
A könyv első kiadását felhasználó 600 egyetemi kurzus tematikájából egy ízelítő az 
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aima.cs.berkeley.edu weblapon található. Itt néhány hasznos tanács is található arra néz- 
ve, hogy konkrét speciális igényekhez hogyan állíthatunk össze egy megfelelő téma- 
szekvenciát. 

A könyv 385 gyakorlatot tartalmaz. Azokat, amelyekhez nagyobb lélegzetű progra- 
mozási munka is szükséges, egy klaviatúra ikon jelzi. Az ilyen gyakorlatokat legjobban 
úgy lehet megoldani, hogy igénybe vesszük az aima.cs.berkeley.edu programkódtár 
szolgáltatásait. Méreténél fogva néhány gyakorlat féléves házi feladatként is kiadható. 
A gyakorlatok egy része irodalmazást is igényel. Ezeket egy nyitott könyv ikon jelzi. 

A könyvben a fontos részeket egy mutató kéz ikon jelzi. Hogy a könyvben az egyes 
témákat könnyű legyen megtalálni, kiterjedt tárgymutatót is készítettünk. 


A WEBOLDAL HASZNÁLATÁRÓL 
Az aima.cs.berkeley.edu weboldalon megtalálhatók: 


s a könyvbeli algoritmusok implementációja több különböző programozási nyelven; 

s a könyvet használó több mint 600 oktatási intézmény listája, számos webes link- 
kel az online oktatási anyagokhoz; 

"  annotált linkek listája több mint 800 olyan weboldalhoz, ahol hasznos MI-tartalom 
található; 

s a segédanyagok és linkek fejezetenkénti listája; 

" útmutató, hogy hogyan csatlakozhatunk a könyvvel foglalkozó vitafórumhoz; 

s" útmutató, hogy a kérdéseinkkel és az észrevételeinkkel hogyan léphetünk kapcso- 
latba a szerzőkkel; 

" útmutató, hogy a nagy valószínűséggel előforduló hibákat hogyan jelezzük; 

" a könyvbeli ábrák, fóliák és más oktatáshoz hasznos anyagok. 





KÖSZÖNETNYILVÁNÍTÁS 


A 24. fejezet (Az észlelés) nagy részét Jitendra Malik. a 25. fejezet (Robotika) többségét 
az első kiadásban John Canny, a jelen kiadásban pedig Sebastian Thrun írta. Az Irodal- 
mi és történeti megjegyzéseket az első kiadáshoz Doug Edwards kutatta fel, Tim Huang, 
Mark Paskin és Cynthia Bruyns segítettek az ábrák és az algoritmusok megfelelő for- 
májú kialakításában. A Prentice Hall kiadónál Alan Apt, Sondra Chavez, Toni Holm, 
Jake Warde, Irwin Zucker és Camille Trentacoste minden tőlük telhetőt megtettek, hogy 
rákényszerítsenek bennünket a határidők betartására, és sok hasznos javaslattal segítet- 
ték, hogy a könyv a megfelelő tartalommal és megfelelő köntösben jelenjen meg. 

Stuart meg szeretné köszönni szüleinek a folyamatos támogatást és bátorítást, fele- 
ségének, Loy Sheflottnak a végtelen türelmét és a határtalan bölcsességét. Reméli, 
hogy Gordon és Lucy rövidesen már olvashatják is ezt. Igen segítőkésznek bizonyult 
az RKHC (Russell Kivételes Hallgatói Csoportja) is. 

Peter szeretné megköszönni szüleinek (Torsten és Gerda) az indíttatást. Feleségé- 
nek (Kris), gyerekeinek és barátainak köszöni a bátorítást és azt, hogy elviselték őt 
a könyv megírásának hosszú ideje és a könyv átírásának még hosszabb ideje alatt. 
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Adósak vagyunk a Berkeley, a Stanford, az MIT és a NASA könyvtárosainak és 
a CiteSeer, továbbá a Google fejlesztőinek, hogy a kutatás módját forradalmasí- 
tották. 

Nem tudunk külön-külön köszönetet mondani mindenkinek, aki a könyvet használta, 
és hasznos megjegyzésekkel állt elő, azonban az alább felsoroltak különösen hasznos 
megjegyzéseit meg szeretnénk köszönni: Eyal Amir, Krzysztof Apt, Ellery Aziel, Jeff 
Van Baalen, Brian Baker, Don Barker, Tony Barrett, James Newton Bass, Don Beal, 
Howard Beck, Wolfgang Bibel, John Binder, Larry Bookman, David R. Boxall, Ger- 
hard Brewka, Selmer Bringsjord, Carla Brodley, Chris Brown, Wilhelm Burger, Lauren 
Burka, Joao Cachopo, Murray Campbell, Norman Carver, Emmanuel Castro, Anil 
Chakravarthy, Dan Chisarick, Roberto Cipolla, David Cohen, James Coleman, Julie 
Ann Comparini, Gary Cottrell, Ernest Davis, Rina Dechter, Tom Dietterich, Chuck 
Dyer, Barbara Engelhardt, Doug Edwards, Kutluhan Erol, Oren Etzioni, Hana Filip, 
Douglas Fisher, Jeffrey Forbes, Ken Ford, John Fosler, Alex Franz, Bob Futrelle, Marek 
Galecki, Stefan Gerberding. Stuart Gill, Sabine Glesner, Seth Golub, Gosta Grahne, 
Russ Greiner, Eric Grimson. Barbara Grosz, Larry Hall, Steve Hanks, Othar Hansson, 
Ernst Heinz, Jim Hendler, Christoph Herrmann, Vasant Honavar, Tim Huang, Seth 
Hutchinson, Joost Jacob, Magnus Johansson, Dan Jurafsky, Leslie Kaelbling, Keiji 
Kanazawa, Surekha Kasibhatla, Simon Kasif, Henry Kautz, Gernot Kerschbaumer, 
Richard Kirby, Kevin Knight, Sven Koenig, Daphne Koller, Rich Korf, James Kurien, 
John Lafferty, Gus Larsson, John Lazzaro, Jon LeBlanc, Jason Leatherman, Frank Lee, 
Edward Lim, Pierre Louveaux, Don Loveland, Sridhar Mahadevan, Jim Martin, Andy 
Mayer, David McGrane, Jay Mendelsohn, Brian Milch, Steve Minton, Vibhu Mittal, 
Leora Morgenstern, Stephen Muggleton, Kevin Murphy, Ron Musick, Sung Myaeng, 
Lee Naish, Pandu Nayak, Bernhard Nebel, Stuart Nelson, XuangLong Nguyen, Illah 
Nourbakhsh, Steve Omohundro, David Page, David Palmer, David Parkes. Ron Parr, 
Mark Paskin, Tony Passera, Michael Pazzani, Wim Pijls, Ira Pohl, Martha Pollack, 
David Poole, Bruce Porter, Malcolm Pradhan, Bill Pringle, Lorraine Prior, Greg Provan, 
William Rapaport, Philip Resnik, Francesca Rossi, Jonathan Schaeffer, Richard Scherl, 
Lars Schuster, Soheil Shams, Stuart Shapiro, Jude Shavlik, Satinder Singh, Daniel 
Sleator, David Smith, Brian So, Robert Sproull, Lynn Stein, Larry Stephens, Andrea 
Stolcke, Paul Stradling, Devika Subramanian, Rich Sutton, Jonathan Tash, Austin Tate, 
Michael Thielscher, William Thompson, Sebastian Thrun, Eric Tiedemann, Mark Tor- 
rance, Randall Upham, Paul Utgoff, Peter van Beek, Hal Varian, Sunil Vemuri, Jim 
Waldo, Bonnie Webber, Dan Weld, Michael Wellman, Michael Dean White, Kamin 
Whitehouse, Brian Williams, David Wolfe, Bill Woods, Alden Wright, Richard Yen, 
"Weixiong Zhang, Shlomo Zilberstein és a Prentice Hall névtelen bírálói. 


A KÖNYV BORÍTÓJÁRÓL 


A borítón látható képet a szerzők szerkesztették és Lisa Marie Sardegna és Maryann 
Simmons kivitelezte SGI Inventor" és az Adobe Photoshop" segítségével. A cím- 
lap az MI történetéből az alábbiakat eleveníti fel: 

1. Arisztotelész tervkészítő algoritmusa a De Motu Animalium c. műből (kb. i.e. 400). 
2. Ramon Lull fogalomgenerátora az Ars Magna c. műből (1300 körül). 
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3. Charles Babbage Differenciál Gépe, az első univerzális számítógép prototípusa 
(1848). 

.. Az elsőrendű logika Gottlob Frege-féle formalizmusa (1789). 

. A logikai következtetés Lewis Carroll-féle diagramjai. 

. A valószínűségi hálózat Sewall Wright-féle ábrázolása (1921). 

. Alan Turing (1912-1954). 

. Shakey a Robot (1969—1973). 

. Egy korszerű diagnosztikai szakértői rendszer (1993). 


OOXJLAL pa 


A SZERZŐKRŐL 


Stuart Russel! 1962-ben Portsmouth-ban, Angliában született. 1982-ben Oxfordban 
fizikából szerzett kitüntetéses oklevelet, majd 1986-ban a Stanfordon doktorált számí- 
tógépes tudományokból. Ettől kezdve a Kalifornai Berkeley Egyetemen (University 
of California at Berkeley) dolgozik, ahol jelenleg a számítógépes tudományok pro- 
fesszora, az Intelligens Rendszerek Központ igazgatója és a Smith-Zadeh mérnök- 
tudományi tanszék vezetője. 1990-ben megkapta a Nemzeti Kutatási Alap Fiatal Kuta- 
tók Elnöki Díját, 1995-ben pedig másodmagával a Számítógép és a Gondolat Díjat. 
1996-ban a Miller Intézet ösztöndíjas professzora volt a Kaliforniai Egyetemen és 
2000-ben megkapta a tekintélyes hároméves, rektori kutatói-professzori ösztöndíjat. 
1998-ban a Stanfordon Forsythe-emlékelőadásokat tartott. Az Amerikai MI Társaság 
tagja, korábban pedig a társaság vezetőségi tagja volt. Több mint 100 cikket publikált az 
MI különböző területeiről. További könyvei között megtaláljuk a The Use of Knowledge 
in Analogy and Induction és (Eric Wefalddal együtt) a Do the Right Thing: Studies in 
Limited Rationality c. könyveket. 


Peter Norvig a Search Ouality részleg vezetője a Google-nál. Az Amerikai MI Társa- 
ság vezetőségi tagja. Korábban a NASA Ames Research Centerben a Számítástudo- 
mányi Osztály igazgatója volt, ahol felügyelte a NASA MI- és robotikai kutatásait és 
fejlesztéseit. Ezt megelőzően a Iunglee-nél dolgozott tudományos főmunkatársként, 
ahol hozzájárult az első internetes információkinyerő szolgáltatás kifejlesztéséhez, 
valamint a Sun Microsystems Laboratoriesnál vezető kutatóként, ahol az intelligens 
információ-visszaszerzésen dolgozott. Diplomáját alkalmazott matematikában a Brown 
Egyetemen, PhD-fokozatát, számítógépes tudományokban, a Kaliforniai Egyetemen 
Berkeleyben kapta. A Dél-kaliforniai Egyetemen professzorként, a Berkeleyben, 
Kalifomiában pedig a tanszéki kutatócsoport tagjaként dolgozott. Több mint 50 publi- 
kációja van a számítógépes tudományok területén. Ezek között találjuk a Paradigms of 
AI Programming: Case Studies in Common Lisp, Verbmobitl: A Translation System 
Jor Face-to-Face Dialog és Intelligent Help System for UNIX c. könyveket. 
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diszkriminációs háló 777 
diszparitás 999 
DNS 163 
dobáskényszer 233 
DOF lásd szabadságfokok 
dokumentumklaszterezés 963 
dokumentumosztályozás 963 
dominancia, sztochasztikus 687 
domináns stratégiák egyensúlya 729 
döntés 
egylépéses 678 
szekvenciális 678, 707 
döntéselemzés 698 
-döntéselmélet 41, 549 
metakövetkeztetés 1100 
döntéshozó 698 
Göntési fa 754 
legkisebb 757 
metszés 763 
döntési háló 578, 676, 691 
dinamikus 724 
döntési tönk 768 
DÖNTÉSt-FA-TANULAS 802 
DPLL lásd Davis-Putnam algo- 
ritmus 
DRAGON 672 
drón 1060 
dualista elmélet 1081 
dualizmus (Descartes, R.) 37 
DVL 439 
DYVNA architektúra 897 
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Echelon-rendszer 1089 


EEG lásd elektrocnkefalográfia 
egzisztenciális 
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gráf 419 
kvantor 334 


példányosítás 334 
egyed 160 
egyedi cselekvés axióma 401 
egyedi elnevezések axiómája 401 
egyedi elnevezések feltételezés 
(UNA) 401, 425, 608 
egyedi füzér axióma 411 
egyedítés 395 
egyedülálló szó 664 
egyenleti egyesítés 369 
egyenlőségszímbólum 311 
egyensúly 729. 879 
egyensúlyi táblaállás 222 
egyértelműsítés 417 
EGYESÍT 338 
egyesítés 333, 338 

legáltalánosabb 340 
egyesítési lépés 338 
egyeztetés 921 
egyrétegű neurális háló 848 
egység 845 
egységes erőforrás azonosító 415 
egységfüggvény 393 
egységklóz 277, 370 
egységpreferencia 370 
egységrezolúció 370 
egységterjesztés 277 
FEGYSZERŰ-PROBLÉMA -MEGOLDÓ- 
ÁGENS 99 
együttes 

tanulás 766 

terv 530 
ekvivalencia 259 
ekvivalens 

következtetés szempontjából 335 
€1916, 1004 
elágazási tényező 112 

effektív 149, 174 
elágazik-és-korlátoz 175 
Éldetektálás 991 
elektroenkefalográfia (EEG) 43 
elemi esemény 551 
elemzés 910, 913 

fentről lefelé 913 

hatékony 915 

lentről felfelé 913 
ÉL-HozzáAD 916. 917 
ELIZA 1074, 1089 
eljárás 

csoportosító 597 
eljárásmód 538, 709 
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értékelés 718 

iteráció 718 

iteráció, aszinkron 720 

iteráció, módosított 720 

Javítás 718 

nem stacionárius 711 

optimális 709 

stacionárius 711 

véges 712 

vesztesége 717 
élkonzisztencia 192 

fenntartása (MAC) 192, I96, 204 
ellenőrzési játék 727 
ellenőrző megfigyelés 632 
ellenség érv 168 
elmélet 

leíró 684 

normatív 684 
elméleti tudatlanság 547 
elmosódott argumentum 411 
eloszlás 

béta 828 

erősfarkú 176 

feltételes Gauss 590 

kevert Gauss 833 

kevert 833 

lineáris Gauss 589 

logit 591 

probit 591, 616 

stacionárius 605, 634 

standard normális 110 

szigmoid 619 

többváltozós Gauss 644, 1110 
elődállapot 461 
előfeltétel 

axióma 482 

külső 501 

nyitott 466 
előfordulási próba 340, 353 
elöljárószavak 911 
ELŐRE 633, 644, 722 
előrecsatolt háló 846 
előrefelé láncolás 273 
előre-hátra algoritmus 636, 839 
előrejelzés 632 
előrenéző ellenőrzés 191 
előrenyesés 223 
először-be-először-ki tásd FIFO 
ELső-ELEM 110 
eltolássúly 845 
ELUTASÍTÓ-MINTAVÉTELEZÉS 600 
EM algoritmus 632, 669, 671, 832, 
838, 839. 890, 956 


strukturális 840 
EMAt 145 
ember nélküli közúti jármű (ULV) 
1023 
ember nélküli légi jármű (UAV) 
1023 
emlékezet 300 
empiricista 37 
empirikus gradiens 893 
ENIAC 46 
Entscheidungsproblem 39 
epifenomenális szereplő 1084 
epizód 76 
EOP 374 
ERL-EL-KÉRDEZ 344, 345, 350 
ERL-HL-KÉRDEZ 350, 351, 354 
erőforrás 498 

fogyóeszköz 498. 539 

-kényszer 194 
erőmérő 1026 
erős MI 1073 
erősítési tényező 1051 
énékiteráció 713 
ÉRTÉKITERÁCIÓ 715. 717 
ÉRTESÍT 521 
Érvényesség 264 
Érzékelés 66, 317 

aktív 519, 984 

automatikus 518 

cselekvés 519, 694 

sorozat 66 
érzékelő 74. 984 

modell 630 
észékenységvizsgálat 699 
esemény 387, 591 

általánosított 404 

diszkrét 406 

folytonos 406 
eseménykalkulus 403 
esetalapú következtetés 814 
eshetőség 209 
És-KERESÉS 514 
És-kiküszöbölés 265 
ÉS-párhuzamosság 356 
ÉS-VAGY gráf 274 
És-VAGY-GRÁF-KERESÉS 514, 541 
észlelés 909 
euklideszi távolság 842 
Euler-gráf 178 
Eurisko 816 
evolúció 163 
evolúciós stratégia 177 
expanziófókusz 998 
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fa 
dekompozíció 201 
szélessége 202 
FAa-KERESÉS 109, 111, 136, 140 
faktorálás 269, 362 
FASTFORWARD 489 
FASTUS 967, 968, 980 
fehérgetervezés 107 
fekete doboz 183 
feladat 
előrevetítő 398 
háló 488 
környezet 72, 89 
tervkészítési 398 
felbonthatóság 680 
FELDOLGOZ 372 
felfedezés 874, 883 
felfedezési függvény 884 
felfedező rendszerek 815 
félig eldöntbető 336 
feltétel-cselekvés szabály 81 
FELSOROL-EGYÜTTES-KÉRDEZES 
561, 569, 592, 593 
feltételes 
függetlenség 617 
feltételes lépés 512 
feltételes valószínűségi tábla (FVT) 
580. 581 
feltételezés 433 
egyedi név 608 
feltételezésalapú igazság- 
karbantartó rendszer (ATMS) 432, 
440 
feltételfeloldás 560 
felügyelt tanulás 888 
felület 
dőlése 995 
Lambert-féle 989 
lejtése 995 
mintázat 1001 
fennsík 156 
fenomenológia 1079 
fentről lefelé elemzés 913 
FF (FASTFORWARD) 489 
FIFO 113 
Fifth Generation projekt lásd Japán 
Ötödik Generációs projekt 
FiLTER 372 
FIND-TRANSFORM 1014 
finom mozgások tervezése (FMT) 
1047 
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fitness 
függvény 161 
tájfelszín 177 
fix pont 345 
fixálás 1000 
fizikai szimbólumrendszer hipo- 
tézis 50 
ÍMRI 43 
FMT lásd finom mozgások terve- 
zése 
Focus 815 
fogalomgenerátor (Lull, R.) 27 
foglalási hálózat 1063 
fogolydilemma 728. 742 
FotL 806, 807, 815, 817 
fókuszterek 940 
folyamat 406 
folyó 
esemény 397 
esemény kalkulus 402. 407 
folytatás 355 
folytonos beszéd 666 
FOLYTONOS-RRT-ÁGENS 525, 528 
folytonosság 680 
fonéma 660 
fonológia 660 
FORBIN 535 
fordítás 
előre szerkesztett 970 
irodalmi 970 
korlátozott forrás 970 
memóriaalapú 972 
nyers 970 
fordítási modell 973 
forgatás 1027 
formális 
nyelv 906 
formális nyelvtan 911 
fotometria 988 
főnév 
megszámlálható 395 
nem megszámlálható 395 
főnévi kifejezés 907 
FREDDY 107, 536, 1064 
Fredkin-díj 238 
Ferrz 231 
FRUMP 980 
FSA lásd véges állapotú automata 
FUF generáló rendszer 945 
funkcionális 
állapotazonosság elmélet 1093 
űfüggőség 799 
mágneses rezonancia 43 


specifikáció elmélete 1093 
funkcionatizmus 1081 
fuzzy 
halmazelmélet 615 
logika 547, 612, 615 
szabályozás 616 
független részproblémák 199 
függetlenség 562. 566 
abszolút 562 
feltételes 566 


marginális 562 
függőségi nyelvtan 944 
függőségvezérelt visszalépés 205 
függvény 299 

approximáció 887 





súlyozott lincáris 221 
-szimbóhimok 304 
FVT lásd feltételes valószínűségi 
tábla 


G, Gy 


Gamma függvény 869 
GARI 535 
Gaschning-heurisztika 180 
"Gawss-eloszlás 1110 
-ok keveréke 662 
"Gauss-hibamodell 652 
"Gauss-Jordan-elimináció 1108 
"generálóképesség 908 
genetikus 
algoritmus (GA) 54. 136, 160, 
177 
genetikus programozáís, 177 
GENETIKUS-ALGORITMUS 162 
geometriai tételbizonyító 50, 380 
gépi 
evolúció 54 
gépi fordítás 951 
gépi látás 33 
GIB 233 
Gibbs-mintavételező 606, 619 
Gittins-index 884, 897 
(GLAUBER 816 
€Elobális helymeghatározó 
rendszer (GPS) 34. 38, 50, 128, 
487,651, 1026 
differenciális 1026 
GLR robot 1065 
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6 (játék) 232 
G044-r (játékprogram) 232 
Goemate program 232 
GoFAL 1077 
Goldbach-sejtés 816 
GoLEM 815 
GOLOG 436, 1058 
Go-Moku 231 
Good-Turing-simítás 978 
Gödel nemteljességi tétele 39, 1076 
Gödel-szám 367 
görbületi diszkontinuitás 1905 
GPS lásd globális helymeghatáro- 
ző rendszer 
gradiens 164 
empirikus 165 
gráf 
És-VAGY 514 
irányított, körmentes 579 
soros tervkészítési 475 
színezés 203 
GRÁF-BŐVÍTÉS 476 
GRÁF-KERESÉS 122, 136. 140, 218, 
541 
gráfos modell 578, 622 
Graph Traverser 175 
GRAPHPLAN 472, 476, 486. 537 
érzékeléses 537 
GRL lásd általános robot nyelv 
Guiness Rekordok Könyve 703 
Gus 980 
gyakorlati tudatlanság 547 
gyenge 
MI 1073 
módszer 55 
győztes 243 





H 


ha-akkor szabály 81 
Hacker 488 
hallgató 905 
halmaz 315 
halmaz-szint 475 
háló 
CPSC 588 
egyszeresen összekötött 597 
többszörösen összekötött 597 
hamis 
negatív 784 
pozitív 784 
Hamming-távolság 842 
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Hansard korpusz 973, 983 
bármashangzó 663 
háromszög 358 
háromszög egyenlőtlenség 140 
HaRrY 176. 672 
hash-tábla 341 

kulcs 341 
használható axióma 372 
HASZNOSSÁG 213 
hasznosság 86, 549 

elv 681 

normált 685 
hasznosságbecslés, közvetlen 876, 
895 
hasznosságelmélet 549 

többattribútumú 686 
hasznosságfüggetlenség 690 

kölcsönös 690 
hasznosságfüggvény 86, 211. 676. 
751 
határozott klóz 272 
határvonal 142 
hatásaxióma 398 
hatásdiagram 618, 676, 691 
hatásháló 578 
HÁTRAFELÉ 635 
hátrafelé láncolás 273 
háttértudás 249 
háztömb-távolság 148 
HEaRsAv-II 672 
hearts 228 
Hebb-tanulás 48 
hedonisztikus kalkulus 702 
hegygerinc 156 
HeEGymászás 155 
Helpmate robot 1059, 1060 
helyes következtetés 256 
helyesírás-javító 963 
HELYETrTEsír 334, 337 
helyettesítés 334 

lista 312 
helyettesíthetőség 680 
helyezett automata 1065 
helymeghatározás 1030 

globális 1030 

Markov 1064 
Hempel igazoló elmélete 37 
heptikus visszacsatolás 1065 
Herbrand-bázis 366 
Herbrand-tétel 345, 365. 366 
Herbrand-univerzum 365 
Hesse mátrix 165 
Heuristic Programming Project 56 


Heuristic Search Planner (HSP) 489 
heurisztika 452 
domináló 150 
elfogadható 139, 462 
fokszám 190 
konzisztenciája 140 
konzisztens 150 
leginkább megkötött változó 
500 


legjobban-korlátozott-válozó 
an 
legkevésbé-korlátozó-érték 190 
legkevesebb fennmaradó érték 
190 
legkorlátozottabb változó 346 
minimális tartalék 499 
monotonitása 140 
nulla lépés 230. 238 
heurisztikus függvény 137 
hexapod 1053 
HFH lásd hierarchikus feldatháló 
hiányos információ 210 
hiba 
átmeneti 652 
függvény LILI 
visszaterjesztés 853, 863 
hibrid architektúra 1099 
hiedelem 
állapot 125, 229, 516, 549, 
721. 1029 
(rissítés 431 
mértéke 547 
revízió 431 
hierarchia 
taxonomikus 390 
hierarchikus 
dekompozíció 500 
feladatháló (HFH) 500, 536, 538 
megerősítéses tanulás 1098 
stniktúra 1098 
hiperfa szélesség 205 
HipNav 61 
hipotézis 752. 818 
Általánosítás 785 
konzisztens 752 
közelítőleg helyes 771 
Pillanatnyilag-legjobb 777, 784 
prior 819 
szűkítés 785 
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kifejezőképessége 753 
HITECH 237 
Hív 355 
hivatkozó szöveg 415 
HMM fásd rejtett Markov-modell 
holonomikus 1028 
homcostatikus 866 
homo sapiens 31 
homofón 660 
Hopfield-háló 867 
Hopkins Beast 1063 
horizont 
-probléma 223 
véges 711 
végtelen 711 
Horo-klóz 272 
HOZZÁRENDELETLEN-VÁLTOZÓ- 
KIVÁLASZTÁS 188, 190 
HSCP 537 
HSP lásd Heuristic Search 
Planner 489 
HSTS 535 
Hucix 618, 671 
hurkos terjesztés 620 
huzalozás 107 


IBM Model 3. 974. 982, 983 
IBM RS/6000 230 
1D3 815 
idő és igeidő 928 
időbeli különbség 879, 896 
időigény 110 
időrendi visszalépés 195 
JE rendszer 
attribútumalapú 967 
TEEE P1600.1 435 
igazolás 428, 432 
igazoló elmélet (Hempel) 37 
igazságfüggvény 612, 617 
igazság-karbantartó rendszer (TMS). 
205431, 440 
feitételezésalapú 432 
igazolásalapú (ITMS) 432, 440 
igazságtábla 260 
igazságtartó következtetés 256 
igei kifejezés 907 
igék alkategóriákba osztása 923 
ILP Zásd induktív logikai progra- 
mozás 
IMA? 144 
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impasszolás 233 
implementációs szint 250 
implikáció 258 
indexelés 340 
predikátum 340 
indikátorváltozó 851 
irekt szólásaktus 906 
indító 777 
indukált szélesség 205 
indukció 37, 751 
indukciós tanulás 941 
induktív következtetés 
alapproblémája 752 
tiszta 751 
induktív logika 556, 573 
induktív logikai programozás (ILP) 
794, 803, 815, 941 
információ 760 
érték elmélet 694 
gyűjtés 71 
gyűjtés, rövidlátó 697 
keresés 864, 951, 957 
kinyerés 951, 966 
nyereség 761 
teljes, értéke 695 
ingerszegénység 946 
INKONZISZTENS-ÉRTÉKEKET-KIVESZ 
193 
integrálhatóság 1002 
intelligens ágens 62 
intelligens tudásalapú rendszerek 
57 
intencionális állapot 1082 
intencionalitás 1079 
International Phonetic Alphabet 
(IPA) 661 
INTERPLAN 488 
interpretáció 304 
invertált 
index 965 
inventált inga 891 
IPA lásd International Phonetic 
Alphabet 
IPEM 538 
IPL Tistakezelő nyelv 49 
IPP gráftervező rendszer 489 
irányításelmélet 47, 1051 
irányított körmentes gráf (DAG) 579 
IR-rendszer 
bool kulcsszó modell 958 
felidézés 961 
Pontosság 961 
szózsák modell 960 





1SA-kapcsolat 439 
Isis 535 

ismeretelméleti megállapítás 301 
ismerethiány 612, 614 

ISS Nemzetközi űrállomás 1060 
ítéletkalkuhus 248. 258 
ítéletlogikai attítűd 410, 1082 
ítéletszímbólum 258 

ITEP sakkprogram 237 
ITERATÍVAN-MÉLYÜLŐ-KERESÉS 
118. 149 

100 815 

IxXTET 489, 535 
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Jacguard szövőszéke 1063 
Japán Ötödik Generációs projekt 
57, 380 
játék 41 
determinisztikus ekvivalens 683 
HEx 239 
ismétlődő 734 
játékfa 212 
kártyajáték 228 
kétszemélyes 209 
kimenetele 728 
koordinációs 730 
megoldása 728 
részleges információjú 735 
természet elleni 513 
zérusösszegű 731 
zérusösszegű teljes 
információjú 209 
játékelmélet 41, 209 
játékos 727 
játékprogramok 229-233 
bridzs 232 
dáma 231 
86232 
jegy vektor 662 
ostábla 232 
Othello 232 
sakk 230 
jelenet 986 
jellemző 153 
Jjelmudomány 943 
jelzések 943 
jobbra asszociáció 936 
ITMS lásd igazság-karbantartó 
rendszer, igazolásalapú jutalom 
89, 708, 873, 1098 
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additív 711 
alakítás 898 
átlag 712 
függvény 875 
leszámítolt 711 
—mátrix 727 


K 
Kaussa program 237 
kalah (játék) 237 
Kalman-erősítésmátrix 647 
Kalman-szűrő 627, 643, 1029, 
1063 
váltó 650, 674 
kanonikus eloszlás 587 
kapcsolat 356, 845 
kapcsolati 
bizonytalanság 609 
módszer 378 
karakterfüzérek 906 
kártyajáték 228 
kaszkádosított véges állapotú átala- 
kító 968 
katafora 937 
kategória 390 
anyag 396 
diszjunkt 391 
dolog 396 
kategorikus nyelvtan 944 
kauzális háló 865 
k-DF (döntési fa) 773 
k-DL (döntési lista) 773 
kényszer 183 
abszolút 186 
-alapú általánosítás 814 
bináris 186 
egyenlőtlenségi 471 
feljegyzés 205 
hipergráf 186 
lineáris 185 
nemlineáris 186 
nyelv 185 
összekapcsolási 1040 
preferencia 187 
tanulás 197 
terjesztése 191 
unáris 186 
kényszerítés 510 
kényszerkielégítési probléma (CSP) 
183, 189, 551 
Bodle 185 
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folytonos tartormányú 186 
inkrementális megfogalmazás 
185 
kényszergráfja 184 
kényszertogikai-programozás 204 
kép 986 
képpont 986 
képszegmentálás 994 
képzési szabály 1112 
KÉRDEZ 340 
keresés 85, 99 
AS 139, 174, 175 
alfa-béta 216, 230 
B" 238 
dinamikus súlyozási technika 
174 
DTA? 175 
egyenletes költségű 114 
egyensúlyi 222 
egyszerűsített 145 
ellenségek melletti 209 
elsőnek-választott 157 
EMA" 175 
gradiens leereszkedés 158 
hegymászó 155, 170 
heurisztikus 112, 174 
heurisztikus útalgoritmus 179 
IK 175 
IMA" 175 
informált 97, 112, 136 
iteratívan kifejtő 175 
iteratívan megnyúló 419, 132 
iteratívan mélyülő 117, 144 
keresési költség 112 
kétirányú 119, 491 
konspirációs szám 238 
legjobbat-etőször 136 
legmeredekebb emelkedő 155 
lokális 136, 154 
lokális nyaláb 159 
mélységi 115 
mélységkorlátozott 117 
memóriakorlátozott 145, 175 
mohó 137, 155 
MTDYf) 238 
nem informált 97, 112 
nyaláb 159, 176 
offline 166 
online 136, 166 
optimális 154, 174 
összköltsége 112 
Párhuzamos 179 
rekurzív legjobbat-először 144 





RLEK 238 
SSS7 238 
STaGE 176 
szélességi 112 
sztochasztikus 157 
sztochasztikus nyaláb 160 
tabukeresés 176 
tanuló valós idejű 171 
teljes 154 
TRTA? 178, 181 
vak 112 
valós idejű 178 
véletlen újraindítású 157 
visszalépéses 115, 188 
keresési csomópont 109 
keresési fa 108 
keresési stratégia 109 
keresési tér 
elágazási tényezője 798 
keresztezés 161 
keresztkorreláció 997 
keresztvalidáció 765 
hagyj-ki-egyet 765 
keret 56, 438, 662 
keretaxióma 399 


kemelesített algoritmus 860 

kernelfüggvény 843 

kernelmodell 843 

kétkamerás térbeli látás 999 

keverési idő 634 

kevert eloszlás 833 

kevert Gauss-eloszlás 833 

kezdeti állapot 914 

kezdőszimbólum 1112 

kezelhetetlenség 39 

kézírás-felismerés 1007 

kéz-szem gép 1064 

KHF lásd kölcsönösen hasznosság- 

független 

kialakuló viselkedés 533 

kiátlagotás 560 

kibontakozó viselkedés 1054 

Kos 381 

kiejtési modell 664 

kielégíthetőség 265 
vizsgálata 480 

kielégítő döntéshozatal 41 

kiemelés 338 

KIÉRTÉKEL 220, 222 


1195 


kiértékelő függvény 136. 210. 219. 
887 
kifejezés 907 
kifejezésstruktúra 907. 943 
KIFEJT 11 
kiinduló állapot 100, 185, 211 
KIJELENT 340 
kijelentés 312 
kimerítő felosztás 391 
kínai szoba 1085 
kinematika 1040 
inverz 1040 
kisbetű-nagybetű konverzió 962 
kísérlet 875 
kiszámítható függvény 39 
kiterjesztés 922 
lemma 365. 367 
kiterjesztett. 
interpretáció 307 
Kalman-szűrő 649. 1033 
nyelvtanok 921 
nyelvtanok generálóképessége 
925 
véges automata 1056 
kiterjesztett véges automata (AFSM) 
1054, 1056 
kitermelés 883 
k-konzisztencia 193 
k-közép klaszterezés 964 
KKSZ lásd kiterjesztett Kalman- 
szűrő 
KL-ONE 439 
klóz 
elsőrendű határozott 342 
Horn 272 
átéledogikai határozott 342 
törzse 351 
KO lásd korlátozott optimalítás 
koartkuláció 664 
koartikulációs hatás 663 
kockavilág 458 
kognitív 
architektúra 349 
pszichológia 44 
robotika 436 
tudomány 34, 45 
koherenciarelációk 939 
koherens szöveg struktúrája 939 
Kolmogorov-féle axióma 555 
Kolmogorov-komplexitás 778 
kommunikáció 77, 298, 529, 533 
905 
lépések 909 


1196 


létrehozás 909 
szándék 909 
szintézis 909 
kommutatívitás 187 
kompetitív arány 167 
komplexitás 41 
algoritmikus 778 
Kolmogorov 778 
kompozíció 352 
Komrozíció 352 
kompozíciós 
képesség 298 
szemantika 926 
konfigurációs tér 1039, 1040 
váza, 1044 
konfliktushalmaz 195 
konftiktusvezérelt visszaugrás 196 
konjugált prior 828 
konjunkció 258 
konjunkt sorrendezés 346 
konjunktív lekérdezés 379 
konjunktív normál forma (CNF) 
269, 360 
konnekcionizmus 57, 844 
kontúr 996 
konvolúció 991 
KONZISZTENS-MEOH? 801 
koordináció 529. 530 
Korlátozott Logikai Absztrakt Gép 
(CLAM) 380 
korlátozott logikai programozás 
358 
korlátozott optirnalitás (KO) 1101, 
1102 
korpusz 951 
kostansszímbőlumok 303 
Kötok-McCarthy sakkprogram 237 
kovarianciamátrix 1111 
Kowalski-forma 360 
kölcsönös kizárás 473 
kölcsönösen hasznosságfüggetlen 
(KHF) 690 
kölcsönösen preferenciálisan füg- 
getlen (KPF) 689 
környezet 66 
determinisztikus 75, 100 
dinamikus 76. 1024 
diszkrét 76. 99 
egyágenses 77, 410, 529 
együttműködő 529 
epiződszerű 76 
folytonos 76, 1024 
generátor 78 


hozzáférhető 75 

kooperatív 77, 209 
megfigyelhető 75, 99 

nem epizódszerű 75 
nemdeterminisztikus 75 
osztály 78 

részlegesen megfigyelhető 707, 
711, 720, 735, 740, 747, 1024 
sorozatszerű 76 

statikus 76, 99, 530 
szemidinamikus 76 
sztochasztikus 45. 1024 
teljesen megfigyelhető 708, 
720, 747, 837, 874 
többágenses 77, 209 
versengő 77, 529 


verseny 209 
környezetfüggetken nyelvtan (CFG) 
943,951 
környezeti történet 708 
körülírás 429 

prioritásos 430 
köteg 392 
kötöszők 911 
követés 1030 
következmény 

belső 503 

diszjunktív 512. 540 

elsődleges 502 

feltételes 512 

külső 501 

másodlagos 502 
következő 385 
KÖVETKEZTET 372 
következtetés 

alapértelmezéseken alapuló 611 

"automatizált 33 

célvezérelt 235 

helyes 345 

inverz kapcsolatok 421 

szabályalapú 612 

szimbolikus valószínűségi 618 

teljes 345 
következtetési keretprobléma 400 
következtetési szabály 265 

egzisztenciális bevezetés 382 

egzisztenciális példányosítás 

334 

univerzális példányosítás 334 
követő állapot axióma 400 
közbülső forma 929 
Kközlegelő tragédiája 737 
közömbösségi elv, Laplace-féle 556 


TÁRGYMUTATÓ 


közös szándék 533 
központi határeloszlás tétel 1111 
köztes nyelv 971 
KPF fásd kölcsönösen preferen- 
ciálisan független 
KPML generáló rendszer 945 
kritikus útvonal 496 
KRK sakkvégjátékra specializált 
gép 236 
KRYPTON 439 
kudarc 111 
kukucskál 762 
kulcs 341 
külsőség 737 
küszöbfüggvény 845 
küszöbpont 765 
kvadratikus dinamikus rendszerek 
177 
kvalifikációs probléma 400, 456, 
509, 1077 
kvalitatív fizika 394, 440 
kvantálási tényező 661 
kvantifikálás 929 
kvantifikáht term 930 
kvantor 306 

egzisztenciális 334 
kvázi-Logikai forma 930 
KVM fásd kiterjesztett véges auto- 
mata 


L 


Lambert koszinusztörvénye 989 
Lamben-féle felület 989 
táncolás 
előrefelé 333. 378 
hátrafelé 333, 350, 379 
láncszabály 582 
látens szemantikai indexelés 978 
láthatósági gráf 1064 
LAWALY 536 
LEANTAP 381 
leértékelési tényező 876 
LEGÁLIS-CSELEKVÉS 130 
leginkább megkötött változó 500 
LEGIOBBAT-ELŐSZÖR-KERESÉS 137 
legkisebb megkötés 464 
legközelebbi-szomszéd 841, 863 
3/egközelebbi-szomszéd 861 
k-egközelebbi szomszéd 843 
legrövidebb leíró hossz 778 
legvalószínűbb magyarázat 632 


TÁRGYMUTATÓ 


légvonalban mért távolság 137 
lehetőségelmélet 621 
lehetőségi axióma 398 
lehetséges világok 437, 607 
lehűtés 158 
leíró logika 419. 423 
konzisztenciavizsgálat 423 
osztályozás 423 
vészvizsgálat 423 
lekérdezés 312, 958 
lekérdező nyelv 958 
lekötési lista 312 
lentről felfelé elemzés 913 
lépésváltás 213 
leszámítolási tényező 712 
LeváGás-Teszr 222 
leválasztás 612 
levélcsomópont 110 
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szabályozás elmélet 177 
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potenciáltér 1044. 1052 
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általánosítási hierarchia 790 
időtlen, örök 397 
kiterjedése 783 
predikátumszimbólumok 304 
preferencia 
függetlenség 689 
monoton 682 
sorrend 548 
stacionárius 711 
szemantika 945 
tranzitív 679 
prefix 315 


prior 

egyenletes 822 

hipotézis 819 

konjugált 828 
PRIOR-MINTA 599, 658 
prioritásos végigsöprés 881 
probléma 100 

$-királynő 104, 155 

adatasszociációs 1033 


ellenfél probléma 123 
elrablásos 1030 

eshetőségi 123, 126 
felfedezési 124, 166 
inkrementális megfogalmazása 
105 


TÁRGYMUTATÓ 


interneten keresés 107 
játékprobléma 102 
kommutatív 187 
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1. BEVEZETÉS 


Amelyben megkíséreljük megmagyarázni, hogy miért tartjuk a mesterséges intelligen- 
ciát olyan területnek, amit igenis érdemes tanulmányozni, és amelyben azt is megkísé- 
reljük eldönteni, hogy vajon mi is ez a terület. 


Az ember Homo sapiensnek — gondolkodó embernek — nevezte el! a saját fajtáját, mert 
mentális képességeink annyira fontosak a számunkra. Évezredek óta próbáljuk meg- 
érteni azt, hogy hogyan gondolkozunk. Azt, hogy az anyag néhány maréknyi mennyi- 
sége hogyan képes a saját magánál sokkal nagyobb és bonyolultabb világot észlelni, 
megérteni, a világ alakulását megjósolni és manipulálni. A mesterséges intetligencia 
(artificial intelligence), röviden MI (AI), még tovább is megy: az intelligens entitások 
megértése mellett ilyen entitások építésével is próbálkozik. 

Az MI az egyik legújabb tudományterület. A munka közvetlenül a második világhá- 
ború befejeztével kezdődött. A mesterséges intelligencia elnevezés 1956-ban született 
meg. A molekuláris biológiával egyetemben az MI az a terület, amiről más tudomány- 
területek kutatói úgy nyilatkoznak, hogy , én legszívesebben ezzel foglalkoznék". Egy 
fizikushallgató teljes joggal gondolhatja, hogy Galilei, Newton, Einstein és mások már 
minden jó ötlettel rég előálltak. Ezzel szemben az MI-ben az Einstein-kaliberű egyéni- 
ségek előtt még szabad az út. 

Az MI jelenleg az általános rendeltetésű területektől, mint az észlelés és a tanulás, 
egészen olyan specifikus feladatokig, mint a gépi sakk, a matematikai tételbizonyítás, 
a gépi költészet vagy az orvosi diagnózis, a legkülönbözőbb részterületek óriási válasz- 
tékát öleli át. Az MI az intellektuális képességeket igénylő feladatokat rendszerezi és 
automatizálja, és így potenciálisan releváns az értelmes emberi cselekvés minden terü- 
letén. Ilyen értelemben az MI igazán univerzális tudomány. 


1.1. MI AZ MI? 


Eddig arról beszéltünk, hogy miért izgalmas az MI, de nem mondtuk meg, hogy mi is 
valójában? Az MI definícióit, nyolc jelenlegi tankönyvet követve, az 1.1. ábra mutatja. 
Ezek a definíciók két dimenzió mentén értelmezhetők. Az ábra felső részében levők a 
gondolati folyamatokat és a következtetést célozzák, míg az alsó részben levők tárgya 
a viselkedés. A bal oldali definíciók a sikert az emberi teljesítményhez mérik, míg a 
jobb oldaliak mércéje az intelligencia egy ideális koncepciója, amit mi racionalitásnak 
(rationality) fogunk nevezni. Egy rendszer racionális, ha tudásához viszonyítva helye- 
sen cselekszik. 
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Emberi módon gondolkodó rendszerek Racionálisan gondolkodó rendszerek 





 zgalmas újszerű kísérlet, hogy a számító- . ] ..A mentális képességek tanulmányozása 
gépet gondolkodásra késztessük.... tudatos — ] számítási modellek segítségével" (Chamiak 
gépek, e fogalom teljes és szó szerinti és McDermott, 1985) 


értelmében (Haugeland; 1985) , Az észlelést, a következtetést és a cselekvést 


, Az emberi gondolkodással asszociálható biztosító számítási mechanizmusok tanulmá- 
olyan aktivitások [automatizálása], mint nyozása" (Winston, 1992) 

pl. a döntéshozatal, a problémamegoldás, 
a tanulás, . .."" (Bellman, 1978) 











Emberi módon cselekvő rendszerek I Racionálisan cselekvő rendszerek 

, Az olyan funkciókat teljesítő gépi rend- , Számítási intelligencia az intelligens ágensek 
szerek létrehozásának a művészete, tervezésének a tanulmányozása" (Poole és tár- 
amelyhez az intelligencia szükséges, sai, 1998) 

ha azt emberek teszik" (Kurzweil, 1990) , Az MI... a műtárgyak intelligens 


1: désével lkozik" (Nilsson, 19987 
s Annak tanulmányozása, hogy hogyan lehet viselkedésével foglalkozik" (Nilsson, 1998) 


a számítógéppel olyan dolgokat művelni, 
amiben pillanatnyilag az emberek a jobbak" 





(Rich és Knight, 1991) 











1.1. ábra. Az MI néhány meghatározása négy kategóriába szervezve 


Az idők folyamán mind a négy irányzat követőre talált. De ahogy ez várható volt, 
feszültség uralkodik az embercentrikus és a racionalitáscentrikus irányzatok között! 
Az embercentrikus irányzat szükségképpen empirikus tudomány, hipotézisekkel és em- 
Pirikus igazolással. 

A racionalitáscentrikus megközelítés a matematikára és a mérnöki tudományokra tá- 
maszkodik. Mindegyik csoport rágalmazta is, de segítette is a többi csoport munkáját. 
Nézzük most a négyféle megközelítést kicsit részletesebben. 


Emberi módon cselekedni: Turing-teszt megközelítés 


A Turing-tesztet (Turing-test) Alan Turing javasolta azzal a céllal, hogy az intelligen- 
ciának egy kielégítő munkadefiníciót adjon (Turing, 1950). Ahelyett hogy az intelli- 
genciára jellemző kvalitások hosszú és feltehetően vitás listáját megadná, Turing egy 
tesztet javasolt, amelynek alapja a vitathatatlanul intelligens entitástól — egy embertől — 
való megkülönböztethetetlensége. A számítógép akkor állja ki a próbát, ha az emberi 


1 Meg kell jegyeznünk, hogy az emberi és a racionális viselkedés megkülönböztetése nem jelenti, hogy az 
emberek szükségszerűen , irracionálisak" emocionálisan instabil", elmebeteg" értelemben. Azonban fel kell 
figyelni arra, hogy nem vagyunk tökéletesek. Nem vagyunk valamennyien sakkmesterek, azok sem. akik a sakk 
minden szabályával tisztában vannak. Sajnálatos módon nem is vizsgázik mindenki jelesre. Az emberi követ. 
keztetést terhelő szisztematikus hibák egy részét Kahneman sorolja fel (Kahmeman és társai, 1982). 
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kérdező néhány írásos kérdés feltevése után nem képes eldönteni, hogy az írásos vála- 
szok egy embertől vagy egy géptől érkeznek-e. A tesztet a 26. fejezet tárgyalja rész- 
letesen, ahol azzal is foglalkozunk, hogy intelligensnek mondható-e a számítógép, ha 
teljesíti a tesztet. Jelenleg ígen sok feladatot jelent egy gépet úgy programozni, hogy 
teljesítse a tesztet. A számítógépnek a következő képességekkel kellene rendelkeznie: 


s természetes nyelvfeldolgozás tnatural language processing) a sikeres angol (illetve 
más emberi) nyelvű párbeszédhez; 

.  tudásreprezentáció (knowledge representation) az ismert vagy hallott információ 
tárolására; 

. automatizált következtetés (automated reasoning), hogy a tárolt információt kér- 
dések megválaszolására és új következtetések levonására használjuk; 

. gépi tanulás (machine learning) az új körülményekhez való adaptálódáshoz, a min- 
tázatok detektálására és általánosítására. 


A Turing-teszt a kérdező és a számítógép közötti fizikai kölcsönhatást szándékosan 
kerülte, mert egy személy fizikai szimulációja az intelligenciához nem szükséges. 
Az ún. teljes Turing-teszt (total Turing-test) azonban videojelet is fel kell dolgozzon, 
hogy a kérdező tesztelni tudja az illető érzékelési képességeit, valamint tartalmazza 
annak a lehetőségét is, hogy a kérdező az objektumokat átadhassa . egy nyíláson keresz- 
tül". A teljes Turing-teszt teljesítéséhez a számítógépnek szüksége lesz: 


s gépi látásra (computer vision), az objektumok érzékeléséhez és 
s  robotikára (robotics) az objektumok mozgatásához. 


Ez a hat terület nagyjából lefedi az MI-t. Turing becsületére válik, hogy egy olyan tesz- 
tet talált ki. amely 50 év múltával is releváns maradt. Az MI-n belül a kutatók sok erő- 
feszítést mégsem fejtettek ki a Turing-teszt teljesítése érdekében, abban a hiedelemben, 
hogy a mögötte sorakozó elvek tanulmányozása fontosabb, mint egy példány dupli- 
kálása. A , mesterséges repülés" kutatása akkor járt sikerrel, amikor a Wright testvérek 
abbahagyták a madarak utánzását, és az aerodinamikát kezdték tanulmányozni. A repti- 
léssel foglalkozó könyvek nem azt a célt fogalmazzák meg, hogy olyan , gépeket kel- 
lene építeni, amelyek annyira hasonlóan repülnek a galambokhoz, hogy ezzel akár más 
galambokat is képesek megtéveszteni". 


Emberi módon gondolkodni: a kognitív modellezés 


Ha azt szeretnénk kijelenteni, hogy egy program emberi módon gondolkodik, valami- 
lyen módon meg kellene határoznunk, hogy az emberek hogyan gondolkodnak, Ehhez 
az emberi elme működési mechanizmusának belsejébe kellene tudnunk belenézni. Két 
módja van ennek: önelemzés révén -— az átsuhanó gondolataink megragadásával — vagy 






elméletével, lehetségessé válik az elmélet számítógépes programmal való kifejezése. 
Ha a program bemenetei és kimenetei, valamint időzítése az emberi viselkedéssel meg- 
egyeznek, ez egyben bizonyíték arra, hogy a program bizonyos mechanizmusai feltehetően 
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az emberben is megtalálhatók. Így például Newell és Simon, akik az , általános problé- 
mamegoldót (General Problem Solver, GPS)" (Newell és Simon, 1961) kifejlesztették, 
csupán azzal, hogy a programjuk helyesen oldja meg a problémákat, nem voltak elége- 
dettek. Jobban érdekelte őket, hogy összehasonlítsák a program következtetési lépéseit 
az ugyanazon a feladaton dolgozó emberek lépéseivel. Az MI számítógépes modelljeit 
és a pszichológia kísérleti technikáit a kognitív tudomány (cognitive science) inter- 
diszciplináris területe kapcsolja össze azáltal, hogy kísérletet tesz precíz és verifikálható 
elméletek megfogalmazására az emberi elme működéséről. 

A kognitív tudomány önmagában is vonzó terület, annyira, hogy egy önálló enciklo- 
pédia lérrehozásának ís van értelme (Wilson és Keil, 1999). A könyvünkben meg sem 
kíséreljük leírni, hogy az emberi megismerésből mit tudunk már. Esetenként azonban 
kitérünk az MI-technikák és az emberi gondolkodás közötti hasonlóságokra és kü- 
lönbségekre. Az igazi kognitív tudomány -— szükségszerűen — a valódi emberek, illetve 
állatok kísérleti kutatásán alapul, mi pedig feltételezzük. hogy az olvasó a kísérleteihez 
csupán számítógéppel rendelkezik. 

Az MI-kutatás kezdeti szakaszában a megközelítéseket sokszor össze is keverték. 
Egy szerző állíthatta például, hogy ha egy algoritmus egy feladaton jól vizsgázik, akkor 
jó modellje az emberi képességeknek, és megfordítva. A mai szerzők a kétféle igényt 
elkülönítik. Ez a megkülönböztetés mind az MI, mind a kognitív tudomány gyorsabb 
fejlődését tette lehetővé. Az MI és a kognitív tudomány folyamatosan termékenyítően 
hatnak egymásra, különösképpen a látás és a természetes nyelv vonatkozásában. A látás 
a közelmúltban különösen sokat fejlődött a neurofiziológiai eredményeket és a számítá- 
si modelleket összefogó integrált megközelítés révén. 





Racionálisan gondolkodni: a gondolkodás törvénye 


Arisztotelész görög filozófus volt az elsők egyike, aki megkísérelte a , helyes gondol- 
kodás", azaz a megcáfolhatatlan következtetési folyamatok törvényekbe foglalását. 
Híres szillogisztikája (syllogisms) olyan mintákat szolgáltatott a következtetési sé- 
mákhoz, amelyek helyes premisszákból mindig helyes következményekre vezettek, 
Például , Szókratész egy ember; minden ember halandó; azaz Szókratész halandó." Ezek- 
indították el a logika (logic) tudományának kialakulását. 

A 19. században a logikusok — a logika tudományát művelők - megadták a világ 
mindennemű objektumára és az azok közötti relációkra vonatkozó állításoknak a pre- 
cíz megfogalmazását. (Hasonlítsuk ezt a közönséges aritmetikai jelölésrendszerhez, 
ami főleg a számokon értelmezett egyenlőségek és egyenlőtlenségek kifejezésére alkal- 
mas.) 1965-ben léteztek már olyan programok, amelyek — legalább elvben — képesek 
voltak zetszóleges, logikai jelölésekkel kifejezett problémához megadni a probléma 
megoldását? Az MI-a belül uralkodó logicista (logicist) hagyomány azt reméli, hogy 
ilyen programokra alapozva intelligens rendszereket képes létrehozni. 

Ennek a megközelítésnek két alapvető baja van. Először is a logikai jelölésrendszer 
által igényelt formális elemekkel informális tudást kifejezni nem ilyen egyszerű, 


2 ga nincs megoldás, a program a keresést esetleg soha nem fejezi be. 
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különösen ha a tudás nem 10097-osan biztos. A másik az, hogy nagy a különbség egy 
probléma ,elvi", illetve gyakorlati megoldása között. Már a néhány tíz tényt kitevő 
problémák megoldása is kimerítheti egy tetszőleges számítógépes rendszer számítási 
erőforrásait, hacsak valamilyen módon nincs vezérelve, hogy melyik következtetési 
lépésekkel próbálkozzék először. Annak ellenére, hogy ez a két probléma a számítógé- 
pes következtető rendszer bármilyen elven történő fejlesztésénél felbukkan, először 
a logicista hagyományban jelent meg. 


Racionálisan cselekedni: a racionális ágens 


Egy ágens (agent) nem más. mint valami, ami cselekszik (az ágens szó forrása a latin 
agere — cselekedni). Számítógépes ágensektől azonban elvárjuk, hogy legyenek más 
jellemzői is, amelyekben különböznek a , mezei" programoktól. Ilyen jellemzők például 
az autonóm vezérlés felügyelte cselekvés, a környezet észlelése, a hosszabb idejű tartós 
létezés, a változásokhoz történő adaptáció és mások céljainak az átvétele. Egy racioná- 
lis ágens (rational agent) a legjobb kimenetel érdekében vagy — bizonytalanság jelen- 
létében — a legjobb várható kimenetel érdekében cselekszik. 

A , gondolkodás törvénye" megközelítésben a hangsúly teljes egészében a korrekt 
következtetéseken volt. Korrekt következtetések meghozatala egyes esetekben a racioná- 
lis ágensek részét képezi, hiszen a racionális cselekvés egyik módja, hogy logikusan 
következtetve olyan következményekre jutunk, hogy adott cselekvés a céljaink elérését 
biztosítja. A korrekt következtetés azonban nem egésze a racionalitásnak, mert gyakran 
megesik, hogy akkor is cselekedni kell, amikor bizonyíthatóan korrekt cselekvés nem 
létezik. A racionális cselekvésnek olyan esetei is vannak, amikor következtetésnek nyo- 
ma sincs. Így például a forró kályhától a kezet elrántó reflexszerű cselekvés sikeresebb, 
mint a tudatos megfontolásból adódó lassabb mozdulat. 

A Turing-teszthez szükséges minden képesség lényeges a racionális cselekvés meg- 
valósítása szempontjából. A tudásreprezentálás és a következtetés képessége szükséges 
ahhoz, hogy a helyzetek széles spektrumában helyes döntésre juthassunk. Természetes 
nyelven megfogalmazott érthető szövegek kimondásával egy komplex társadalomban is 
elboldogulunk. Tanulásra nem a műveltség kedvéért van szükség. A világ működéséről 
alkotott jobb elképzelések hatékonyabb stratégiákhoz vezethetnek a környezetünkkel va- 
ló kapcsolat kialakításában. A vizuális érzékelés nem azért szükséges, mert látni szóra- 
koztató dolog. hanem mert így jobb elképzelésünk lesz arról, hogy egy cselekvéssel mit 
érhetünk el. Egy ízletes falat látványa például segít abban, hogy tudatosan érte nyúljunk. 

Emiatt az MI-nek mint racionális ágensek tervezésének a tanulmányozása két előnyt 
jelent. Először is ez a megközelítés a , gondolkodás törvénye" megközelítésnél általá- 
nosabb, hiszen a korrekt következtetés csupán egyike a racionalitást biztosító mechaniz- 
musoknak. Másodszor, tudományosan jobban is kezelhető, mint azok a megközelítések, 
amelyek az emberi viselkedésen vagy emberi gondolkodáson alapulnak, mert a raciona- 
litás mértéke jól definiált és teljesen általános. Az emberi viselkedés viszont egy bizo- 
nyos specifikus környezethez jól adaptálódott, és részben egy olyan bonyolult, zömében 
nem ismert evolúciós folyamat eredménye. amely valószínűleg még messze áll a töké- 
letességtől. Könyvünk tehát a racionális ágensek általános elveire és a létrehozásukhoz 
szükséges komponensekre koncentrálódik. Látni fogjuk, hogy a problémamegfogalmazás 
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látszólagos egyszerűsége ellenére, hihetetlen sok következménnyel kell szembenéznünk, 
ha megkíséreljük a problémát megoldani. Néhány ilyen következményről részletesebben 
a 2. fejezet szól. 

Egy fontos dologról nem szabad elfeledkezni: rövidesen meglátjuk, hogy összetett 
környezetben a tökéletes racionalitást — mindig helyesen cselekedni — lehetetlen elérni. 
A számítási szükségletek egyszerűen túl nagyok. A könyv nagyobb részében azonban 
azzal a munkahipotézissel fogunk élni. hogy a tökéletes döntéshozatal megértése jó 
kiindulópont. A probléma így egyszerűbbé válik, és megfelelő keretet nyújt a terület- 
hez tartozó alapozó anyag többségéhez. A korlátozott racionalitással (limited ration- 
ality) — azaz megfelelően cselekedni, miközben az összes kívánt számítás elvégzésére 
nincs elegendő idő — explicit módon a 6. és a 17. fejezet foglalkozik. 
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Ebben a részben azon tudományterületek rövid történetét mutatjuk be, amelyek ötlete- 
ikkel, nézőpontjukkal. módszereikkel hozzájárultak az MI-hez. Mint minden történet- 
nél, most is csak kevés személyről és eseményről tudunk megemlékezni, másokat. 
akik, illetve amelyek szintén fontosak, figyelmen kívül hagyunk. Az eseményeket egy 
kérdéssorozat körül rendeztük sorba. Ugyanakkor azt a benyomást sem szeretnénk 
kelteni, mintha ezek a kérdések a terület által kizárólagosan vizsgált kérdések lenné- 
nek, vagy, hogy ezek a tudományterületek célkitűzéseikben mind az MI irányába fej- 
lődtek volna. 


Filozófia (i. e. 428-tól napjainkig) 


s Lehet-e formális szabályok révén helyes konklúziókhoz jutni? 
s Hogyan emelkedik ki a mentális elme a fizikai agyból? 

s Honnan jön a tudás? 

s A tudás hogyan vezet a cselekvéshez? 


Arisztotelész (i. e. 384322) volt az első, aki megkísérelte precízen megfogalmazni az 
elme racionális részén uralkodó törvényszerűségeket. A korrekt következtetéseket leíró 
szillogizmusok informális rendszerét fejlesztette ki, ami elvben lehetővé tette a konklú- 
ziók gépies származtatását, ha a kezdeti premisszák egyszer adottak voltak. Sokkal ké- 
sőbb Ramon Lull (élt 1315-ig) javasolta, hogy a hasznos következtetést éppenséggel egy 
gépezetre rá lehetne bízni. Az általa javasolt , fogalmi kerekek" a könyv borítóján látha- 
tók. Thomas Hobbes (1588-1679) felvetette, hogy a következtetés olyan, mint egy nu- 
merikus számítás, vagyis hogy ,csendes gondolatainkban kivonunk és összeadunk". 
Eközben a számítások automatizálása már a legjobb úton haladt. 1500 körül Leonardo 
da Vinci (1452-1519) megtervezett — bár meg nem épített — egy mechanikus kalkulátort. 
A kalkulátor közelmúltbeli rekonstrukciója bebizonyította, hogy a tervezet működőképes 
volt. Az első ismert számítógépet 1623 körül Wilhelm Schickard (1592-1635) német tu- 
dós konsiruálta. bár a Blaise Pascal (1623-1662) által 1642-ben épített Pascaline ismer- 
tebb. Pascal azt írta, hogy ..az aritmetikai gép olyan hatást produkál, ami közelebbinek 
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tűnik a gondolathoz. mint az állatok összes cselekvése". Gottfried Wilhelm Leibniz 
(1646-1716) egy mechanikus berendezést épített, amely nem a számokon, hanem a fo- 
galmakon végzett műveleteket. bár működési köre igen korlátozott volt. 

Most. hogy van már elképzelésünk arról, hogy az elme formális. racionális részét 
milyen elvek alapján lehet leírni, a következő lépésként az elmét fizikai rendszernek 
tekintjük. René Descartes (1596-1650) elemezte először világosan az elme és az anyag 
közötti különbséget és az ebből adódó problémákat. Az elme tiszta fizikai megközelíté- 
sének egyik problémája az. hogy kevés helyet hagy a szabad akarat számára. Ha az el- 
mét csupán fizikai törvények uralják. nincs több szabad akarata mint egy sziklának, 
amely , eldönti", hogy a föld középpontja felé fog esni. Annak ellenére, hogy Descartes 
a következtetés hatalmának szószólója volt. ő volt az is, aki a dualizmust (dualism) ja- 
vasolta. Azt tartotta, hogy az elmének (vagy a léleknek) van olyan része. amely nem 
része a természetnek és nem alanya a fizikai törvényeknek. Ezzel szemben úgy érezte, 
hogy az állatok nélkülözik ezt a dualista természetet, lényegében gépeknek tekinten- 
dők. A dualizmus alternatívája a materializmus (materialism), amely azt tartja, hogy 
éppen az agynak a fizikai törvények szerinti működése valósítja meg az elmét. A szabad 
akarat nem más, mint az a mód, ahogyan a választási lehetőségek észlelése a döntési 
folyamat számára megjelenik. 

Ha az elme a benne levő ismereteken operáló fizikai eszköz, akkor a következő problé- 
ma a tudás forrásának a meghatározása. Francis Bacon (1561-1626) Novum Organumátót? 
induló empiricista (empíricist) mozgalmat John Locke (1632-1704) kijelentése jellemzi: 
Nincs semmi a megértésben, ami előbb ne létezne az érzékszervekben." David Hume 
(1711-1776) A Treatise of Human Nature c. művében (Hume, 1739) javasolja azt a fogal- 
mat, amit ma indukciónak (induction) nevezünk, nevezetesen hogy az általános elveket 
a komponenseik ismétlődő kapcsolataiból emeljük ki. Ludwig Wittgenstein (1889—1951) 
és Bertrand Russell (1872-1970) munkájára alapozva a Rudolf Carnap (1891-1970) vezet- 
te híres Bécsi Kör kialakította a logikai pozitivizmus (logical positivism) doktrínáját. Ez 
a doktrína azt állítja. hogy minden tudást végső soron az érzékszervi bemeneteknek meg- 
felelő megfigyeléses állításokon (observation sentences) alapuló logikai elméletekkel 
meg lehet magyarázni.! Rudolf Carnap és Carl Hempel (1905—1997) igazoló elmélete 
(confirmation theory) megkísérelte megvilágítani, miként gyarapítja a tudást a tapaszta- 
lat. Carnap könyve, a The Logical Structure of the World (Carnap, 1928) a tudás elemi 
tapasztalatból történő kinyerésére egy explicit számítási eljárást definiált. Ez volt talán az 
első olyan elmélet, amely az elmét számítási folyamatként ábrázolta. 

Az elme filozófiai képének utolsó eleme a tudás és a cselekvés kapcsolata. Az MI 
szempontjából ez a kérdés elsődleges fontosságú. mert az intelligencia cselekvést is és 
következtetést is igényel. Továbbá ahhoz, hogy világos legyen előttünk, hogyan kell egy 
olyan ágenst építeni, amelynek cselekvései jogosak vagy racionálisak lesznek, meg kell 
értenünk, hogy hogyan igazolhatók a cselekvések. Arisztotelész a cselekvéseket azért 
tartotta jogosnak, mert a célok és a cselekvések kimenetelei között logikai kapcsolat lel- 
hető fel (az alábbi idézet záró része a könyv borítóján is megtalálható): 


3 Az Arisztotelész-féle Organon, azaz a gondolkodás eszközének egy újabb változata. 
Ebben a megközelítésben, megvizsgálva a szavak értelmét illetve kisérleteket végezve, vagy igazolni, vagy 
cáfolni lehet minden értelmes állítást. Mivel ez - a szándéknak megfelelően - a metafizika többségét kizárja, 
a logikai pozitivizmus bizonyos körökben nem volt népszerű. 
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De hogyan lehetséges, hogy a gondolatot néha követi cselekvés, és néha nem, néha mozgással és né- 
ha anélkül? Úgy tűnik, mintha ugyanaz a dolog történne itt is, mint ami a változatlan objektumokra 
vonatkozó következtetések meghozatalánál. De ebben az esetben az eredmény egy spekulatív állítás 
... holott itt a premisszából következő konklúzió egy cselekvés. ... Kellene egy ruha, a köpeny egy 
ruha. Kell egy köpeny. Ami kell. azt elő kell állítanom, és kell egy köpeny. Elő kell állítanom egy 
köpenyt. A konklúzió tehát, hogy .elő kell állítanom egy köpenyt" nem más, mint egy cselekvés. 
(Nussbaum, 1978, 40. 0.) 


A Nicomachean Erhicsben (III. könyv, 3. 11125) Arisztotelész a témát tovább folytatja, 
egy algoritmust javasolva: 





Nem a célokat, hanem az eszközöket mérlegeljük. Az orvos nem azt fontolgatja. hogy gyógyítson-e, 
a szónok sem, hogy meggyőzzön-e, az államférfi sem azon hezitál, hogy jogot és törvényt teremtsen, 
és senki sem a célt mérlegeli. Mindenki feltételezi a célt, és azt fomolgatja, hogy az hogyan. milyen 
eszközökkel érhető el, és hogy azáltal könnyen és a lehető legjobban érhető-e el. És ha valamilyen 
eszközzel elérhető a cél, azt fontolgatjuk, hogy azzal az eszközzel hogyan. milyen módon érhetjük el, 
amíg a legelső okhoz el nem jutunk. Ez az ok a felfedezés sorában a legutolsó... és ami az elemzés 
rendjében az utolsó, a megtörténés rendjében elsőnek tűnik. És ha lehetetlenséghez jutunk, a keresést 
feladjuk, például ha pénzre van szükségünk. azt viszont megszerezni nem lehet. Ha azonban valami 
lehetségesnek tűnik, akkor megpróbálkozunk vele. 


Arisztotelész megközelítését 2300 évvel később Newell és Simon a GPS-programjuk- 
ban implementálták. Ma ezt regressziós tervkészítő rendszernek neveznénk (lásd 11. 
fejezet). 

A célalapú analízis hasznos, de nem segít akkor, amikor a célt több cselekvéssel is 
el lehet érni, vagy pedig, ha annak eléréséhez egy cselekvés sem elegendő. Antoine 
Arnauld (1612-1694) helyesen adta meg azt a kvantitatív formulát, hogy ilyen ese- 
tekben milyen cselekvéshez kellene folyamodni (lásd 16. fejezet). John Stuart Mill 
(1806-1873) Utilitarianism c. művében (Mill, 1863) a racionális döntés kritériumának 
a gondolatát az emberi cselekvés minden aspektusára kiterjesztette. A döntéshozatal 
egy jobban formalizált elméletéről a következő részben lesz szó. 


Matematika (kb. 800-tól napjainkig) 


s Melyek az érvényes következtetések formális szabályai? 

§ Mi az, ami kiszámítható? 

. Hogyan vagyunk képesek a bizonytalan információ alapján következtetéseket le- 
vonni? 


A filozófusok számba vették az MI fontosabb ötleteit, de ahhoz, hogy a formális tudo- 
mányra rátérhessünk, szükséges volt legalább három alapvető területnek — a logikának, 
a számítástechnikának és a valószínűségnek — bizonyos szintű matematikai formali- 
zálása. 

A formális logika elképzelése egészen az ókori Görögország filozófusaihoz nyúlik 
vissza (lásd 7. fejezet), de a matematikai kialakulása George Boole (1815-1864) mun- 
kásságával kezdődött igazán, aki részleteiben kidolgozta az ítélet- vagy Boole-logikát 
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(Boole, 1847). 1879-ben Gottlob Frege (1848-1925) kiterjesztette a Boole-logikát, hogy 
az objektumokat és relációkat is tartalmazhasson. Ezzel megalkotta azt az elsőrendű 1o- 
gikát, amely lényegében manapság a legalapvetőbb tudásreprezentációs rendszer. 
Alfred Tarski (1902—1983) egy referenciaelméletet vezetett be, amely azt mutatja meg, 
hogy hogyan rendelhetők össze a logika és a valós világ objektumai. A következő lépés 
annak a kiderítése volt, hogy hol vannak a logikának és a számításoknak az alkalmazási 
határai. 

Az első nem triviális algoritmusnak (algorithm) a legnagyobb közös osztót kiszámí- 
tó euklideszi algoritmust tekintik. Az algoritmusok önmagában való tanulmányozása al- 
Hvárizmi, a 9. századi perzsa matematikus idejéig nyúlik vissza, akinek a művei az arab 
számokkal és az algebrával is megismertették Európát. Boole és mások a logikai de- 
dukció algoritmusaival foglalkoztak, a 19. század végén pedig már erőfeszítések tör- 
téntek az általános matematikai érvelés logikai dedukcióként való formalizálására. 
1900-ban David Hilbert (1862-1943) 23 problémából álló listát publikált, amelyről — 
helyesen — azt vélte, hogy matematikus társait a század nagy részében le fogja kötni. 
Utolsó problémája azt firtatta, vajon létezik-e a természetes számokra vonatkozó tetsző- 
leges logikai állítás igazságát eldöntő algoritmus. Ez a híres ún. Entscheidungsproblem 
(eldönthetőségi probléma). Hilbert lényegében azt a kérdést tette fel, hogy a hatékony 
bizonyítási eljárásoknak vannak-e elvi korlátjai. Kurt Gödel (1906-1978) 1930-ban 
megmutatta, hogy a Frege és Russell-féle elsőrendű logikában létezik hatékony eljárás 
tetszőleges igaz állítás bizonyítására. Az elsőrendű logika azonban nem elegendő a ma- 
tematikai indukció kifejezéséhez, ez utóbbi viszont a természetes számok jellemzésé- 
hez szükséges. 1931-ben Gödel meg is mutatta, hogy valóban léteznek elvi korlátok. 
Nemteljességi tétele (incompleteness theorem) kimutatja, hogy minden, a természe- 
tes számok tulajdonságait kifejezni képes nyelvben léteznek igaz, de abban az értelem- 
ben eldönthetetlen állítások, hogy az igazságuk algoritmikusan nem mutatható ki. 

Ez az alapvető eredmény úgy is interpretálható, hogy léteznek az egész számokon 
értelmezhető olyan függvények, amelyek algoritmikusan nem írhatók le, magyarán 
nem számíthatók ki. Ez motiválta Alan Turingot (1912-1954), hogy megkísérelje a 
kiszámítható függvények pontos jellemzését. Ez a megfogalmazás kissé problematikus, 
mert egy számítási procedúrának vagy egy hatékony eljárásnak a formális definícióját 
valójában lehetetlen megadni. Általánosan elfogadott azonban, hogy a Church-Turing- 
tézis, amely azt állítja, hogy a Turing-automata (Turing, 1936) képes minden kiszámít- 
ható függvényt kiszámítani, elegendő definíciót szolgáltat. Turing azt is kimutatta, hogy 
vannak olyan függvények, amelyeket semmilyen Turing-automata nem képes kiszámí- 
tani. Így például nincs olyan automata, amely általánosságban el tudná dönteni, hogy 
egy adott program egy adott bemenetre választ fog-e adni, vagy pedig örökké futni fog. 

Ámbár az eldönthetetlenség és a kiszámíthatóság fontos fogalmak a számítások meg- 
értéséhez, a kezelhetetlenségnek (intractability) sokkal nagyobb hatása volt. Durván 
fogalmazva a problémák egy osztályát kezelhetetlennek mondjuk, ha az egyes problé- 
mapéldányok megoldásához szükséges idő legalább exponenciálisan nő a probléma- 
példányok nagyságától függően. A bonyolultság polinomiális és exponenciális növe- 
kedése közötti különbségre először az 1960-as évek közepén hívták fel a figyelmet 


5 Az elsőrendű logika Frege javasolta felírása soha nem terjedt el. A nyilvánvaló okát könnyen megértjük, 
ha a borítón lévő példára pillantunk. 
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(Cobham, 1964; Edmonds, 1965). A kétfajta növekedés közötti különbség fontos, mert 
az exponenciális növekedés következménye, hogy közepes nagyságú problémapéldányo- 
kat sem lehet értelmes időkorláton belül megoldani. Az intelligens viselkedés generálásá- 
nak általános problémáját tehát inkább kezelhető, mint kezelhetetlen részproblémákra 
kellene lebontanunk. 

Hogyan lehet egy kezelhetetlen problémát felismerni? A Stephen Cook és Richard 
Karp által útjára indított NP-teljesség (NP-completness) elmélete megadja rá a vá- 
laszt (Cook, 1971: Karp. 1972). Cook és Karp a kanonikus kombinatorikus keresési és 
következtetési problémák nagy osztályára belátta, hogy azok NP-teljesek. Bármilyen 
problémaosztály, amire egy NP-teljes problémaosztály visszavezethető, minden bí- 
zonnyal kezelhetetlen lesz (és bár még senkinek sem sikerült bebizonyítani, hogy az 
NP-teljes problémák szükségszerűen nem kezelhetők, kevés tudós van más vélemé- 
nyen). Ezek az eredmények élesen elütnek a számítógép megjelenését kísérő , elektro- 
nikus szuperagy — Einsteinnél gyorsabb" lelkesedéstől. Az egyre növekvő számítási 
sebesség ellenére az intelligens rendszerekre mindig jellemző lesz az erőforrások óva- 
tos és kényes használata. Durván fogalmazva, a világ egy rendkívül nagy probléma- 
példány! Az utóbbi években az MI segített megérteni, hogy az NP-teljes problémák 
egyes példányai miért nehezek, holott mások könnyűnek bizonyulnak (Cheeseman és 
társai, 1991). 

A logikán és a számításokon túlmenően a matematika harmadik nagy hozzájárulása 
az MI-hez a valószínűség-elmélet (probability). A valószínűség gondolatát — a sze- 
rencsejátékok lehetséges kimeneteleivel leírva — először az itáliai Girolamo Cardano 
(1501-1576) fogalmazta meg. A valószínűség hamarosan felbecsülhetetlen kompo- 
nense lett az összes kvantitatív elméletnek, segítséget adva a bizonytalan mérések és 
hiányos elméletek kezeléséhez. Pierre Fermat (1601-1665), Blaise Pascal (1623-1662), 
James Bernoulli (1654-1705), Pierre Laplace (1749-1827) és mások az elméletet tovább 
fejlesztették, és új statisztikai módszereket vezettek be. A valószínűségek felfrissítési sza- 
bályát — új tények hatására — Thomas Bayes (1702-1761) javasolta. A Bayes-szabály és 
az azon alapuló Bayes-analízis az MI-rendszerekben alkalmazott bizonytalan következ- 
tetés korszerű megközelítésének az alapja. 


Gazdaságtan (1776-tól napjainkig) 


s Hogyan kell döntenünk, hogy a hasznunk maximális legyen? 
" Mit kell tennünk, ha mások esetleg nem segítőkészek? 
" Hogyan kell döntenünk, ha a haszonhoz csak a távoli jövőben jutunk el? 


A közgazdaságtan tudománya 1776-ban kapott indító lökést. amikor is Adam Smith 
skót filozófus (1723-1790) megjelentette az An Inguiry into the Nature and Causes of 
the Wealth of Nations c. művét. Amíg az ókori görögök és mások a közgazdasági gon- 
dolkodáshoz járultak hozzá, addig Smith volt az első, aki a gazdaságtant tudományként 
kezelte, a gazdaságokat a saját gazdasági jólétet maximálizáló különálló ágensekből 
állóknak képzelve. Az emberek többsége azt véli, hogy a gazdaság lényege a pénz. A köz- 
gazdák azonban azt fogják állítani, hogy ők igazából azt tanulmányozzák, hogy az emberek 
hogyan döntenek, hogy kívánatos eredményekhez jussanak. A , kívánatos eredmények", 
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avagy a hasznosság (utility) matematikai kezelését elsőként Léon Walras (1834—1910) 
formalizálta. Ezt fejlesztette tovább Frank Ramsey (Ramsey, 1931) és később a 7he 
Theory of Games and Economic Behavior c. művében Neumann János és Oskar Mor- 
genstern (Neumann és Morgenstern, 1944). 

A döntéselmélet (decision theory), amely a valószínűség-elméletet és a hasznos- 
sági elméletet kapcsolja össze, a bizonytalanság melletti (gazdasági vagy egyéb) dön- 
téshozatalhoz ad formális és teljes keretet — azaz azokban az esetekben, amikor a 
valószínűségi leírás megfelelően írja le a döntéshozó környezetét. Ez a megközelítés 
a , nagy" gazdaságokhoz jó, ahol az ágenseknek nem kell más ágensek (mint entitások) 
cselekvéseit figyelembe venni. , Kis" gazdaságokban a helyzet inkább egy játékra 
(game) hasonlít: az egyik játékos cselekvései lényeges befolyással lehetnek a másik já- 
tékos hasznosságára (akár pozitív, akár negatív értelemben). A Neumann és Morgen- 
stern által kifejlesztett játékelmélet (game theory) (lásd még Luce és Raiffa. 1957) 
olyan meglepő eredményeket is tartalmaz, miszerint az egyes játékokban a racionális 
ágensnek véletlenszerűen kell cselekednie, vagy legalábbis olyan módon, hogy az az 
ellenfelek számára véletlennek tűnjön. 

Harmadik kérdésünkkel, vagyis, hogy hogyan kell racionálisan dönteni, ha a haszon 
nem azonnali, hanem több egymást követő cselekvés sorozatának az eredménye, 
a közgazdászok többsége nem foglalkozott. Ezt a feladatot az operációkutatás (opera- 
tional research) területén vizsgálták, mely Angliában látott napvilágot, amikor a II. vi- 
lágháborúban a radartelepítést igyekezték optimalizálni, és amely később a komplex 
menedzsment döntéshozatal területén talált polgári alkalmazásokra. Richard Bellman 
(Bellman, 1957) a Markov döntési folyamatoknak (Markov decision processes) ne- 
vezett szekvenciális döntési problémákat formalizálta. Mi ezeket a 17. és 21. fejezetben 
tanulmányozzuk. 

A közgazdaságtan és az operációkutatás nagyban hozzájárult a racionális ágens fel- 
fogásunkhoz. mégis az MI-kutatás évekig egészen más pályán haladt. Az egyik ok 
a racionális döntéshozatal látszólag igen nagy komplexitása (complexity) volt. Herbert 
Simon (1916-2001). az MI-kutatás egyik úttörője azzal nyerte meg 1978-ban a közgaz- 
dasági Nobel-díjat, hogy egy korai munkájában kimutatta, a kielégítő döntéshozatalon 
(satisfying), azaz az , elegendően jó" döntéseken alapuló modellek a tényleges emberi 
viselkedés jobb leírói. mint azok, amelyek hosszadalmas számításokkal meghatározott 
optimális döntések eredményeképp születtek (Simon, 1947). Az 1990-es években az 
ágensrendszerek területén a döntéselméleti technikák iránt fokozott érdeklődés mutat- 
kozott (Wellman. 1995). 


Neurális tudományok (1861-től napjainkig) 
s Hogyan dolgozza fel az információt az agy? 


A neurális tudományok (neuroscience) az idegrendszert, de különösen az agyat ta- 
nulmányozzák. Annak egzakt módja. hogy hogyan keletkeznek a gondolatok az agy- 
ban, a tudomány egyik nagy feladványa. Évezredek óta tudjuk. hogy az agy valahogy 
részese a gondolatnak. hiszen egy erős fejbeütés a mentális funkciók károsodásához 
vezethet. Hosszú ideje azt is tudjuk, hogy az emberi agy valahogy más. I. e. 335-ben 
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12. ábra. Az idegsejt vagy neuron részei. Minden neuron sejttestből vagy szómából áll, amely sejt- 
magot tartalmaz. A sejttestből ágazik el néhány dendritnek nevezett és egy hosszú, axonnak nevezett 
szál. Az axon jó messzire elér, sokkal messzebbre, mint ahogy ezt a jelen ábra sugallja, Az axonok tipi- 
kusan ( cm hosszúak (ez a sejttest átmérőjének 100-szorosa), de elérhetik az 1 m-t is. Egy neuron 
10-100 000 más neuronnal tart kapcsolatot a szinapszisoknak nevezett csatlakozásokon keresztül. A je- 
leket neuronról neuronra egy összetett elektrokémiai reakció továbbítja, A jelek rövid távon szabályozzák 
az agy aktivitását, hosszú távon pedig befolyásolják a neuronok helyzetét és a kapcsolódási rendszerüket. 
Úgy tanják, e mechanizmusok képezik az agyi tanulás alapját, Az információfeldolgozás zöme az agyké- 
regben történik. ami az agy külső rétege. A feldolgozás szervezeti egysége, úgy tűnik, egy kb. 0,5 mm-es 
átmérőjű szövetoszlop, amelynek magassága az egész kéregre kiterjed, ez az embereknél kb. 4 mm. Egy 
oszlop kb. 20 000 neuront tartalmaz. 


Arisztotelész azt írta, hogy , az összes állat közül méretéhez képest az ember agya a leg- 
nagyobb". Ennek ellenére csak a 18. század közepétől ismerték fel széles körben, hogy 
a tudat az agyban lakozik. Korábbi jelöltek között szerepelt a szív, a lép és a toboz- 
mirigy. 

Paul Broca (1824-1880) afázia (beszédzavar) kutatása agysérült pácienseknél 1861-ben 
lökést adott e területnek, és meggyőzte az orvosi szakmát, hogy az agynak léteznek loka- 
Jízált, konkrét kognitív funkciókért felelős részei. Konkrétan azt mutatta ki, hogy a beszéd 
előállítása a bal félteke, most Broca-féle területnek nevezett részére korlátozódik." Ekkor 
tudták már, hogy az agy idegsejtekből — neuronokból (neuron) — áll, de 1873-ig, amikor 
Camillo Golgi (1843-1926) kifejlesztett egy festési módszert, nem tudták az agyban az 
egyedi neuronokat megfigyelni (lásd 1.2. ábra). Ezt a módszert alkalmazta Santiago 
Ramon y Cajal (1852-1934) az agy neurális struktúráit feltáró úttörő munkájában.§ 


§ Azóta sikerült felfedezni. hogy az egyes delfin- és cetfajtáknál az agy relatív nagysága még nagyobb. Most 
úgy tartják. hogy az emberi agy tekintélyes nagyságát hűtőrendszerének fejlettsége teszi lehetővé. 
Sokan Alexander Hoodot (Hood. 1824) idézik, mint lehetséges elsődleges forrást, 
Golgi kitartott abban a hiedelmében. hogy az agyi funkciók egy folytonos közegben valósulnak meg. amibe a 
neuronok be vannak ágyazva. Ezzel ellentétben Cajal a , neurondoktrinát" képviselte. 1906-ban mindketten (meg- 
osztott) Nobel-díjban részsültek, de a díj átvételekor meglehetősen ellenséges hangnemű beszédeket tartottak. 
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Ma már vannak adataink arról, hogy az agy egyes területei és az általuk kontrollált, 
vagy a szenzorikus bemeneteket generáló test részei között milyen leképezések vannak. 
Az ilyen leképezések hetek alatt képesek drasztikus változásokra, ráadásul egyes álla- 
toknál úgy tűnik, többszörös leképezéseket találhatunk. Azt azonban még nem teljesen 
értjük. hogy az egyes területek miként veszik át más részek funkcióit, ha azok megsé- 
rülnek. Az egyedi emlékek tárolásáról kis híján semmilyen elméletünk nincs. 

Az ép agy aktivitásának mérése 1929-ben kezdődött, amikor Hans Berger kidolgoz- 
ta az elektroencefalográfia (EEG) elvét. A funkcionális mágneses rezonancia (fÍMRD) 
közelmúltbeli kifejlesztése (Ogawa és társai, 1990) eddig nem látott részletességgel tár- 
ja az idegsejtkutatók elé az agy aktivitását, olyan méréséket is lehetővé téve, amelyek 
érdekes módon korrelálnak a zajló kognitív folyamatokkal. Az ismereteket kiegészíti az 
egyedi sejt szintjén történő neuronaktivitás rögzítésének fejlődése. A nagymértékű fej- 
lődés ellenére még messze vagyunk attól, hogy megértsük, hogy e kognitív folyamatok 
bármelyike valójában hogyan ís működik. 



















Számítógep Emberi agy 
Számítási egységek 1 CPU. 10? kapu 10" neuron 
Tárolóegységek 10" bit RAM 10" neuron 

10" bit diszk 10" szinapszis 
Ciklusidő 107 mp 109 mp 
Sávszélesség 10" bitzmp 10" bit/mp 
Memóriamódosítások száma 
másodpercenként 109 10 














1.3. ábra. A számítógépek számítási erőforrásainak (2003 körül) és az agy erőforrásainak durva össze- 
hasonlítása. A könyv első kiadása óta a számítógépekre jellemző számok legalább egy 10-es szorzóval 
megnőttek, és várható, hogy ez a növekedés ebben az évtizedben is folytatódik. Az agyra jellemző szá- 
mok az utóbbi 10 000 évben nem változtak. 


Az igazán csodálatos észrevétel az, hogy egyszerű sejtek gyűjteménye elvezethet a 
gondolathoz, a cselekvéshez és a tudathoz, vagy más szavakkal: az agytól eljutunk az 
elméhez (Searle, 1992). Az egyedüli elvi alternatíva a miszticizmus: hogy létezik egy 
misztikus világ, ahol megvalósul az elme a fizikai tudományok hatáskörén túl. 

Az agy és a számítógép igen eltérő feladatokat végeznek és eltérő tulajdonságokkal 
rendelkeznek. Az 1.3. ábra azt mutatja, hogy az emberi agyban tipikusan 1000-szer 
több neuron van, mint ahány kapu található egy korszerű számítógép processzorában. 
A Moore-törvény? alapján meg lehet jósolni, hogy egy processzorban lévő logikai 
kapuk száma az agyi neuronok számát 2020 körül éri el. Az ilyen jóslatokból persze 
vajmi kevés következtetésre lehet jutni. Ráadásul a tárolókapacitásbeli különbség ele- 
nyésző a kapcsolási sebességben és a párhuzamosságban mutatkozó különbségekhez 
képest. Egy számítógépes chip nanomásodpercek alatt hajt végre egy utasítást, a neu- 
ronok ennél milliószor lassabbak. Az agy ennél többet is kompenzál. Minden neuron és 
szinapszis egyidejűleg aktív, holott a legkorszerűbb számítógépeknek is csak egy vagy 





9 A Moore-törvény azt állítja, hogy az egy négyzetcentméterre eső tranzisztorok száma minden 1-1.5 évben 
megduplázódik. Az emberi agy kapacitása durván 2-4 millió évenként duplázódik. 
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legfeljebb néhány processzora van. Így annak ellenére, hogy a számítógép a nvers kap- 
csolási sebességben milliószor gyorsabb, az agy végeredményben százezerszer gyor- 
sabban oldja meg a feladatait. 


Pszichológia (1879-től napjainkig) 
s. Hogyan gondolkoznak és cselekszenek az emberek és az állatok? 


Azt mondhatjuk. hogy a tudományos pszichológia Hermann von Helmholtz német fizi- 
kus (1821-1894) és tanítványa. Wilhelm Wundt (1832-1920) munkásságával kezdődött. 
Helmholtz tudományos módszereket alkalmazott az emberi látás tanulmányozásánál, és 
a Handbook of Physiological Optics c. művét még ma is úgy tekintik. mint ..az emberi 
inak és fiziológiának máig egyedüli legfontosabb tanulmányát" (Nalwa. 
1993, 15. 0.). Wundt 1879-ben a Lipcsei Egyetemen nyitotta meg a kísérleti pszicholó- 
gia első laboratóriumát. Wundt ragaszkodott azon kísérletek szigorú ellenőrzéséhez, 
amelyekben munkatársai érzékelési. illetve asszociációs feladatokat végeztek, hogy köz- 
ben a kísérletet végzők gondolkodási folyamatait is meg lehessen figyelni, A gondos 
felügyelet révén a pszichológia inkább tudománnyá vált, de az adatok szubjektív volta 
miatt valószínűtlen volt, hogy egy kísérletező képes legyen valaha is a saját elméleteit 
megcáfolni. Ezzel szemben az állati viselkedést tanulmányozó biológusok nem önma- 
gukra vonatkozó adatokkal dolgoztak, és egy objektív módszertant dolgoztak ki, amit 
H. S. Jenkins (Jenkins, 1906) a Behavior of Lower Organisms c. nagy hatású műve mu- 
tat be. Ezt a nézőpontot az emberekre kivetítve a John Watson (1878-1958) vezette 
behaviorista mozgalom (behaviorism) a mentális folyamatok minden elméletét eluta- 
sította, azzal érvelve, hogy önelemzésből lehetetlen megbízható bizonyítékot szerezni. 
A behavioristák ragaszkodtak ahhoz. hogy az állatot érő érzést (vagy ingert) és az ered- 
ményül kapott cselekvést (másképpen választ) szigorúan objektív mércék szerint tanul- 
mányozzuk. Olyan gondolati konstrukciókat, mint a tudást, a hiedelmeket. a célokat és 
a következtetés lépéseit elutasították, áltudományos, , népi pszichológiának" tartva azo- 
kat. A behaviorizmus eredményesnek bizonyult a patkányoknál és a galamboknál. de 
az emberek megértésében kevésbé volt sikeres. A pszichológiára azonban — különös- 
képpen 1920 és 1960 között az Egyesült Államokban — erős hatást gyakorolt. 

Az a kognitív pszichológiát (cognitive psychology) jellemző alapvető nézet. mi- 
szerint az agy egy informáciőfeldolgozó eszköz, egészen William James (1842-1910)!0 
munkáihoz vezethető vissza. Helmholtz is ragaszkodott ahhoz az elképzeléshez. hogy 
az érzékelésben egy tudat alatti logikai következtetésnek is van szerepe. A kognitív ál- 
láspontot az Egyesült Államokban háttérbe szorította a behaviorizmus, de a Frederic 
Bartlett (1886-1969) vezette Cambridge-i Alkalmazott Pszichológiai Intézetben 
(Cambridge"s Applied Psychology Unit) a kognitív modellezés virágozhatott tovább. 
Kenneth Craiknek, aki Bartlett hallgatója, majd utódja volt, a The Nature of Explanation 
c. műve (Craik, 1943) határozottan visszaállította az olyan , mentális" fogalmak legiti- 
mációját, mint a hiedelmek és a célok. azzal érvelve, hogy ezek ugyanúgy tudományos 





10 yitliam James Henry Jarnes író testvére volt. Azt mondják, hogy Henry úgy írt irodalmat, mintha pszicho- 
lógia lenne, William viszont a pszichológiát írta úgy, mintha irodalom lenne. 
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fogalmak, mint a nyomás vagy a hőmérséklet, amikor gázokról beszélünk. miközben 
tudjuk, hogy a gázok molekulákból állnak. és azoknak sem nyomásuk, sem hőmérsék- 
letük nincs. Craik megfogalmazta a tudásalapú ágens működésének három kulcsfon- 
lépését: (1) az ingert egy belső reprezentációra le kell fordítani, (2) e reprezen- 
tációt kognitív folyamatok manipulálják. és új belső reprezentációkat származtatnak 
belőle, amelyek (3) ismét cselekvésre fordítódnak vissza. Craik világosan megmagya- 
rázta, hogy ez a megközelítés miért jó elgondolása egy ágensnek: 





Abban az esetben. ha egy szervezet magában hordja a külső valóság és a saját lehetséges cselek- 
véseinek .kisméretű modelljet". képes különféle alternatívákat kipróbálni. a számára legjobb 
mellett dönteni, a jövőbeli helyzetekre azok bekövetkezése előtt reagálni. a múltbeli események 
ismeretét a jelen és a jövő kezelésében felhasználni. és a felmerülő szükséghelyzetekre minden 
vonatkozásban kimerítőbb. biztonságosabb és kompetensebb módon reagálni. (Craik, 1943) 











Miután Craik 1945-ben egy biciklibalesetben meghalt, munkáját Donald Broadbent 
folytatta. Műve, a Perception and Communication (Broadbent. 1958) a pszichológiai je- 
lenségek néhány első információfeldolgozó modelljét írja le. Közben. az Egyesült Álla- 
mokban, a számítógépes modellezés fejlődése elvezetett a kognitív tudomány (cognitive 
science) kialakulásához. Ez a terület mondhatni egy tudományos találkozóval indult 1956 
szeptemberében az MIT-n. (Látni fogjuk, hogy ez éppen két hónappal később követte azt 
a konferenciát, ahol az MI ,.megszületett".) A találkozón George Miller a The Magic 
Number Seven, Noam Chomsky a Three Models of Language. Allen Newell és Herbert 
Simon pedig a The Logic Theory Machine c. előadásokat tartották. Ez a három befolyásos 
előadás azt mutatta, hogy a számítógépes modelleket hogyan lehet bevetni a memória, 
a nyelv és a logikai gondolkodás pszichológiájába. Manapság a pszichológusok közt tel- 
jesen elfogadott, hogy , a kognitív elméletnek olyannak kell lennie, mint egy számítógépes 
programnak" (Anderson, 1980). Ezen azt értik, hogy az elméletnek egy kognitív funkció 
megvalósításához az információfeldolgozó mechanizmust részletesen le kell írnia, 


Számítógépes tudományok (1940-től napjainkig) 
s Hogyan lehet hatékony számítógépet építeni? 


A mesterséges intelligencia sikeréhez két dolog szükséges: intelligencia és valamilyen 
mesterségesen létrehozott termék, ..műtermék". A választott műtermék a számítógép 
lett. A korszerű digitális számítógépet, majdnem egy időben és egymástól függetlenül, 
három, a II. világháborúban harcoló országban találták fel. Az első működőképes számí- 
tógép az elektromechanikus Heath Robinson! volt. amit Alan Turing munkacsoportja 
1940-ben épített azzal a kizárólagos céllal. hogy a német üzeneteket dekódolhassák. 
1943-ban ugyanez a csoport fejlesztette ki a Colossust, egy elektroncsöves, nagy tel- 
jesítményű, általános célú gépet.!? Az első működőképes programozható számítógép 


Ú Heath Robinson karikatúrarajzoló volt, aki a mindennapi feladatokhoz. mint például a vajaskenyér-kenéshez, 
kitalált szeszélyes és abszurd módon bonyolult szerkezeteiről volt híres. 

"A háború után Turing szerette volna ezeket a számítógépeket az MI-kutatáshoz — például az egyik legelső 
sakkprogramhoz (Turing és társai. 1953) — felhasználni. Erőfeszítéseinek azonban a brit kormány vetett gátat. 
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a Z-3, a német Konrad Zuse 1941-ből származó találmánya volt. A lebegőpontos 
számokat is Zuse találta ki, és ő volt az. aki az első magas szintű programozási nyelvet, 
a Plankalkült kifejlesztette. Az Egyesült Államokban az első elektronikus számítógépet, 
az ABC-t, John Atanasoff és végzős hallgatója, Clifford Berry állították össze 1940 és 
1942 között az Iowai Állami Egyetemen. Munkájukat nemigen támogatták, elismerést 
sem kaptak érte. A mai számítógép előfutárai közül a legnagyobb hatású gép az ENIAC 
volt, amelyet egy titkos katonai projekt részeként John Mauchly és John Eckert rész- 
vételével a Pennsylvaniai Egyetem egy csoportja fejlesztett ki. 

Az azóta eltelt fél évszázad során a számítógéphardver minden újabb generációja 
sebességben és kapacitásban növekedést, árban esést hozott. A teljesítőképesség mint- 
egy 18 havonta megduplázódik, és ez így mehet még egy vagy két évtizedig. Utána 
molukuláris gépekre vagy valamilyen más technológiára lesz szükségünk. 

Természetesen voltak számítóberendezések az elektronikus számítógépek előtt is. 
A 17. századból származó legkorábbi automatizált gépekről már a filozófiánál volt szó. 
Az első programozható gép Joseph Marie Jacguard 1805-ben feltalált szövőszéke volt, 
amely lyukasztott kártyákon tárolta a szövőmintához szükséges utasításokat. A 19. szá- 
zad közepe táján Charles Babbage (1792-1871) két gépet tervezett, de egyiket sem fejez- 
te be. A könyvünk borítóján is látható Difference Engine rendeltetése matematikai táblá- 
zatok számítása lett volna mérnöki és tudományos feladatokhoz. Végül is ezt a gépet 
1991-ben megépítették, és a londoni Science Museumban működés közben bemutatták 
(Swade, 1993). A Babbage-féle Analitikus Gép (Analytical Engine) sokkal ambiciózu- 
sabb terv volt. Címezhető memóriájával, tárolt programjával és feltételes ugrásaival ez 
volt az első, univerzális számításokra alkalmas műtermék. Ada Lovelace, Babbage kollé- 
ganője, Lord Byron költő lánya volt talán a világ első programozója. (Az Ada programo- 
zási nyelv róla kapta a nevét.) Ada programokat írt a befejezetlen Analitikus Gépre. sőt 
azon is spekulált, hogy a gép sakkjátékra vagy zenekomponálásra is képes lehet. 

Az MI a számítógép-tudományok szoftveroldalának is adósa, hiszen ez szolgáltatja 
az operációs rendszereket, a programozási nyelveket és a korszerű programok írásához 
szükséges eszközöket (és a róluk szóló cikkeket). Ez azonban egy olyan terület, ahol az 
adósságot törlesztették is. Az MI-kutatásokban megjelent sok ötlet visszakerült 
a számítógépes tudományok , fő áramlatába", beleértve az időosztásos (time-sharing) 
operációs rendszereket, az interaktív értelmezőket, a személyi számítógépeket ablakok- 
kal és egérrel, a gyors fejlesztést lehetővé tevő fejlesztői környezeteket. a láncolt listás 
adatszerkezeteket, az automatikus tárolókezelést és az objektumorientált, szímbolikus, 
funkcionális és dinamikus programozás kulcsfontosságú fogalmait. 


Irányításelmélet és kibernetika (1948-tól napjainkig) 
s Hogyan működhet egy műtermék a saját irányítása mellett? 


Az első önszabályozó gépezetet — egy vízi órát, amely olyan szabályozóval volt ellát- 
va, hogy a víz átfolyását konstans, megjósolható értéken tartotta — az alexandriai 
Ktesibios (i. e. kb. 250) építette. Ez a találmány megváltoztatta annak definícióját, hogy 
egy műtermék mire képes. Korábban csak az élő dolgokról tartották, hogy képesek a 
viselkedésüket a környezeti változások hatására módosítani. Az önszabályozó vissza- 
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csatolt szabályozó rendszerek további példái a lames Watt (1736-1819) építette gőz- 
gépszabályozó vagy a Cornelis Drebbe! (1572-1633) által feltalált termosztát, Cornelius 
Drebbel volt az is, aki a tengeralattjárót feltalálta. A stabil visszacsatolt rendszerek 
elméletét a 19. században fejlesztették ki. 

A ma irányításelméletnek (control theory) nevezett terület keletkezésében Norbert 
Wiener (1894—1964) játszott központi szerepet. Wiener zseniális matematikus volt, aki 
többek közt Bertrand Russell-le! is együttműködött, mielőtt az érdeklődését a biológiai 
és mechanikai szabályozó rendszereknek és ezek a kognitív mechanizmusokkal való 
kapcsolatának szentelte. Craikhoz hasonlóan (aki szintén használt szabályozási rend- 
szereket mint pszichológiai modelleket). Wiener és kollégái, Arturo Rosenblueth és 
Julian Bigelow kihívást jelentettek a behaviorista ortodoxia számára (Rosenblueth és tár- 
sai, 1943). Nézetük szerint a célorientált viselkedés a ,. hibát" — az aktuális állapot és a 
célállapot közötti különbséget - minimalizáló szabályozó mechanizmusból fejlődik ki. 
Az 1940-es évek végén Wiener, Warren McCulloch-val, Walter Pittsszel és Neumann 
Jánossal együtt egy sor konferenciát szervezett, ahol a kognitív folyamatok új matemati- 
kai és számítási modelljeivel foglalkoztak, és a behaviorista tudományok területén sok 
tudósra voltak hatással. Wiener Cybernetics c. könyve (Wiener, 1948) bestseller lett, és 
ráébresztette a széles publikumot az intelligens mesterséges gépek lehetőségére. 

A korszerű irányításelmélet, és különösen ennek a sztochasztikus optimális szabályo- 
zás nevű ága olyan rendszerek kifejlesztését tűzte ki célul, amelyek egy célfüggvényt 
(objective function) maximalizálnak az időben. Ez nagyjából megegyezik az MI-ről 
alkotott képünkkel: optimálisan viselkedő rendszereket fejleszteni. Akkor miért lett az 
MI és az irányításelmélet két különböző kutatási terület, hiszen megalkotói még szoros 
kapcsolatban is álltak egymással? A válasz forrása az a szoros kapcsolat, amely a részt- 
vevők által ismert matematikai technikák és az ezeknek megfelelő, mindegyik világ- 
képben megjelenő problémák halmaza között alakult ki. Az irányításelmélet eszközei, 
a mátrixalgebra és az analízis folytonos változók rögzített halmazai által leírható rend- 
szerekhez vezettek. Az egzakt analízis ráadásul tipikusan csak lineáris rendszerek ese- 
tében lehetséges. Az MI-t részben azért alkották meg. hogy az irányításelmélet 1950-es 
évekbeli matematikájától meg tudjanak szabadulni. A logikai következtetés és a számítás 
eszközei lehetővé tették az MI-kutatók számára, hogy olyan problémákat is figyelembe 
vegyenek, mint a nyelv, a látás és a tervkészítés, amelyek az irányításelméleti célkitű- 
zéseken teljesen kívül estek. 


Nyelvészet (1957-től napjainkig) 
s Mi a nyelv és a gondolat kapcsolata? 


B. F. Skinner 1957-ben publikálta a Verbal Behavior c. művét. A könyv e terület egyik 
legjobb szakértőjének tollából a nyelvtanulás behaviorista megközelítésének átfogó és 
részletes tárgyalását adta. Furcsamód a könyvismertető ugyanolyan híres lett, mint 
maga a könyv, és a behaviorizmus iránti érdeklődést csaknem kiirtotta. Az ismertető 
írója Noam Chomsky volt, aki épp akkor publikálta a saját elméletéről szóló Syntactic 
Structures c. könyvét. Chomsky kimutatta, hogy a behaviorista elmélet nem kezeli a 
nyelvben meglevő kreativitást. Az elmélet nem tudta megmagyarázni, hogy egy 
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gyerek miként képes olyan mondatokat megérteni vagy megformálni, amilyeneket 
korábban soha nem hallott. Chomskynak, Pánini (kb. i. e. 350) indiai nyelvészig visz- 
szatekintő, szintaktikai modellekre alapozó elmélete viszont magyarázatot tudott adni 
erre, és a korábbi elméletekkel ellentétben kellően formális volt ahhoz, hogy legalább 
elvben programozható is legyen. 

A modern nyelvészet és az MI nagyjából ugyanabban az időben , született meg" és 
együtt fejlődött, a nyelv használatára összpontosító számítógépes nyelvészetnek (com- 
putational linguistics) vagy természetes nyelvfeldolgozásnak (natural language pro- 
cessing) nevezett hibrid területen találkozva egymással. A nyelv megértésének prob- 
lémája rövidesen sokkal bonyolultabbnak bizonyult, mint ahogy ez 1957-ben látszott. 
A nyelv megértéséhez meg kell érteni a témát és a kontextust is, nem elegendő ehhez a 
mondat struktúrájának a megértése. Ez persze triviálisnak tűnhet, azonban az 1960-as 
évekig mégsem volt általánosan elfogadott. A tudásreprezentációhoz (knowledge 
representation) - amely annak a kutatása. hogy a tudást hogyan fejezzük ki a számító- 
gép által feldolgozható formában — tartozó kezdeti kutatások zöme a nyelvhez kötődött 
és a nyelvészeti kutatásokból táplálkozott, azok viszont a nyelv évtizedes filozófiai 
elemzéseivel voltak kapcsolatban. 


1.3. A MESTERSÉGES INTELLIGENCIA TÖRTÉNETE 


A bevezető anyaggal a hátunk mögött most már készek vagyunk arra. hogy felvázoljuk 
a szó szoros értelmében vett mesterséges intelligencia fejlődését. 


A mesterséges intelligencia érlelődése (1943-1955) 


Az első olyan eredményt, amit ma általánosan MI-eredménynek ismernek el, Warren 
McCulloch és Walter Pitts érte el (McCulloch és Pitts, 1943). Három forrásból merítet- 
tek: az alapszintű fiziológiai és az agyi neuronok működésére vonatkozó ismeretekből. 
az ítéletkalkulus Russell és Whitehead-féle formális elemzéséből és Turing számításel- 
méletéből. Egy mesterséges neuron modellt javasoltak. ahol minden neuron vagy 
sbekapcsolt", vagy , kikapcsolt" állapotban lehet. és ahol az átkapcsolás ,.be" állapotba 
akkor történik, amikor a neuront kellő számú szomszédos neuron stimulálja. A neuron 
állapotáról azt tartották, hogy . ténylegesen azzal a logikai állítással ekvivalens, amely 
a megfelelő ingert kiváltotta". Kimutatták például, hogy összekapcsolt neuronok vala- 
milyen hálózatával minden kiszámítható függvény előállítható. és hogy egyszerű háló- 
struktúrákkal az összes logikai műveletet (ÉS. VAGY. NEM stb.) is elő lehet állítani. 
MecCulloch és Pitts azt is felvetette. hogy egy megfelelően kialakított háló képes lehet 
tanulni is. Donald Hebb egy olyan egyszerű értékfrissítő szabályt mutatott be a neu- 
ronok közötti összeköttetések erősségének módosítására, amely lehetővé teszi a tanu- 
lást (Hebb, 1949). Tanulási szabálya. amit Hebb-tanulásnak (Hebbian learning) 
nevezünk, máig érvényes hatású modellnek bizonyult. 

1951-ben a Princeton Egyetem matemnatika tanszékén két végzős hallgató — Marvin 
Minsky és Dean Edmonds — megépítette az első neurális számítógépet. A SNARC-nak el- 
nevezett gépben 3000 elektroncső és a B—24 bombázó automatapilóta mechanizmusa egy 
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40 neuronból álló hálózatot szimulált. Minskv PhD-bizottsága szkeptikus volt, vajon egy 
ilyen munkát matematikának lehet-e nevezni, de Neumann János (aki tagja volt a bizottság- 
nak) állítólag úgy nyilatkozott, hogy , ha ez nem is matematika most, valamikor az lesz". 
Minsky volt később az, aki nagy hatású tételeivel kimutatta a neuronhálós kutatás korlátait. 

Sok kezdeti eredményt lehetne MI-nek nevezni, azonban egy teljes elképzelést az 
MI-ről 1950-ben Alan Turing fogalmazott meg a Computing Machinery and Intelti- 
gence c. cikkében. Itt vezette be a Turing-teszt, a gépi tanulás, a genetikus algoritmusok 
és a megerősítéses tanulás fogalmakat. 


A mesterséges intelligencia megszületése (1956) 


Princeton volt az otthona az MI egy másik befolyásos személyiségének, John McCar- 
thynak. Az egyetem befejezése után McCarthy a Dartmouth College-ba került, ami a 
témakör hivatalos szülőhelye lett. McCarthy meggyőzte Minskyt, Claude Shannont és 
Nathaniel Rochestert, hogy segítsenek neki azokat az amerikai kutatókat összehozni, 
akik érdekeltek az automataelméletben, a neurális hálókban és az intelligencia kutatá- 
sában. 1956 nyarán egy két hónapos munkatalálkozót szerveztek Dartmouthban. Össze- 
sen tíz résztvevő gyűlt össze, beleértve Trenchard More-t Princetonból, Arthur Samuelt 
az IBM-től, valamint Ray Solomonoffot és Oliver Selfridge-et az MIT-ből. 

A pálmát a Carnegie Tech." két kutatója, Allen Newell és Herbert Simon vitte el. 
Bár másoknak is voltak ötletei, és néhány esetben konkrét alkalmazásra — dámajátékra 
—- voltak programjaik is, Newell és Simon már egy következtető programmal, a Logic 
Theorist (LT)-vel rendelkezett." Erről Simon azt állította, hogy , egy olyan programot 
találtunk fel, amely képes nemnumerikusan gondolkodni, és ezzel meg is oldottuk a 
tiszteletre méltó anyag-szellem viszony problémáját". Nem sokkal a munkatalálkozó 
után a program képes volt bebizonyítani a Russell és Whitehead Principia Mathe- 
matica c. művének 2. fejezetében foglalt tételek többségét. Azt mondják, Russell el volt 
ragadtatva, amikor Simon megmutatta neki, hogy az egyik tétel esetén a program rö- 
videbb bizonyítással állt elő, mint amit a Principiában közöltek. A Journal of Symbolic 
Logic szerkesztőit kevésbé hatotta meg a dolog. A Newell, Simon és a Logic Theorist 
szerzői hármastól származó cikket elutasították. 

A dartmouthi munkatalálkozó új áttöréshez ugyan nem vezetett, de a fontos szemé- 
lyiségek bemutatkoztak egymásnak. A következő húsz évben ők, továbbá hallgatóik és 
kollégáik az MIT-n, a CMU-n, a Stanfordon és az IBM-nél lesznek azok, akik meg- 
határozó szerepet töltenek be az MI területén. A munkatalálkozó talán legtartósabb 
eredménye az volt, hogy elfogadták a terület McCarthy által kreált új nevét, azaz a mes- 
terséges intelligenciát (artificial intelligence). A , számítási racionalitás" talán jobb 
név lett volna, de az , MI" név azóta is megmaradt. 

Ha bepillantunk a dartmouthi munkatalálkozót javasló anyagba (McCarthy és társai, 
1955), látjuk, miért volt szükségszerű. hogy az MI egy külön területté váljon. De miért 


13 Most Carnegie Mellon Egyetem (Camegie Mellon University, CMU). 
Az LT megírásához Newell és Simon az IPL-t. a listakezelő nyelvet is feltalálta. Nem rendelkezvén 
fordítóval, programjukat kézzel fordították le gépi kódra. Hogy a hibákat elkerüljék, párhuzamosan dolgoztak, 
És minden utasítás megításánál a bináris számokat egymásnak átkiabálták. hogy így biztosra menjenek. 
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nem lehetett az MI-kutatást az irányításelmélet, az operációkutatás vagy a döntéselmé- 
let keretein belül tartani, amikor ráadásul ezek célkitűzései nagyon hasonlók az MI 
célkitűzéseihez? Vagy az MI miért nem lett a matematika egyik ága? Az első válasz az, 
hogy az MI a kezdetek óta sajátjának tekintette az olyan emberi képességek duplikálását, 
mint a kreativitás, az önfejlesztés és a nyelv használata. Ezekkel a kérdésekkel semmi- 
lyen más terület nem foglalkozott. A másik válasz a módszertanban rejlik. Az említett terü- 
letek közül tisztán csak az MI tekinthető a számítógépes tudományok egy ágának (bár az 
operációkutatás szintén súlyt helyez a számítógépes szimulációkra). Az MI az egyetlen 
olyan terület, ahol bonyolult, változó környezetben autonóm módon működő gépek épí- 
tése a cél. 


Korai lelkesedés, nagy elvárások (1952-—-1969) 


Az MI korai évei — bizonyos kereteken belül — bővelkedtek a sikerekben. Ha figyelem- 
be vesszük azoknak az időknek a primitív számítógépeit és programozási eszközeit, 
továbbá azt, hogy még néhány évvel korábban is csupán aritmetikai feladatok elvégzé- 
sére tartották alkalmasnak a számítógépet, megdöbbentő volt, hogy a számítógép akár 
csak távolról is okosnak tűnő dologra lehet képes. Értelmiségi körökben, összességé- 
ben, inkább azt szerették volna hinni, hogy , a gép X-re soha nem lesz képes" (az X-ek, 
Turing által kigyűjtött hosszú listája a 26. fejezetben található). Az MI kutatói termé- 
szetesen erre azzal válaszoltak, hogy egymás után demonstrálták az X-eket. A modern 
MI-kutatók közül néhányan úgy említik ezt az időszakot, mint a , Nézze uram, biz" 
isten, magától megy!" idejét. 

Newell és Simon kezdeti sikerét az általános problémamegoldó program, a General 
Problem Solver, GPS követte. A Logic Theoristtal ellentétben ezt a programot eleve 
úgy tervezték, hogy az emberi problémamegoldás protokolljait imitálja. Az derült ki, 
hogy a program által kezelhető feladványok osztályán belül, a részcélok és a lehetséges 
cselekvések megfontolásának sorrendje tényleg hasonlított ahhoz, mint ahogy a hason- 
ló problémákon dolgozó emberek cselekszenek. Így, a GPS volt talán az első, az , em- 
beri módon gondolkodni" megközelítést megtestesítő program. A GPS és az azt köve- 
tő programok sikere arra késztette Newellt és Simont (Newell és Simon, 1976), hogy 
megfogalmazzák bíres fizikai szimbólumrendszer hipotézisüket (physical symbol 
system), amely azt állítja, hogy ,.a fizikai szimbólumrendszerek az általános intelligens 
cselekvés szükséges és elégséges eszközeivel rendelkeznek". Arra gondoltak, hogy 
minden, intelligenciát felmutató rendszernek (legyen az ember vagy gép) képesnek kell 
lennie arra, hogy szimbólumokból álló adatstruktúrákat manipuláljon. Később látni 
fogjuk. hogy e hipotézist több irányból is megtámadták. 

Az első néhány MI-programot az IBM-nél Nathaniel Rochester és kollégái fejlesztet- 
ték ki. Herbert Gelernter egy olyan geometriai tételbizonyító programot (Geometry 
Theorem Prover, Gelernter, 1959) írt, mely sok matematikus hallgató által trükkösnek 
talált tételt tudott bebizonyítani. 1952-től kezdve Arthur Samuel dámajátékot játszó 
programokat írt, amelyek végül megtanultak egy erős amatőr versenyzői szinten játszani. 
Eközben sikerült megcáfolnia, hogy a számítógép csak arra képes, amire utasítják, hiszen 
programja gyorsan megtanult nála is jobban játszani. A program tv-bemutatása 1956 feb- 
ruárjában igen nagy hatást keltett. Turinghoz hasonlóan Samuelnek is csak nehezen 
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sikerült gépidőt szereznie. Éjszaka dolgozott, az IBM számítógépes üzemében végtesz- 
telésre váró gépeket használva. A kétszemélyes játékokkal a 6. fejezet, a Samuel által 
használt tanuló technikával és annak továbbfejlesztésével a 21. fejezet foglalkozik. 

John McCarthy Dartmouth-ból átment az MIT-re, és ott egyetlen év alatt. a történel- 
minek nevezhető 1958-as évben, három kulcsfontosságú eredményt ért el. Az 1. számú 
MIT AI Lab Memóban definiálta a Lispet, amely elsődleges MI-programozási nyelvvé 
nőtte ki magát. A Lisp a második legrégebbi nyelv, amely még használatban van, 
a Fortrannál csak egy évvel fiatalabb. A Lisp esetén McCarthy rendelkezett már a szük- 
séges eszközzel, de a ritka és drága számítógépes erőforrásokhoz való hozzáférés szá- 
mára is komoly problémát jelentett. Így aztán az MIT-n McCarthy és mások kitalálták 
az időosztást. Szintén 1958-ban McCarthy Programs with Common Sense címen cikket 
publikált, amelyben az Advice Takert írta le. Ez egy hipotetikus program. amit az első 
teljes MI-rendszernek tekinthetünk. A Logic Theoristhez és a Geometry Theorem Pro- 
verhez hasonlóan McCarthy programja is tudást használt fel egy probléma megoldá- 
sának megtalálásához. Azonban másokkal ellentétben, ennek a programnak a világra 
vonatkozó általános tudással kellett rendelkeznie. McCarthy megmutatta például, hogy 
néhány egyszerű axióma elegendő ahhoz, hogy programja képes legyen terveket gene- 
rálni arra vonatkozóan, hogyan kell a repülőtérre kimenni ahhoz, hogy a repülőgépet le 
ne késsük. A programot úgy tervezte. hogy képes legyen normális működés közben új 
axiómákat is elfogadni, és ennek eredményeként árprogramozás nélkül új területeken 
is kompetenciát mutatni. Az Advice Taker ily módon a tudásreprezentáció és a kö- 
vetkeztetés leglényegesebb elveit testesítette meg, miszerint hasznos, ha rendelkezünk 
a világot és az ágens cselekvéseinek eredményét leíró explicit és formális reprezentáció- 
val, és képesek vagyunk ezt a reprezentációt deduktív módon manipulálni. Figyelemre 
méltó. hogy 35 év múltával még mennyire releváns maradt az 1958-as cikk. 

1958 volt az az év is, amikor Marvin Minsky az MIT-re ment át. Kezdeti együttmű- 
ködése McCarthyval nem tartott sokáig. McCarthy a reprezentációra és a formális logi- 
kai következtetésre tette a hangsúlyt, Minskyt inkább az érdekelte, hogy a programok 
működőképesek legyenek, majd végül logikaellenes álláspontra helyezkedett. 1963-ban 
McCarthy a Stanfordon megalakította az ottani MI-labort. Kutatási programja — amely 
arra irányult, hogy a logikát felhasználja a legvégső Advice Taker építésében — lökést 
kapott, amikor I. A. Robinson felfedezte a rezolúciót, az elsőrendű logika teljes bizo- 
nyítási eljárását (lásd 9. fejezet). A Stanfordon a kutatás hangsúlyozottan a logikai kö- 
vetkeztetés általános módszereire irányult. A logika alkalmazásaihoz tartoztak Cordell- 
nek a Green kérdését megválaszoló és tervkészítő rendszerei (Green, 1969b), továbbá 
Shakey robotikus projektje az új Stanfordi Kutatóintézetben (Stanford Research Institute. 
SRD.5 Ez a projekt — amit részletesebben a 25. fejezetben tárgyalunk — volt az első. 
amely a logikai következtetést és a fizikai aktivitást teljes egészében integrálta. 

Minsky a hallgatók egész sorát irányította, akik a megoldásokhoz láthatóan intelli- 
genciát igénylő, korlátos problémákkal foglalkoztak. Ezeket a korlátos problématerüle- 
teket később mikrovilágoknak (microworids) nevezték el. James Slagle SAINT nevű 
programja (Slagle, 1963a) képes volt az elsőéves analízis tanfolyamra jellemző, zárt 


15 Az angol nyelvben a tervkészítő tervezés (planning) és a terméket készítő tervezés (design) szépen elkü- 
Tönül. Hogy a pontos jelentést hangsúlyozzuk, az angol . planning" fordításánál a továbbiakban , tervkészítést" 
használunk. (A ford.) 
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1.4. ábra. Egy konkrét probléma, amelyet Evans ANALOGY programja megoldott 


alakra hozható integrálszámítási feladatokat megoldani. Tom Evans ANALOGY prog- 
ramja (Evans, 1968) az I0-tesztekben előforduló (lásd 1.4. ábra) geometriai analógia 
jellegű problémákat oldotta meg. Daniel Bobrow STUDENT programja (Bobrow, 1967) 
olyan algebrai feladványokat oldott meg, mint például az alábbi: 


Ha Tamás ügyfeleinek a száma kétszerese az általa közzétett hirdetések 209--a négyzetének, és 
"Tamás 45 hirdetést adott közzé, akkor hány ügyfele van Tamásnak? 


A mikrovilágok legismertebbike a kockavilág lett, amely egy asztalra (vagy gyakrab- 
ban egy szimulált asztalra) helyezett tömör geometriai testekből áll (lásd 1.5. ábra). 
Az ilyen világban értelmezett feladat a kockák egy bizonyos átrendezése egy olyan 
robotkar segítségével, amely egyszerre egyetlenegy kockát képes megfogni. A kocka- 

















1.5. ábra. Egy elrendezés a kockavilágban. A SHRDLU robot (Winograd. 1972) éppen sikeresen teljesí- 
tette a ,keresd meg azt a blokkot, ami a kezedben tartottnál magasabb, és tedd a dobozba" utasítást. 
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világ otthont adott David Huffman gépi látási projektjének (Huffman, 1971), David 
Waltz gépi látási és kényszerterjesztés-kutatásának (Waltz, 1975), Patrick Winston 
tanulási elméletének (Winston, 1970), Terry Winograd természetes nyelvfeldolgozási 
programjának (Winograd, 1972) és Scott Fahlman tervkészítő programjának (Fahlman, 
1974). 

A McCulloch és Pitts neurális hálóin alapuló kezdeti kutatás szintén virágzott. 
Winograd és Cowan eredményei megmutatták, hogy a nagyszámú elem hogyan képes 
együttesen egy egyedi fogalmat reprezentálni, miközben növeli a párhuzamosságot és 
a robusztusságot (Winograd és Cowan, 1963). Hebb tanulási módszereit Bernie 
Widrow (Widrow és Hoff, 1960: Widrow, 1962) fejlesztette tovább, aki a hálózatait 
adaline-oknak nevezte, továbbá Frank Rosenblatt, aki a perceptronokat vezette be 
(Rosenblatt. 1962). Rosenblatt bebizonyította perceptron konvergencia tételét (per- 
ceptron convergence theorem), kimutatva ezzel, hogy tanulási algoritmusa képes 
a perceptron súlyait úgy módosítani, hogy az tetszőleges bemeneti adatokhoz illeszked- 
jen, feltéve, hogy ilyen illeszkedés egyáltalán lehetséges. Ezekről a kérdésekről a 20. 
fejezetben írunk majd. 


Egy adag realitás (1966-1973) 


Az MI kutatói már a kezdetekben sem voltak szégyenlősek a várható sikereiket illetően. 
Gyakran idézik Herbert Simonnak a következő, 1957-ből származó kijelentését: 


Sem meglepni, sem sokkolni senkit nem célom — de a legegyszerűbben összefoglalva azt mondhatom, 
hogy a világban léteznek ma már gondolkodó, tanuló és kreatív gépek. E képességük rohamosan fog 
fejlődni, és - a közeljövőben — az általuk feldolgozott problémák köre összemérhető lesz azokkal 
a problémákkal, amelyekke! az emberi elme eddig megküzdött. 


Bár vitatható, hogy ..közeljövőnek" mi tekinthető, Simon néhány más előrejelzése 
konkrétabb volt. Megjósolta, hogy tíz éven belül a számítógép sakkvilágbajnok lesz, és 
hogy a gép fontos új matematikai tételeket fog bebizonyítani. Ezek a jóslatok, ha nem 
is tíz, hanem inkább negyven év múltával (közelítőleg vagy teljesen), de beigazolódtak. 
Simon magabiztossága a korai MI-programok egyszerű példaproblémákon felmutatott 
sikereiből táplálkozott. Ezek a korai rendszerek azonban majdnem minden esetben 
szánalmasan csődöt mondtak, ha szélesebb körben vagy netán nehezebb problémákra 
akarták őket bevetni. 

A nehézség egyik forrása az volt, hogy a korai programok az általuk kezelt problé- 
mákról sokszor kevés vagy szinte semmi tudást nem tartalmaztak, és csupán egyszerű 
szintaktikai manipulálással értek el sikereket. Egy tipikusnak mondható történet a korai 
gépi fordítással kapcsolatos. A gépi fordítást a Nemzeti Kutatási Alap (National Re- 
search Council) bőkezűen finanszírozta azért, hogy a Szputnyik 1957-es kilövését 
követően meggyorsítsák az orosz tudományos cikkek fordítását. Kezdetben azt vélték, 
hogy az angol és az orosz nyelvtanra alapozó egyszerű szintaktikai transzformációk és 
az elektronikus szótárra alapozó szóbehelyettesítés elegendő lesz a mondat pontos 
értelmének átadásához. Valójában a fordításhoz a téma általános ismerete szükséges, 
hogy feloldhassuk a kétértelműségeket, és a mondat jelentését megállapítsuk. ,.A szellem 
készséges, de a test gyenge" (, the spirit is willing but the flesh is weak") híres vissza- 
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fordítása , a vodka jó, de a hús romlott"-ra (.the vodka is good but the meat is rotten") 
a tapasztalt nehézségeket világosan érzékeltette. Egy tanácsadó bizottság 1966-os jelen- 
tése azt állapította meg, hogy az , általános tudományos szöveg fordítása még nem meg- 
oldott, és a közeljövőben e téren gyors előrehaladás nem is várható". Az egyetemi gépi 
fordítási projekteknek a kormány általi finanszírozását Amerikában teljesen megszüntet- 
ték. Manapság a gépi fordítás egy nem tökéletes, ám széles körben alkalmazott eszköz 
műszaki, kereskedelmi, kormányzati és internetdokumentumok esetében. 

A másik nehézséget az jelentette, hogy sok olyan probléma, amelyeket az MI által 
kíséreltek megoldani, kezelhetetlen volt. A korai MI-programok többsége úgy dolgozott, 
hogy a problémára vonatkozó alapvető tényeket gépen reprezentálva, megoldó lépés- 
szekvenciákat próbáltak ki, a különféle lépéskombinációkkal addig kísérletezve, amíg 
nem leltek rá a helyesre. A korai programok azért voltak használhatók, mert a mikrovi- 
lágok csak kevés objektumot, és ebből adódóan nagyon kevés lehetséges cselekvést és 
nagyon rövid megoldási sorozatokat tartalmaztak. Az NP-teljesség elméletének meg- 
fogalmazása előtt általában azt tartották, hogy a nagyobb problémákra , felskálázni" csu- 
pán gyorsabb hardver és nagyobb memória kérdése. A rezolúciós tételbizonyítás kifej- 
lesztését kísérő optimizmus például hamarosan lelohadt, amikor a néhány tucat ténynél 
többet igénylő tételeket nem sikerült bebizonyítani. Az a tény, hogy egy program egy 
megoldás megtalálására elvben alkalmas, nem jelenti azt, hogy a program bármi olyan 
mechanizmust is tartalmaz, amely a megoldás gyakorlati megvalósításához szükséges. 

A korlátlan számítási kapacitás illúziója nem csak a problémamegoldó programokra 
korlátozódott. A gépi evolúció (machine evolution), amelyet most genetikus algorit- 
musoknak (genetic algorithms) nevezünk (Friedberg, 1958; Friedberg és társai, 1959), 
területén végzett korai kísérletek azon a kétségtelenül helyes feltevésen alapultak, 
amely szerint ha egy gépi kódú programot megfelelően kicsi mutációk révén változta- 
tunk, tetszőleges, egyszerű feladatot jól megoldó programhoz juthatunk el. Az ötlet 
tehát az volt, hogy véletlen mutációkkal próbálkozva, a program viselkedését javító 
mutációkat tartsuk meg. Azonban ezernyi óra gépidő ellenére sem sikerült szinte sem- 
milyen előrehaladást kimutatni. A korszerű genetikus algoritmusok jobb reprezentáció- 
kat használnak, és több sikerre is vitték. 

Az volt az MI ellen irányuló legfontosabb kritika a Lighthill-tanulmányban (Lighr- 
hill, 1973), hogy nem képes leküzdeni a , kombinatorikus robbanást". A tanulmány alap- 
ján a brit kormány, kettő kivételével az összes egyetemen minden MI-kutatási támogatást 
visszavont (a szóbeszéd kissé más és színesebb képet fest a nyomdafestéket nem tűrő po- 
litikai ambíciókról és a személyes ellenségeskedésről). 

A harmadik nehézség forrását az intelligens viselkedés generálásához használt alap- 
vető struktúrák fundamentális korlátai jelentették. Minsky és Papert Perceptrons c. 
könyve (Minsky és Papert, 1969) például azt bizonyította be, hogy bár a perceptron 
(a neurális háló egy egyszerű formája) megtanulhat mindent, amit képes reprezentálni, 
vajmi keveset képes reprezentálni. Így például a két bemenetű perceptront nem lehet 
megtanítani arra, hogy a bemeneteinek különbözőségét felismerje. És bár a szerzők 
eredményei bonyolultabb, többrétegű hálókra nem vonatkoztak, a neurális hálók kuta- 
tásának finanszírozása rövidesen majdnem nullára esett vissza. A sors iróniája, hogy 
a többrétegű neurális hálók későbbi, az 1980-as években történő óriási feltámadását ho- 
zó új visszaterjesztéses tanuló algoritmust éppen 1969-ben fedezték fel először (Bryson 
és Ho, 1969). 
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Tudásalapú rendszerek: a hatalom kulcsa? (1969-1979) 


A problémamegoldásnak az a képe, amely az MI-kutatás első évtizedében alakult ki, egy 
olyan általános célú kereső mechanizmus volt, amely a teljes megoldás megtalálásának 
érdekében szekvenciába fűzte az elemi következtetési lépéseket. Az ilyen megközelíté- 
seket gyenge módszereknek (weak methods) nevezték, mert annak ellenére, hogy ál- 
talánosak, a problémák nagy vagy nehéz példányaira nem skálázhatók fel. A gyenge 
módszerek alternatívája az erőteljesebb, területspecifikus tudás használata, amely lehe- 
tővé teszi a nagyobb granuláltságú következtetési lépések megvalósítását, és szűkebb 
szakértői tárgyterületeken a tipikus konkrét problémák megoldását. Ahhoz, hogy egy ne- 
héz problémát megoldjunk, mondhatni majdnem kész válasszal kellene rendelkeznünk. 

E megközelítés egyik korai példája a DENDRAL program volt (Buchanan és társai, 
1969). A programot a Stanfordon fejlesztették ki, ahol Ed Feigenbaum (Herbert Simon 
volt hallgatója), Bruce Buchanan (a számítógépes szakemberből lett filozófus) és 
Joshua Lederberg (Nobel-díjas genetikus) összefogtak, hogy a tömegspektrométer 
által szolgáltatott adatokból a molekuláris struktúra kinyerésének problémáját meg- 
oldják. A program bemeneti adatai a molekula alapképlete (például CSHj3NO2) és a 
tömegspektrum voltak. A spektrum megadta a molekula bizonyos részeinek a tömegét, 
amikor a molekulát elektronsugárral bombázták. A tömegspektrum tartalmazhatott 
például m -15-nél egy csúcsot, amit a metil (CH3) molekularésszel lehetett azonosítani. 

A program naiv verziója a molekula képletével konzisztens minden lehetséges struk- 
túrát előállított. Ezt követően minden egyes struktúrához megjósolta a megfelelő megfi- 
gyelhető tömegspektrumot, és ezt hasonlította össze az aktuálisan megfigyelt spektrum- 
mal. Ahogy várható volt, nagyobb molekulák esetén az eljárás gyorsan kezelhetetlenné 
vált. A DENDRAL kutatói analitikus vegyészekhez fordultak segítségért. Azt találták, 
hogy a vegyészek a spektrumban a molekulában található elterjedt részstruktúrákra 
utaló, jól ismert csúcsmintákat keresik. Így például a keton (C — 0) alcsoport (amely 28 
súlyú) felismeréséhez az alábbi szabály volt használatos: 


ha két olyan csúcs, xy és x2 létezik, hogy 

(a) xy 4 x — M 4 28 (M a teljes molekula tömege); 
(b) xy — 28 egy magas csúcs; 

(c) xa — 28 egy magas csúcs; 

(d) xy és x közül legalább egy csúcs magas. 
akkor ketoncsoport van jelen. 


Azzal, hogy felismerjük, hogy egy konkrét részstruktúra a molekula része, a lehetséges 
struktúrajelöltek száma nagyon nagy mértékben csökken. A DENDRAL-rendszer haté- 
kony volt, mert: 


Az ilyen problémák megoldásához szükséges összes elméleti tudást sikerült (a rendszer spektrumjós- 
1ó komponensében) leképezni az általános formáról (, elsődleges ismeretek") egy hatékony speciális 
formára (, szakácskönyv") (Feigenbaum és társai, 1971). 


A DENDRAL fontossága abban rejlik, hogy vitathatatlanul ez volt az első sikeres tudás- 
intenzív rendszer. Szakértelmét a nagyszámú speciális rendeltetésű szabály biztosította. 
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A későbbi rendszerekben szintén megjelent a McCarthy-féle Advice Taker egyik fő gon- 
dolata — a (szabályformájú) tudás és a következtető komponens határozott elkülönítése. 
Okulva az ilyen leckén, Feigenbaum és mások a Stanfordon belekezdtek a heuriszti- 
kus programozási projektbe (Heuristic Programming Project, HPP) azzal a céllal, hogy 
megvizsgálják, a szakértőrendszereknek (expert systems) ez az új módszertana 
milyen mértékben alkalmazható az emberi szakértelem más területein. A következő ko- 
moly erőfeszítés az orvosi diagnózis területén született meg. Feigenbaum, Buchanan és 
dr. Edward Shortliffe vérrel kapcsolatos fertőzések diagnosztizálására fejlesztették ki 
a MYyCIN-rendszert. 450 szabályával a MYCIN elérte az egyes szakértők hatékonyságát 
és a kezdő orvosoknál lényegesen jobb teljesítményt nyújtott. A MYCIN két fő vonatko- 
zásban különbözött a DENDRAL-tól. Először is, a DENDRAL szabályaival ellentétben, a 
MxcIN-szabályok származtatásához nem létezett semmilyen általános elméleti modell. 
A szabályokat a szakértők kiterjedt kikérdezése révén kellett beszerezni, akik viszont 
a szabályokat könyvekből, más szakértőktől és közvetlen tapasztalatokból merítették. 
A másik különbség abból eredt, hogy a szabályoknak tükrözniük kellett az orvosi isme- 
ret bizonytalanságát. A MYcIN-ben bizonyossági tényezőknek (certainty factors) (lásd 
14. fejezet) nevezett bizonytalanságkezelő mechanizmust alkalmaztak, amelyről akkor- 
tájt úgy tűnt, jól tükrözi a tényállás diagnózisra gyakorolt hatásának orvosi megítélését. 
A tárgytartomány ismeretének fontossága nyilvánvaló volt a természetes nyelvfelis- 
merés területen is. Bár Winograd természetes nyelvfelismerő rendszere, a SHRDLU igen 
élénk érdeklődést keltett, a szintaktikai elemzéstől való függősége néhány, a kezdeti 
gépi fordításban már tapasztalt problémához vezetett. A program képes volt a kétértel- 
műségen felülkerekedni, és a névmási szerkezeteket megérteni. Ez azonban azért volt 
lehetséges, mert a programot kifejezetten egy adott tárgytartományhoz — a kockavilág- 
hoz - fejlesztették ki. Néhány kutató, köztük Eugene Charniak, Winograd végzős társa 
az MIT-ről, felvetette, hogy a természetes nyelv robusztus felismerése a világról szóló 
általános ismereteket és ezen ismeretek általános felhasználási módszereit igényli. 

A Yale-en, Roger Schank, a nyelvésszé lett MI-kutató, ezt a nézetet még jobban 
hangsúlyozta, azt állítván, hogy , olyan dolog, mint a szintaxis pedig nincs", ami ugyan 
sok nyelvészt felháborított, de egyben egy hasznos eszmecserét is elindított. Schank és 
hallgatói a természetes nyelvet felismerő programok egész sorát építették meg (Schank 
és Abelson, 1977; Wilensky, 1978; Schank és Riesbeck, 1981; Dyer, 1983). A hang- 
súlyt azonban kevésbé magára a nyelvre, sokkal inkább a nyelv megértéséhez szüksé- 
ges tudás reprezentálására és a vele való következtetésre helyezték. E problémakörbe 
tartozott a sztereotip helyzetek reprezentálása (Cullingford, 1981), az emberi memória 
szervezésének leírása (Rieger, 1976: Kolodner, 1983) és a célok, tervek megértése 
(Wilensky, 1983). 

A valós alkalmazások széles körű elterjedése a működőképes tudásreprezentációs 
sémák iránti igények növekedéséhez vezetett. Számos különböző reprezentációs és kö- 
vetkeztető nyelvet fejlesztettek ki. Egyes megoldások a logikán alapultak — például 
a Prolog nyelv, amely Európában, és a PLANNER nyelvcsalád, amely az Egyesült Álla- 
mokban lett népszerű. Mások, a Minsky által bevezetett keretek (frames) (Minsky, 
1975) ötletét követve, inkább strukturált megközelítést választottak. Egybegyűjtöttek 
bizonyos eseménytípusokra vagy objektumokra jellemző tényeket, majd azokat a bio- 
lógiai taxonómiára hasonlító nagy taxonomikus típushierarchiákba rendezték. 
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Az MI iparrá válik (1980-tól napjainkig) 


Az első üzletileg sikeres szakértőrendszert, az R1-et a Digital Eguipment Corporation- 
nél (McDermott, 1982) alkalmazták. A rendszer az új számítógépes rendszerek meg- 
rendeléseit segítette konfigurálni, és 1986-ra évi mintegy 40 millió dollár megtakarítást 
jelentett a cégnek. 1988-ra a DEC MI-csoportja már 40 szakértőrendszert állított üzem- 
be, és több ilyen rendszer üzembe állítása folyamatban volt. A DuPont cégnél 100 ilyen 
rendszer üzemelt, és folyamatban volt további 500 rendszer fejlesztése. Az ezekből szár- 
mazó becsült megtakarítás elérte az évi 10 ó dollárt. Majdnem minden nagyobb 
amerikai cég saját MI-csoporttal rendelkezett, és vagy használta, vagy tanulmányozta 
a szakértőrendszer technológiát. 

1981-ben a japánok meghirdették az , ötödik generációs" (Fifth Generation) projekt- 
jüket — egy 10 éves tervet a Prolog nyelvet gépi kódként használó, intelligens számító- 
gépes rendszerek építésére. Válaszul az Egyesült Államokban létrehozták az MCC 
(Microelectronics and Computer Technology Corporation) kutatótársulatot, amelynek 
célja a nemzeti versenyképesség biztosítása volt. Mindkét esetben az MI egy olyan 
általánosabb erőfeszítés része lett, amely a chiptervezésre és az ember-gép interfész 
kutatására is irányult. Az MCC és az Ötödik Generáció MI-komponensei azonban az 
ambiciózus célkitűzéseket mégsem tudták elérni. Nagy-Britanniában az Alvey-i -jelen- 
tés visszaállította a Lighthill-jelentés következtében leállított finanszírozást. 6 

Mindent egybevéve az MI-iparnak az 1980-as néhány millió dolláros forgalma 1988-ra 
2 milliárd dollárra nőtt. Rövidesen ezután az , MI tele" periódus következett be, amikor sok 
cég belebukott abba, hogy extravagáns ígéreteit nem tudta teljesíteni. 





A neurális hálók visszatérése (1986-tól napjainkig) 


Bár a számítógép-tudomány az 1970-es évek végén a neurális hálók témakörről meg- 
feledkezett, a kutatás más területeken folytatódott. A fizikusok, mint például Hopfield, 
a statisztikus mechanika módszereit használták, hogy a hálók tárolási és optimalizálási 
tulajdonságait elemezzék (Hopfield, 1982), úgy kezelve az egyszerű neuronok együtte- 
sét, mint atomok együttesét. A pszichológusok, David Rumelhartot és Geoff Hintont ís 
beleértve, folytatták a memória neurális hálós modelljének kutatását. Mint ezt a 20. 
fejezetben megmutatjuk, az igazi lökés az 1980-as évek derekán történt, amikor leg- 
alább négy különböző kutatócsoport újra feltalálta a visszaterjesztéses tanuló algorit- 
must, azt az algoritmust, amit először Bryson és Ho írtak le 1969-ben. Az algoritmust 
számos tanulóproblémára alkalmazták mind a számítógépes tudományokban, mind a 
pszichológiában. Az eredmények széles körű bemutatására a nagy érdeklődést keltő 
Parallel Distributed Processing c. (Rumelhart és McClelland, 1986) gyűjteményes kö- 
tetben került sor. 

Az intelligens rendszereknek ilyen, ún. konnekcionista (connectionist) modelljeit 
egyesek a Newell és Simon javasolta szimbolikus modellek, valamint a McCarthy és 
mások által alkalmazott logicista megközelítés közvetlen versenytársának vélték (Smo- 


16 A kínos helyzet elkerülésére i 
IKBS) néven új kutatási területet defi 


Itigens tudásalapú rendszerek (Intelligent Knowledge-Based Systems, 
áltak, hiszen a mesterséges intelligenciát hivatalosan törölték. 
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lensky. 1988). Hogy egy bizonyos szinten az ember szimbólumokkal operál, nyilván- 
valónak tűnhet. Sőt Terrence Deakon The Symbolic Species c. művében (Deakon, 1997) 
ezt a képességet az embereket definiáló jellemzőnek javasolja. A legmegrögzöttebb 
konnekcionisták azonban kérdőre vonták a tekintetben, hogy a kognitív folyamatok 
részletes modelljében a szimbolikus manipulációnak van-e egyáltalán valamilyen valós 
magyarázó szerepe. Ez a kérdés megválaszolatlan maradt, és a jelenlegi álláspont az, 
hogy a konnekcionista és a szimbolikus megközelítések egymás kiegészítői, nem pedig 
versenytársak. 


Az MI tudománnyá válik (1987-től napjainkig) 


A legutóbbi években az MI-kutatásnak mind tartalmában, mind módszertanában lénye- 
ges változások álltak be.!? Mostanság inkább megszokott létező elméletekre építeni, 
mint teljesen újakat javasolni, az állításokat az intuíció helyett inkább szigorúan vett 
tételekre, illetve komoly kísérleti bizonyítékokra alapozni, továbbá a lényeges eredmé- 
nyeket nem játékproblémákon, hanem valós feladatokon bemutatni. 

Az MI-t részben a létező kutatási területek — mint az irányításelmélet és a statisztika 
— korlátaival szembeni kitörési vágyból alapították meg. Most azonban az MI ezeket 
a területeket igyekszik magában foglalni. David McAllester szavaival (McAllester, 1998): 






Az MI korai szakaszában plauzíbilisnak tűnt. hogy a szimbolikus számítások új formái, például 
a keretek és szemantikus hálók, a klasszikus elméletek nagyobb részét elavulttá tették. Ez egyfajta 
elszigetelődéshez vezetett, ahol az MI a számítási tudomány többségétől el lett választva. Ezzel az 
izolacionizmussal most szakítunk. Fel kell ismerni, hogy a gépi tanulást nem szabad elszigetelni 
az információelmélettől. hogy a bizonytalanság melletti következtetést nem szabad elszigetelni 
a sztochasztikus modellezéstől, hogy a keresést nem szabad elszigetelni a klasszikus optimalizá- 
lástól és szabályozástól, és hogy az automatikus következtetést nem szabad elszigetelni a formális 
módszerektől és a statikus elemzéstől. 


Módszertanát tekintve az MI-ben végre a tudományos megközelítés uralkodott el. Hogy 
egy hipotézist elfogadhassunk, szigorú empirikus kísérleteknek kell alávetni, és az ered- 
mények relevanciáját statisztikailag kell verifikálni (Cohen, 1995). Manapság a kísér- 
letek reprodukálhatóságát az internet és a megosztott tesztadat- és programkódtárak 
szavatolják. 

Ez a folyamat a beszédfelismerés területén jól látható. Az 1970-es években igen sok 
különböző architektúrát és megközelítést próbáltak ki. Ezek közül sok ad hoc jellegű és 
gyenge volt, amelyek működését csupán néhány, erre a célra megválasztott példán de- 
monstrálták. A legutóbbi években a rejtett Markov-modelleken (hidden Markov 
models, HMM) alapuló megközelítések uralják e területet. A HMM-ek két aspektusa 
lényeges. Először is szigorú matematikai elméleten alapulnak. Ez lehetővé tette, hogy 


17 Vannak, akik ezeket a változásokat úgy jellemezték. mint az elegánsak (neats) győzelmét a szakadtak 
(scruffies) felett. Az elegánsak úgy gondolják, hogy az MI-elméleteknek szigorú matematikai alapokon kell áll- 
niuk, míg a szakadtak inkább sok ötletet próbálnának ki, programokat írnának , és megnéznék. mí működőképes 
ezekből. Mindkét megközelítés fontos. Az elegancia felé történő eltolódás annak a jele. hogy a terület egy stabil 
és érett szintet ért el (más kérdés persze, hogy ezt a stabilitást új , szakadt" gondolatok mennyire bolygatják fel). 
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a beszédkutatók a más területeken kifejlesztett több évtizedes matematikai eredmé- 
nyekre építsenek. Másodszor, e modelleket valós és nagyméretű beszédgyűjteményt 
felhasználó tanulási folyamat során hozzák létre. Ez biztosítja robusztus működésüket. 
A szigorú vaktesztek a rejtett Markov-modellek folyamatos javulását mutatják. A be- 
szédtecbnológia és a vele rokon kézírás-felismerés útban van a széles körű ipari és 
fogyasztói alkalmazások felé. 

Ez a trend a neurális hálókra is igaz. Az 1980-as években a kutatás többsége arra 
irányult, hogy kitapasztalják, a hálókkal meddig mehetnek el, és hogy megtanulják, 
a hálók a , hagyományos" technikáktól miben különböznek. A jobb módszertan és az 
elméleti háttér révén eljutottak ahhoz, hogy most a hálókat össze lehet hasonlítani 
a megfelelő statisztikai, alakfelismerési és gépi tanulási technikákkal, és az adott alkal- 
mazáshoz meg lehet választani a leginkább sikerrel kecsegtetőt. Az ilyen fejlődés ered- 
ményeképpen az adatbányászat (data mining) technológia virágzó új iparrá nőtte ki 
magát. 

Judea Pearl Probabilistic Reasoning in Intelligent Systems c. műve a valószínűség- 
és a döntéselmélet MI-n belüli újbóli elfogadását jelezte (Pearl, 1988). Mindez azt kö- 
vetően történt, hogy Peter Cheeseman In Defense of Probability cikkében összefoglal- 
ta az érdeklődés újraéledését (Cheeseman, 1985). A Bayes-hálók (Bayesian networks) 
formalizmusát a bizonytalan tények hatékony ábrázolására és a velük történő szabatos 
következtetés céljára találták ki. Ez a megközelítés a valószínűségi következtető rend- 
szerek 1960-as és 1970-es években tapasztalt problémáit nagyrészt megoldotta, és ma 
uralja a bizonytalan következtetésre és a szakértőrendszerekre irányuló MI-kutatásokat. 
Ez a megközelítés teszi lehetővé a tapasztalatból való tanulást és ez kapcsolja össze a 
klasszikus MI és a neurális hálók legfontosabb eredményeit. Judea Pearl, továbbá Eric 
Horvitz és David Heckerman munkája támogatta a normatív szakértőrendszer gondola- 
tát, azaz egy olyan rendszerét, amely a döntéselméleti törvényeknek megfelelően racio- 
nálisan cselekszik, és nem kísérli meg az emberi szakértőket imitálni (Pearl, 1982a; 
Horvitz és Heckerman, 1986; Horvitz és társai, 1986). A Windows"" operációs rendszer 
tartalmaz néhány normatív szakértőrendszert a felmerülő hibák javítására. Erről az 
elgondolásról szól a 13—16. fejezet. 

Hasonló szelíd forradalom következett be a robotika, a gépi látás és a tudásreprezen- 
tációk területén. A problémák és bonyolultságuk jobb megértése, a növekvő matema- 
tikai háttérrel összefonódva, robusztusabb módszerekhez és megvalósítható kutatási 
menetrendekhez vezetett. Sok esetben a formalizálás és a speciálizálódás felaprózódást 
eredményezett. Az olyan témák, mint a látás és a robotika az MI fő vonalától egyre job- 
ban elszigetelődnek. Az MI-nek a racionális ágensben megtestesült egységesítő képe 
egy olyan megközelítés, amely e divergáló területeken újra egységet teremthet. 


Az intelligens ágensek kialakulása (1995-től napjainkig) 


Valószínűleg az MI részproblémáiban elért sikereken felbátorodva a kutatók elővették 
a teljes ágens" problémakörét. A teljes ágensarchitektúra legismertebb esete a SOAR, 
Allen Newell, John Laird és Paul Rosenbloom munkája (Newell, 1990; Laird és társai, 
1987). Az ún. beágyazott mozgalom célul tűzte ki a valós környezetbe ágyazott, foly- 
tonos szenzorikus adatokat fogadó ágensek működésének a megértését. Az intelligens 
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ágensek szempontjából az egyik legfontosabb környezet az internet. A világhálós alkal- 
mazásokban az MI-rendszerek annyira mindennaposak lettek, hogy a ,.-bot" szóvégző- 
dés már a mindennapi nyelvbe ís beépült. Ráadásul az MI-technológiák sok olyan inter- 
netes eszköznek képezik az alapját, amilyenek a keresőgépek. az ajánló rendszerek és 
a weboldalszerkesztő rendszerek. 

E könyv első kiadása (Russell és Norvig, 1995) mellett más kurrens könyv is átvette 
az ágensperspektívát (Poole és társai, 1998; Nilsson, 1998). A teljes ágenstervezés 
egyik következménye, hogy fel kell ismerni, az MI eddig elszigetelt területeit minden 
bizonnyal valamelyest át kell szervezni, ha az eredményeiket össze akarjuk kapcsolni. 
Ma már széles körben elfogadott, hogy az érzékelő rendszerek (látás, szonár, beszéd- 
felismerés stb.) nem képesek a környezetről tökéletesen megbízható információt szol- 
gáltatni. A következtetésnek és a tervkészítésnek így fel kell készülnie a bizonytalan- 
ság kezelésére. Az ágensperspektíva másik lényegi következménye, hogy az MI az 
ágensekkel foglalkozó más területekkel, például az irányításelmélettel és a gazdaság- 
tannal, sokkal közelebbi kontaktusba került. 


1.4. A MESTERSÉGES INTELLIGENCIA 
JELENLEGI HELYZETE 


Mit tehet az MI manapság? Nehéz erre tömör választ adni, mert annyi minden történt, 
és olyan sok a művelt részterület. Az alábbiakban bemutatunk néhány alkalmazást, má- 
sokról a könyv további részeiben szó lesz. 


Autonóm tervkészítés és ütemezés: Több száz millió mérföldre a Földtől a NASA 
Remote Agent programja lett az első fedélzeti autonóm tervkészítő program, amely egy 
űrhajó műveleteinek ütemezését felügyelte (Jonsson és társai, 2000). A Remote Agent 
a terveit a Földről küldött magas szintű célokból generálta. és a tervek végrehajtása 
közben monitorozta az űrhajó működését, hibákat detektált, diagnosztizált, és vissza- 
állította a helyes működést, ha problémák léptek fel. 


Kétszemélyes játékok: Az IBM Deep Blue rendszere lett az első számítógépes 
sakkprogram. amely legyőzte a világbajnokot, amikor egy bemutató mérkőzésen 
3.5 : 2.5 arányban győzedelmeskedett Garri Kaszparov felett (Goodman és Keene, 
1997). Kaszparov nyilatkozata szerint egy , újfajta intelligenciát" érzett a sakktábla 
mögött. A Newsweek újság a mérkőzést az , agy utolsó védelmi vonalának" titulálta. 


Az IBM részvényei 18 milliárd dollárral emelkedtek. 


Autonóm szabályozás: Az ALVINN számítógépes látórendszert arra tanították, hogy 
egy gépkocsit egy közlekedési sávot követve vezessen. A rendszert a CMU NAVLAB 
számítógép-vezérelt kis tehergépkocsijára helyezték, és arra használták, hogy az Egyesült 
Államokon keresztül elnavigáljon. A 2850 mérföldes távból a rendszer az idő 9876-ban 
vezetett. A maradó 29-ért, főleg a sztrádalejáratokon. az ember vállalta felelősséget. 
A NAVLAB videokamerákkal rendelkezik, amelyek az ALVINN számára közvetítik az út 
képeit. A tanulóutakból szerzett tapasztalatok felhasználásával az ALVINN számítja ki a 
kormánykerék legjobb beállítását. 
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Diagnózis: Valószínűségi elemzésen alapuló orvosi diagnosztizáló rendszerek az 
orvosi tudományok több területén szakértő orvosok szintjén voltak képesek helytállni. 
Heckerman (Heckerman, 1991) leír egy esetet, amikor a nyirokcsomó-patológia egyik 
vezető szakembere gúnyolódó megjegyzést tesz egy pokolian nehéz esetet diagnosz- 
tizáló program javaslatára. A rendszer fejlesztője azt javasolja, hogy kérdezze meg 
a rendszertől a diagnózis magyarázatát. 

A gép rámutatott a döntését befolyásoló fő tényezőkre, és megmagyarázta az adott 
esetben jelentkező tünetek bonyolult kölcsönhatását. A szakember végül egyetértett 


a programmal. 


Logisztikai tervkészítés: 1991-ben, az Öböl-válság idején az amerikai haderő auto- 
matikus logisztikai tervkészítésre és a szállítás ütemezésére egy DART - Dynamic 
Analysis and Replanning Tool - nevű rendszert alkalmazott. A rendszer működése 
egyidejűleg 50 ezer (teher- és személyszállító-) járműre terjedt ki, figyelembe vette a 
kiindulási és célállomásokat, útvonalakat és az összes paraméter közötti konfliktus- 
feloldást is. MI-technikák révén a terv órák alatt kész volt, szemben a heteket igénylő 
korábbi megoldásokkal. A Védelmi Kutatási Ügynökség (Defense Advanced Research 
Project Agency, DARPA) közleménye szerint, csupán ezen egyetlen alkalmazás kap- 
csán megtérült a DARPA által 30 éven keresztül az MI-re fordított befektetés. 





Robotika: A mikrosebészetben manapság sok sebész robotsegédekre támaszkodik. 
A HipNav rendszer, miután számítógépes látási technikák segítségével létrehozta a pá- 
ciens belső anatómiájának háromdimenziós modelljét, robotszabályozással irányítja a 
csípőprotézis behelyezését (DiGioia és társai, 1996). 


Nyelvmegértés és problémamegoldás: A PROVERB rendszer a legtöbb embernél 
jobb keresztrejtvényfejtő (Littman és társai, 1999). Ehhez rendelkezik a lehetséges 
megfejtő szavakra vonatkozó korlátozásokkal, a régebbi keresztrejtvények nagy adat- 
bázisával és sokféle információs forrással, szótárakat és az olyan online adatbázisokat 
is beleértve, mint mozicímlisták a bennük szereplő színészekkel. Így például képes meg- 
állapítani, hogy a ,.Nice Story" meghatározás megoldása , ETAGE", mert az adatbázi- 
sában , Story in France/ETAGE" meghatározás/megoldás pár szerepel, és felismeri, 
hogy a , Nice X" és , X in France" mintáknak sokszor azonos a megoldása. A program 
természetesen nem tudta, hogy Nice egy város Franciaországban. a keresztrejtvényt még- 
is képes volt megoldani. !§ 

Fentiek csupán példák a ma létező mesterséges intelligencia rendszerekre. Nem má- 
gia vagy sci-fi — inkább tudomány, technika és matematika, amihez bevezetőt nyújt ez 
a könyv. 


18 Az ilyen és hasonló helyeken, ahol a könyv szerzője igazán csak angolul értelmes szófordulatokkal illuszt- 
rálja a mondanivalóját, az üzenet érdekében meghagyjuk a szavak eredeti angol formáját. (A lektor) 
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1.5. ÖSSZEFOGLALÁS 


Ebben a fejezetben definiáltuk az MI-t és áttekintettük az MI fejlődésének kulturális 
hátterét. A legfontosabb gondolatok közül néhány: 


. Az egyes emberek különböző módon vélekednek az ML-ről. A két fontos felteendő 
kérdés az, hogy: a gondolkodás vagy a viselkedés az, ami Önt érdekli? Embereket 
akar modellezni, vagy egy idealizált megközelítést választ? 

s Ebben a könyvben azt a nézetet fogadjuk el, hogy az intelligencia lényegében a racio- 
nális cselekvéssel kapcsolatos. Egy intelligens ágens, ideális esetben, az adott szítu- 
ációban a legjobb cselekvéshez folyamodik. Az ilyen értelemben vett intelligens 
ágensek építési problémáit fogjuk tanulmányozni. 

e A filozófusok (i. e. 400-ig visszamenőleg) tették lehetővé az MI kialakulását azál- 
tal, hogy felvetették: az elme bizonyos értelemben gépszerű, hogy valamilyen belső 
nyelvezetben kódolt tudásanyagon operál, és hogy a gondolat a helyes cselekvés 
megválasztásának eszköze. 

s. A matematikusok megadták a logikailag biztos, valamint a bizonytalan valószínűségi 
állítások manipulálásának eszközét. Megadták annak az alapjait is, hogy megértsük 
a számításokat és az algoritmusokról következtetbessünk. 

. A közgazdászok formalizálták a döntéshozatal folyamatát, hogy a döntéshozónak 
maximális várható hasznot biztosítson. 

s A pszichológusok megerősítették azt a gondolatot, hogy az ember és az állatok 
információprocesszáló gépezetnek tekinthetők. A nyelvészek azt mutatták ki, hogy 
a nyelvhasználat ezzel a modellel összhangban van. 

s A számítógép-technika biztosította az MI alkalmazását lehetővé tevő , műterméket". 
Az MI-programok nagyok, a működésük lehetetlen lenne a memóriának és a sebes- 
ségnek a számítógépes ipar biztosította nagyfokú fejlődése nélkül. 

a Az MI történetében voltak sikeres időszakok, de megtalálhatók a téves optimizmus 
És a lelkesedés, valamint a finanszírozás elapadása következtében beálló hanyatlás 
ciklusai is. Voltak időszakok, amelyek során új kreatív megközelítések bevezetése 
És a legjobb ötletek szisztematikus finomítása történt meg. 

. Az MI fejlődése az utolsó évtizedben a tudományos módszereknek a kísérletezésben 
És a megközelítések összehasonlításában való szélesebb körű alkalmazása következ- 
tében felgyorsult. 

. Az intelligencia elméleti alapjainak megértésében bekövetkezett jelenlegi fejlődés 
kéz a kézben együtt járt a valós rendszerek képességeinek javulásával. Az MI egyes 
részterületei jobban integrálódtak, és az MI és más tudományágak megtalálták a kö- 
zös alapjukat. 


Irodalmi és történeti megjegyzések 


Herb Simon a The Science of the Artificial c. műben tárgyalja az MI módszertani stá- 
tusát (Simon, 1981). A mű azokat a kutatási területeket tárgyalja, amelyek bonyolult 
műtermékekkel kapcsolatosak. Azt ís bemutatja, hogy hogyan lehet az MI-t mind mate- 
matikának, mind tudománynak látni. Cohen (Cohen, 1995) áttekinti az MI kísérleti 
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technológiáját. Ford és Hayes (Ford és Hayes. 1995) pedig a Turing-teszt hasznossá- 
gáról fejtik ki a véleményüket. 

Az MI filozófiai és gyakorlati problémáiról olvasmányos áttekintést ad John Hauge- 
land Arrificial Intelligence: The Very Idea c. műve (Haugeland, 1985). A kognitív tudo- 
mányról néhány újkeletű forrás (Johnson-Laird, 1988; Stiljings és társai, 1995; Thagard, 
1996) és az Encyclopedia of the Cognitíve Sciences (Wilson és Keil, 1999) adnak jó 
leírást. A modern nyelvészet szintaktikai aspektusát (Baker, 1989), szemantikai aspek- 
tusát pedig (Chierchia és McConnell-Ginet, 1990) mutatja be jól. A számítógépes nyel- 
vészettel Jurafsky és Martin (Jurafsky és Martin. 2000) foglalkoznak. 

Az MI-kutatások kezdetétől a Feigenbaum és Feldman Computers and Thought (Fei- 
genbaum és Feldman, 1963) és a Minsky Semantic Information Processing (Minsky, 
1968) című művekben, továbbá a Donald Michie által szerkesztett Machine Intelli- 
gence sorozatban lehet olvasni. Webber és Nilsson (Webber és Nilsson, 1981) és Luger 
(Luger, 1995) nagy hatású cikkekből állítottak össze antológiákat. A Neurocomputing 
(Anderson és Rosenfeld, 1988) a neurális hálókkal foglalkozó korai cikkek gyűjtemé- 
nye. Az Encyclopedia of AI (Shapiro. 1992) majdnem minden MI-témáról tartalmaz 
egy áttekintő cikket. Ezek a cikkek általában jó kiindulópontok az egyes témakörök ku- 
tatásával foglalkozó irodalomhoz. 

A legfrissebb munkák a nagyobb MI-konferenciák — a kétévente megrendezett Inter- 
national Joint Conference on AI (IJCAJ), az évenkénti European Conference on AI 
(ECAD) és a támogató szervezetről AAAI-ként ismert évenkénti National Conference 
on AI - kiadványaiban találhatók meg. Az MI általános kérdéseivel foglalkozó fő 
folyóiratok az Artificial Intelligence, a Computational Intelligence, az IEEE Transactions 
on Pattern Analysis and Machine Intelligence, az IEEE Intelligent Systems és az elektro- 
nikus formában megjelenő Journal of Artificial Intelligence Research. Sok. speciális te- 
rületekkel foglalkozó folyóirat és konferencia is létezik, ezekről azonban a megfelelő 
fejezetekben lesz szó. Az MI fő szakmai szervezetei az American Association for Arti- 
ficial Intelligence (AAAD), az ACM Special Interest Group in Artificial Intelligence 
(SIGART) és a Society for Artificial Intelligence and Simulation of Behaviour (AISB). 
Az AAAI AI Magazine-ja sok áttekintő és tematikus cikket publikál, az aaai.org web- 
oldala pedig híreket és háttérinformációkat tartalmaz. 





Feladatok 


Az alábbi gyakorlópéldáknak az a rendeltetése, hogy vitát stimuláljanak. Néhány közü- 
lük féléves házi feladatnak is alkalmas. E feladatokat már most megkísérelhetik meg- 
oldani és később, a könyv olvasását befejezve, e próbálkozásokat megismételhetik. 


1.1. Saját szavaival definiálja: (a) az intelligencia, (b) a mesterséges intelligencia, (c) 
az ágens fogalmakat. 


Olvassa el Turing eredeti cikkét az MI-ről (Turing, 1950). A cikkben Turing 
a célkitűzésével és az imtelligenciatesztjével kapcsolatos potenciális kifogásokat 
tárgyalja. Melyik kifogásnak van még ma is súlya? Érvényesek-e a cáfolatai? 
E! tud képzelni más kifogásokat is, amelyek a cikk megírását követő fejlődés- 
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1.8. 


1.9. 


1. BEVEZETÉS 


ből adódnak? Turing a cikkében azt jósolja, hogy 2000-ben egy számítógépnek 
3090-os esélye lesz, hogy teljesítsen egy 5 perces Turing-i -tesztet egy nem kép- 
zett kérdezővel szemben. Ésszerűnek gondolja ezt? És mondjuk 50 év múlva? 


Minden évben Loebner-díjjal jutalmazzák azt a programot, amely a Turing-teszt 
egy bizonyos verzióját legjobban képes teljesíteni. Kutassa fel a Loebner-díj 
legújabb győztesét és számoljon be róla. Milyen technikákra támaszkodik ez a 
megoldás? Milyen hatással lehet ez az MI jelenlegi helyzetére? 


A problémáknak vannak olyan jól ismert osztályai, amelyek egy számítógép 
számára kezelhetetlenül nehezek, más osztályok viszont számítógépen bizonyít- 
hatóan nem dönthetők el. Azt jelenti-e ez, hogy az MI lebetetlen? 


Tegyük fel, hogy Evans ANALOGY programját úgy fejlesztjük tovább, hogy a 
standard IO-tesztnél 200 pontot érjen el. Lesz-e akkor egy olyan programunk, 
ami intelligensebb az embernél? Magyarázza meg a válaszát! 


Hogyan lehetséges, hogy az önelemzés — valakinek a saját gondolatairól szóló 
beszámolója — pontatlan? Tévedhetek arról, amit gondolok? Vitassa meg! 


Tanulmányozza az MI-irodalmat, hogy eldönthesse, az alábbi feladatokat jelen- 
leg meg lehet-e oldani számítógépen: 

(a) Egy színvonalas tenisz- (pingpong-) játszma. 

(b) Autóvezetés Kairó központjában. 

(c) Heti élelmiszer-vásárlás a piacon. 

(d) Heti élelmiszer-vásárlás a világhálón. 

(e) Elfogadható bridzsparti versenyszinten. 

(f) Új matematikai tételek felfedezése és bizonyítása. 

(g) Szándékosan humoros történet írása. 

(h) Kompetens jogi tanácsadás egy specializált jogi területen. 

(1) Beszélt angol nyelv valós időben történő fordítása beszélt svéd nyelvre. 
() Egy bonyolult sebészeti beavatkozás levezetése. 

A ma még nem megvalósítható feladatok esetén próbálja azonosítani a nehézsé- 
geket, és megbecsülni, hogy mikorra tervezhető azok megoldása. 


Néhány szerző azt állította. hogy az érzékelés és a motorikus képességek az intel- 
ligencia legfontosabb komponensei, és hogy a , magasabb szintű" képességek 
szükségszerűen parazita jellegűek — adalékok az alattuk levő képességekhez. Nyil- 
vánvaló, hogy az evolúció zöme és az agy nagy része az érzékeléssel és a motori- 
kus képességekkel foglalkozik. Az MI pedig a játék vagy logikai következtetés 
jellegű feladatokat a valós világban való érzékelésnél és cselekvésnél sok szem- 
pontból könnyebbnek találta. Nem gondolja-e, hogy az MI-nek a magasabb szintű 
kognitív képességekre irányuló hagyományos összpontosítása téves célkitűzés? 


Az evolúció miért eredményezett racionálisan cselekvő rendszereket? Milyen 
célokat hivatottak az ilyen rendszerek teljesíteni? 
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1.10. Racionálisak-e a reflexszerű cselekvések (mint például a forró tűzhelytől el- 
rántani a kezet)? Intelligensek-e? 


1.11. , Egy számítógép nem lehet intelligens — csak azt teszi, amit a programozó mond 
neki." Igaz-e az állítás második része, és vajon implikálja-e az elsőt? 


1.12. , Az állatok nem lehetnek intelligensek — csak azt teszik, amit a génjeik monda- 
nak nekik." Igaz-e az állítás második része, és vajon implikálja-e az elsőt? 


1.13. ,Az állatok, az emberek és a számítógépek nem lehetnek intelligensek — csak azt 
teszik, amit a részüket alkotó atomoknak a fizika törvényei parancsolnak." Igaz-e 
az állítás második része, és vajon implikálja-e az elsőt? 


2. INTELLIGENS ÁGENSEK 


Ebben a fejezetben az ágensek természetét, legyen az tökéletes vagy sem, a környezetek 
különbözőségét és az ágenstípusok ezekből származó sokféleségét tárgyaljuk. 


Az 1. fejezet a racionális ágens (rational agent) fogalmát úgy vezette be, mint 
a mesterséges intelligencia tárgyalásának általunk választott központi módszerét. 
Ebben a fejezetben pontosítjuk ezt a koncepciót. Látni fogjuk. hogy a racionalitás kon- 
cepciója az ágensek széles körére alkalmazható mindenféle elképzelhető környezetben. 
Az a tervünk a könyvben, hogy ezt a koncepciót néhány olyan tervezési elv megfogal- 
mazásához használjuk, amelyekkel sikeres ágenseket építhetünk — olyan rendszereket, 
melyek joggal hívhatók intelligensnek. 

Ágensek, környezetek és a köztük lévő kapcsolatok vizsgálatával kezdünk. Annak 
megfigyelése, hogy egyes ágensek jobban viselkednek, mint mások, a racionális ágens 
ötletéhez vezet majd — olyan ágenshez, amelyik olyan jól viselkedik, amennyire csak 
lehet. Az, hogy mennyire viselkedhet jól egy ágens, a környezet természetén múlik; 
bizonyos környezetek sokkal nehezebbek, mint mások. A környezetek nagyjábóli cso- 
portosításával megmutatjuk, hogy egy környezet tulajdonságai hogyan befolyásolják 
a környezetnek megfelelő ágensek tervezését. Bemutatunk számos egyszerű ágens- 
tervezési , csontvázat", melyeket a könyv hátralevő fejezeteiben tovább részletezünk. 


2.1. BEVEZETÉS 


Egy ágens (agent) bármi lehet, amit úgy tekinthetünk, mint ami az érzékelői (sensors) 
segítségével érzékeli a környezetét (environment), és beavatkozói (actuators) segít- 
ségével megváltoztatja azt. A 2.1. ábra ezt az egyszerű elképzelést szemlélteti. AZ em- 
beri ágensnek van szeme, füle és egyéb szervei az érzékelésre, és keze, lába, szája és 
egyéb testrészei a beavatkozásra. A robotágens kamerákat és infravörös távolsági kere- 
sőket használ érzékelőként, és különféle motorokat beavatkozóként. A szoftverágens 
billentyűleütéseket, fájltartalmakat és hálózati adatcsomagokat fogad érzékelőinek be- 
meneteként, és képernyőn történő kijelzéssel. fájlok írásával. hálózati csomagok küldé- 
sével avatkozik be a környezetébe. Azzal az általános feltételezéssel fogunk élni. hogy 
minden ágens képes saját akcióinak érzékelésére (de nem mindíg látja azok hatását). 

Az érzékelés (percept) fogalmat használjuk az ágens érzékelő bemeneteinek leírá- 
sára egy tetszőleges pillanatban. Egy ágens érzékelési sorozata (percept seguence) az 
ágens érzékeléseinek teljes története, minden, amit az ágens valaha is érzékelt. Általá- 
nosságban, egy adott pillanatban egy ágens cselekvése az addig megfigyelt teljes érzé- 
kelési sorozatától függhet. Ha az összes lehetséges érzékelési sorozathoz meg tudjuk 
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Ágens 











2.1. ábra. Az ágensek környezetükkel érzékelőkön és beavatkozókon keresztül állnak kapcsolatban 


határozni az ágens lehetséges cselekvéseit, akkor lényegében mindent elmondtunk az 
ágensről. Matematikailag megfogalmazva azt mondhatjuk, hogy az ágens viselkedését 
az ágensfüggvény (agent function) írja le, ami az adott érzékelési sorozatot egy cse- 
lekvésre képezi le. 

Elképzelhetjük táblázatos formában az ágensfüggvényt, amely forma mindenféle 
ágenst leír; az ágensek többségére ez igen nagy táblázatot jelentene — valójában vég- 
telen nagyot, hacsak nem korlátozzuk a figyelembe veendő érzékelési sorozatok 
hosszát. Ha adott egy ágens, amivel kísérletezhetünk, akkor elméletileg megalkothat- 
juk ezt a táblázatot az összes lehetséges érzékelési sorozat kipróbálásával és az ágens 
válaszul végrehajtott cselekvéseinek feljegyzésével.! Természetesen a táblázat az 
ágens külső jellemzése. Egy mesterséges ágens belsejében az ágensfüggvényt egy 
ágensprogram (agent program) valósítja meg. Fontos, hogy megkülönböztessük e 
két dolgot. Az ágensfüggvény egy absztrakt matematikai leírás, az ágensprogram egy 
konkrét implementáció, amely az ágens architektúráján működik. 

Ezen ötletek illusztrálására egy igen egyszerű példát fogunk használni — a 2.2. ábrán 
látható porszívóvilágot. A világ annyira egyszerű, hogy mindent le tudunk írni, ami meg- 
történik. továbbá ez egy kitalált világ, így sokféle variációt kitalálhatunk. A világban 
csak két helyszín van: az A és B négyzetek. A porszívóágens észleli, hogy melyik négy- 
zetben van, valamint azt, hogy van-e ott piszok, vagy nincs. Lehetséges akciói: mozog- 
hat balra vagy jobbra, felszívhatja a port, valamint nem csinál semmit. Egy egyszerű 
ágensfüggvény a következő: ha az akmális négyzet koszos, szívd fel a koszt, egyébként 
menj át a másik négyzetbe. Ezen ágensfüggvény táblázatának egy részlete a 2.3. ábrán 
látható. Egy, az ágensfüggvényt megvalósító egyszerű ágensprogramot a fejezet későbbi 
részében, a 2.8. ábrán mutatunk be. 


1 Amennyiben az ágens cselekvésének kiválasztásában a véletlennek is szerepe van, úgy minden sorozatot 
többször kellene kipróbálnunk, hogy az egyes cselekvések valászínűségeit meghatározhassuk. Látszólag úgy 
tűnhet, hogy véletlenszerűen cselekedni botorság, a későbbiekben azonban látni fogjuk, hogy ez lehet nagyon 
intelligens viselkedés is. 
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2.2. ábra. A porszívóvilág mindössze két helyszínnel 








! Érzékelési sorozat Cselekvés 
[A Tiszta) Jobbra 
[A, Piszkos) Felszívás 
(B, Tisztal Balra 
(B, Piszkos] Felszívás 
(A, Tiszta), [A, Tiszta) Jobbra 
(A, Tiszta), (A, Piszkos) Felszívás 
(A, Tiszta). (A, Tiszta), (A. Tiszta) Jobbra 
IA, Tiszta), (A, Tiszta), [A, Piszkos] Felszívás 











2.3. ábra. A 2.2. ábrán szereplő porszívóvilág egy egyszerű ágensfüggvénye részleges táblázatos formában 


A 2.3. ábrára nézve láthatjuk, hogy sokféle porszívóvilág-beli ágens definiálható 
egyszerűen a jobb oldali oszlop különböző kitöltésével. Ezék után a nyilvánvaló kérdés 
a következő: Mi a táblázat helyes kitöltésének módja? Más szavakkal, mitől lesz egy 
ágens jó vagy rossz, intelligens vagy buta. Ezeket a kérdéseket a következő részben 
fogjuk megválaszolni. 

Mielőtt lezárnánk ezt a részt, fontos megjegyeznünk, hogy az ágens fogalom beveze- 
tésének a célja nem a világ ágensekre és nem ágensekre történő felosztása, hanem egy 
olyan eszköz megteremtése, amivel rendszereket elemezhetünk. Egy kézi számológép 
is tekinthető ágensnek, amely azt a cselekvést választja, hogy ,,4"-et ír a kijelzőjére, ha 
242" érzékelési sorozatot kap, de egy ilyen felfogás aligha segít minket a számoló- 
gép megértésében. 


2.2. JÓ VISELKEDÉS: A RACIONALITÁS KONCEPCIÓJA 


Egy racionális ágens (rational agent) olyan, amely helyesen cselekszik — elméletileg 
megfogalmazva az ágensfüggvény táblázatában minden bejegyzés helyesen van kitölt- 
ve. Helyesen cselekedni nyilvánvalóan jobb, mint helytelenül, de mit is jelent helyesen 
cselekedni? Első közelítésben azt mondjuk, hogy a helyes cselekedet az, amely az 
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ágenst a legsikeresebbé teszi. Tehát szükségünk lesz egy módszerre, amivel a sikeresség 
mérhető. A környezetnek, valamint az ágens érzékelőinek és beavatkozóinak leírásával 
együtt ez az ágens feladatát teljes mértékben specifikálja. Ezáltal precízebben definiál- 
hatjuk, mit is jelent racionálisnak lenni. 


Teljesítnénymértékek 


A teljesítnénymérték (performance measure) testesíti meg az ágens sikerességének 
kritériumát. Ha egy ágenst elhelyezünk a környezetében, akkor cselekvések sorozatá- 
val válaszol az érzékeléseire. A cselekvések sorozatának hatására a környezet állapo- 
tok sorozatán halad végig. Ha ez a sorozat kívánatos, akkor az ágens jól teljesített. 
Nyilvánvalóan nincs egyetlen olyan rögzített mérték, amely minden ágens számára 
megfelelő lenne. Megkérdezhetjük az ágens szubjektív véleményét, hogy mennyire 
érzi magát elégedettnek a saját teljesítményével, de egyes ágensek képtelenek lesznek 
válaszolni, míg mások becsapják magukat.? Ezért valamilyen objektív teljesítmény- 
mértékhez fogunk ragaszkodni, tipikusan egy olyanhoz, amit az ágens tervezője hatá- 
rozott meg. 

Példaként tekintsünk az előző részben megismert porszívó ágenst. Teljesítménymér- 
tékként javasolhatjuk az egy nyolcórás műszakban feltakarított por mennyiségét. Egy 
racionális ágenssel, természetesen, az ember azt kapja, amit kér. Azaz a racionális ágens 
azzal maximalizálhatja ezt a teljesítménymértéket, hogy feltakarítás után kiönti a szeme- 
tet, majd újra feltakarítja és így tovább. Egy finomított mérték a tiszta padló elérését 
díjazná. Például minden tiszta négyzet egy pontot érhet minden időlépésben (talán vala- 
milyen levonással figyelembe véve az elfogyasztott elektromos energiát, illetve a kel- 
tett zaj mennyiségét is). Általános szabályként megfogalmazható, hogy a teljesítmény- 
mértéket jobb aszerint megállapítani, hogy mit akarunk elérni a környezetben, mint 
aszerint, hogy miképp kellene az ágensnek viselkednie. 

A teljesítnménymérték kiválasztása nem mindig könnyű. Például a , tiszta padló" előző 
paragrafusbeli fogalma a tisztaság időátlagán alapul. Még ugyanaz az átlagos tisztaság 
is elérhető két különböző ágenssel, az egyik közepes aktivitással dolgozik állandóan, 
míg a másik energikusan rövid ideig. aztán hosszú szüneteket tart. Hogy melyik a ja- 
vasolt módszer, az látszólag a házvezetés tudományának kérdése, valójában egy mély 
filozófiai kérdés, messzibe mutató következményekkel. Mi a jobb: a túlzások vakmerő 
világa vagy a biztonságos, de unalmas létezés? Mi a jobb: egy gazdaság, ahol minden- 
ki egyformán mérsékelten szegény, vagy egy másik, ahol vannak nagyon gazdagok és 
nagyon szegények? Ezen kérdések megválaszolását házi feladatként bízzuk a szorgal- 
mas olvasóra. 


2 Az emberi ágensekre különösen jellemző a , savanyú a szőlő" effektus — azaz hogy nem is akarják igazán 
azt, amit nem sikerült megkapniuk, mint például: ,.Nos, sebaj, nem is akartam annyira azt a buta Nobel-díjat". 
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Racionalitás 
Négy dolgon múlik az, hogy egy adott pillanatban mi racionális. Ezek: 


s A siker fokát mérő teljesítménymérték. 

e Az ágens eddigi tudása a környezetről. 

s A cselekvések, amiket az ágens képes végrehajtani. 
s Az ágens érzékelési sorozata az adott pillanatig. 


Ez elvezet a racionális ágens (rational agent) definíciójáboz: 

Az ideális racionális ágens minden egyes észlelési sorozathoz a benne található tények 
és a beépített tudása alapján minden elvárható dolgot megtesz a teljesítnménymérték 
maximalizálásáért. 

Vizsgáljuk meg az egyszerű porszívóágenst, amelyik megtisztítja a négyzetet, ha az 
koszos, és átmegy a szomszédos négyzetbe, ha nem az! Az ágensfüggvényt tábláza- 
tosan a 2.3. ábra adja meg. Ez egy racionális ágens? Attól függ! Először is, meg kell 
mondanunk mi a teljesítménymérték, mit tudunk a környezetről, és milyen érzékelői és 
beavatkozói vannak az ágensnek. Tegyük fel a következőket: 


s A teljesítménymérték egy ponttal jutalmaz minden tiszta négyzetet minden idő- 
pillanatban egy 1000 időpillanatból álló , élettartam" alatt. 

s A környezet , geográfiája" a priori ismert (2.2. ábra), de a piszok eloszlása és az 
ágens kezdeti pozíciója nem. A tiszta négyzetek tiszták maradnak, a felszívás pedig 
megtisztítja az aktuális négyzetet. A Balra és Jobbra cselekvések balra és jobbra 
mozgatják az ágenst, kivéve ha ezzel kikerülne a környezetből, mely esetben az 
ágens nem mozdul. 

s A következő cselekvések léteznek: Balra, Jobbra, Szív és Semmittevés (azaz nem 
tesz semmit sem). 

s Az ágens helyesen észleli jelenlegi helyzetét és azt, hogy van-e ott kosz. 


Azt állítjuk, hogy ezen feltételek mellett az ágens igenis racionális: a várható teljesítmé- 
nye legalább annyira jó, mint bármely más ágensé. A 2.4. feladatban azt kérjük majd, 
hogy ezt az állítást bizonyítsa be. 

Könnyen belátható, hogy ugyanez az ágens más körülmények között irracionális len- 
ne. Például ha minden koszt feltakarított, akkor szükségtelenül oszcillálni fog ide-oda; 
ha a teljesítménymérték tartalmaz egy büntetőpontot minden balra vagy jobbra történő 
mozgásért, akkor az ágens egészen gyengén teljesít. Egy jobb ágens abban az esetben, 
ha meggyőződött arról, hogy az összes négyzet tiszta, nem csinálna semmit. Ha a tisz- 
ta négyzetek ismét koszossá válhatnak, az ágensnek időnként ellenőriznie kellene őket, 
és kitakarítania, ha szükséges. Ha a környezet geográfiája ismeretlen, az ágensnek fel 
kell térképeznie ahelyett, hogy az A és B négyzetekhez köti magát. A 2.4. feladatban azt 
kérjük majd, hogy tervezzen ezekre az esetekre ágenseket. 
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Ügyelnünk kell a racionalitás és a mindentudás (omniscience) különválasztására. 
Egy mindentudó ágens tudja cselekedetei valódi kimenetelét, és ennek megfelelően 
cselekedhet, de a gyakorlatban a mindentudás lehetetlen. Vegyük a következő példát: 
egy nap a Nagykörúton sétálok és egy régi barátomat látom az út túloldalán közeledni. 
Az úton nincs forgalom, és ráérek, így — racionális lévén - elindulok a másik oldalra. 
Mindeközben 5000 kilométer magasan egy utasszállító repülőgép raktárajtaja leesik,? 
és mielőtt még átérék az út túloldalára, rám esik és kilapít. Irracionális voltam, ami- 
kor át akartam kelni az úton? Valószínűtlen, hogy a gyászjelentésem így fog szólni: 
egy idióta megpróbált keresztülmenni az utcán". 

Ez a példa azt mutatja, hogy a racionalitás nem azonos a tökéletességgel. A racionali- 
tás az elvárt teljesítményt maximalizálja. míg a tökéletesség a tényleges teljesítményt. 
Az, hogy elállunk az ágensekkel szemben támasztott tökéletesség követelményétől, 
nem csak a velük szembeni méltányosság kérdése. Az a helyzet, hogy ha azt a cselek- 
vést várjuk el egy ágenstől, ami a megtörténte után a legjobbnak bizonyul, akkor lehe- 
tetlen lesz egy ilyen ágens megalkotása — hacsak nem javítjuk a kristálygömbök vagy 
az időgépek teljesítményét. 

Ezek alapján a racionalitás definíciónk nem követel mindentudást, hiszen a racionális 
választás csak az adott pillanatig felépített érzékelési sorozattól függ. Azt is biztosíta- 
nunk kell, hogy tudtunk nélkül se engedjük meg az ágensnek, hogy tudatosan unintelli- 
gens cselekvésbe kezdjen. Például ha egy ágens nem néz körül mindkét irányban, 
mielőtt egy forgalmas utat keresztez, akkor az érzékelési sorozata nem fogja neki meg- 
mondani, hogy egy hatalmas kamion közeledik nagy sebességgel. Azt mondja-e a ra- 
cionalitás definíciónk, hogy ebben az esetben rendben átkelhet az úton? Egyáltalán 
nem! Először is, az útkeresztezés nem lenne racionális ezen információszegény észle- 
lési sorozat mellett: az átkelés szétnézés nélkül túlságosan rizikós. Másodszor, egy ide- 
ális racionális ágensnek a , szétnézés" cselekvést kellene választania az útra lépés előtt, 
mivel ez segíti a teljesítmény maximalizálásában. A hasznos információk beszerzése ér- 
dekében véghezvitt — általában információgyűjtésnek (information gathering) hívott 
- cselekedetek a racionalitás fontos részét jelentik, részletesebben a 16. fejezetben lesz 
szó róluk. Az információgyűjtés másik példáját a felfedezés (exploration) szolgáltatja. 
amit egy porszívóágensnek egy ismeretlen környezetben meg kell tennie. 

Definíciónk nemcsak azt követeli meg a racionális ágenstől, hogy információt 
gyűjtsön, hanem azt is, hogy amennyit csak lehet tanuljon (learn) a megfigyeléseiből. 
Az ágens kezdeti konfigurációja valamilyen előzetes tudást tükrözhet a környezetről, de 
ahogy az ágens tapasztalatot szerez, ez a tudás módosulhat és átértékelődhet. Vannak 
szélsőséges esetek, amikor a környezet a priori teljesen ismert. Ilyen esetekben az 
ágensnek nem kell érzékelnie vagy tanulnia, egyszerűen csak helyesen cselekszik. Ter- 
mészetesen az ilyen ágensek nagyon sérülékenyek. Vegyük például az egyszerű ganaj- 
túró bogarat. Miután kiásta a fészkét és elhelyezte a tojásait, a közeli halomból egy 
ganajlabdát készít, hogy elzárja a fészek bejáratát. Ha útközben a labdát eltávolítjuk a 
fogói közül. a bogár folytatja útját, és a nem létező labdával is eljátssza a fészek lezárását, 


3 Lásd N. Henderson: Sürgősen új ajtózárakat a Bocing 747 jumbo jetek számára. Washington Post, 1989. 
augusztus 24. 
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miközben észre sem veszi, hogy a labda hiányzik. Az evolúció beépített egy feltételezést 
a bogár viselkedésébe, és amikor ez megsérül, sikertelen viselkedés lesz az eredménye. 
Kicsit intelligensebb a szöcskeölő darázs. A nőstény ás egy lyukat, keres és megcsíp egy 
hernyót, elcipeli a lyukhoz, bemegy a lyukba megnézni, hogy minden rendben van-e, 
majd bevonszolja a hernyót és lerakja a tojásait. A hernyó szolgál a tojások kikelése után 
táplálékul. Eddig jó, de ha egy rovarkutató pár centiméterrel odébb rakja a hernyót, mi- 
közben a darázs a lyukat ellenőrzi, az visszalép a hernyó odacipelése fázishoz, és a ter- 
vét változtatás nélkül folytatja onnan, akár tucatnyi hernyóelmozdító közbelépés után is. 
A darázs képtelen megtanulni, hogy öröklött terve hibás, így nem fogja megváltoztatni. 

A sikeres ágensek három különböző periódusra bontják az ágensfüggvény kiszámí- 
tásának feladatát: amikor az ágenst tervezik, a számítás egy részét tervezőik végzik; 
amikor megfontolja a következő cselekvését, az ágens további számításokat végez; és 
amikor tanul a tapasztalataiból, még további számításokat végez annak eldöntésére, 
hogy hogyan módosítsa a viselkedését. 

Addíg a szintig, míg az ágens a tervezői által beépített tudásra épít és nem saját meg- 
figyeléseire, azt mondjuk, hogy az ágens nem autonóm (autonom). Egy racionális 
ágensnek autonómnak kell lennie — mindent, amit csak megtanulhat, meg kell tanulnia 
ahhoz, hogy a hiányos vagy hibás előzetes tudását kornpenzálja. Például az a porszívó- 
ágens, amelyik megtanulja előrelátni, hogy hol és mikor tűnik fel további szemét, job- 
ban fog dolgozni, mint amelyik nem. Praktikus okból ritkán kell teljes autonómiát 
biztosítani már a kezdetektől: amikor egy ágensnek nincs tapasztalata, vagy csak kevés 
van, akkor véletlenszerűen kellene cselekednie, hacsak a tervezője nem ad valamilyen 
segítséget. Így, mint ahogy az evolúció ellátja az állatokat elegendő beépített reflexszel 
a túléléshez addig, míg saját maguk is megtanulják mindazt, ami a túléléshez szükséges, 
a mesterséges intelligens ágensek kezdő tudással és tanulási képességgel való ellátása is 
ésszerű lenne. Miután elegendő tapasztalatot szerzett a környezetéről, a racionális ágens 
viselkedése gyakorlatilag függetlenné válhat a beépített előzetes tudásától. Ily módon a ta- 
nulás alkalmazásával olyan ágens tervezhető, amely sokféle környezetben is sikeres lesz. 


2.3. A KÖRNYEZETEK TERMÉSZETE 


Most, hogy már rendelkezünk a racionalitás definíciójával, már majdnem készen állunk 
gálnunk a feladatkörnyezeteket (task environments), amelyek lényegében a , problé- 
mák", amelyekre a racionális ágensek jelentik a , megoldásokat". Először azt mutatjuk 
meg, hogyan kell a feladatkörnyezetet meghatározni, több példával illusztrálva a fo- 
lyamatot. Ezek után megmutatjuk, hogy többféle feladatkörnyezet létezik. A környezet 
típusa közvetlenül befolyásolja az ágensprogram megfelelő tervezését. 


A környezet meghatározása 
Az egyszerű porszívóágens racionalításának vizsgálatakor specifikálnunk kellett egy 


teljesítménymértéket, a környezetet és az ágens beavatkozóit és érzékelőit. Mindezeket 
a feladatkörnyezet (task environment) címszó alatt fogjuk egyesíteni. A betűszavak- 
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Ágenstípus ]  Teljesítménymérték Környezet Beavatkozók Érzékelők 
Taxisofőr Biztonságos, gyors, Utak, egyéb. ] Kormány, gáz, ] Kamerák, 
törvényes, kényelmes forgalom, fék, index, kürt, hangradar, 

utazás, maximális haszon [ gyalogosok, — ] kijelző sebességmérő, 

ügyfelek GPS (műholdas 

pozicionáló), 

kilométeróra, 

motorérzékelők, 

billentyűzet 

















2.4. ábra. Egy automatizált taxi feladatkörnyezetének TKBÉ-leírása 


ban gondolkodók számára ezt FKBÉ - Teljesítmény, Környezet, Beavatkozók. Ér- 
zékelők (Performance, Environment, Actuators, Sensors) leírásnak hívjuk. Egy ágens 
tervezése során az első lépésnek mindig a feladatkörnyezet lehető legteljesebb meghatá- 
rozásának kell lennie. 

A porszívóvilág egyszerű példa volt, vegyünk most egy bonyolultabbat: az automa- 
tizált taxisofőr példáját. Ezt a példát fogjuk a fejezet hátralevő részében használni. Ki kell 
emelnünk, mielőtt az olvasó megrémülne, hogy a teljesen automata taxisofőr jelenleg va- 
lamelyest túlmutat a létező technológia lehetőségein. (A 60. oldalon található egy létező 
sofőr robot leírása, de az , Íntellígent Transportation Systems" konferencia legutóbbi 
kiadványait is érdemes megnézni.) A teljes autóvezetési feladat rendkívül nyitott végű. 
Nincs határa a lehetségesen felbukkanó körülmények újszerű kombinációinak — egy 
másik ok arra, hogy ezt válasszuk vizsgálatunk tárgyául. A 2.4. ábra összefoglalja a taxi 
feladatkörnyezetének TKBÉ-leírását. A következőkben részletesen tárgyaljuk az egyes 
elemeket. 

Elsőként: mi az a teljesítménymérték, amit az automata taxisofőrünk elé állítunk? 
Elvárt jellemzők a helyes célállomás elérése; az üzemanyag-fogyasztás és az elhasz- 
nálódás minimalizálása; az út költségének és/vagy idejének minimalizálása; a közleke- 
dési szabályok megszegésének és más vezetők megzavarásának minimalizálása; a biz- 
tonság és utaskényelem maximalizálása; a haszon maximalizálása. Nyilvánvalóan ezen 
célok egy része konfliktusban van egymással, kompromisszumokra lesz szükség. 

A következő: mi a taxi vezetési környezete? Minden taxisofőrnek több típusú út- 
tal kell szembenéznie, a vidéki és városi utaktól egészen a tizenkét sávos autópályá- 
kig. Az utak más forgalommal, gyalogosokkal, kóbor állatokkal, útkarbantartással, 
rendőrautókkal, tócsákkal és gödrökkel is rendelkeznek. A taxinak a lehetséges és a 
jelenlegi utasokkal is kapcsolatban kell állnia. Van továbbá néhány opcionális lehe- 
tőség. Lehet, hogy a taxinak Dél-Kaliforniában kel! üzemelnie, ahol a hó ritkán je- 
lent problémát, vagy Alaszkában, ahol ritkán nem. Közlekedhet mindig az út jobb 
oldalán, vagy szeretnénk, hogy elég rugalmas legyen ahhoz, hogy a bal oldalon is 
vezessen abban az esetben, ha Nagy-Britanniában vagy Japánban akarjuk működtet- 
ni. Nyilvánvalóan minél korlátozottabb a környezet, annál egyszerűbb a tervezési 
probléma. 

Az automata taxisofőr rendelkezésére álló beavatkozók lényegében ugyanazok lesznek, 
amelyek egy emberi vezető számára adottak: a motor vezérlése a gázpedál segítségével, 
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Ágenstípus Teljesítménymértéki "Környezet Beavatkozók Érzékelők 
Orvosi diagnosz- [ Egészséges páciens, / Páciens, kórház, ] Kérdések kijelzése, ] Tünetek, leletek, 
tikairendszer költségek és perek személyzet vizsgálatok, diagnó- páciensek válaszai- 
"minimalizálása, zisok, kezelések, [nak bevitele 
Gészárolók. billentyűzeten 
Műholdas képfel-Í Helyes képkategori- ] Orbitális műhold ] A kép kategorizálá- ) Színes képpont- 
dolgozó rendszer [zálás földi kapcsolata  ] sának kijelzése mátrixok 
Alkatrész-felvevől A helyes tartályok- ! Futószalag alkat- ! Csuklós kar és fogó Kamera, csukló- 
robot ban levő alkatrészek ! részekkel, tartá- szög-érzékelők 
aránya lyok 
Olajfinomító- JA tisztaság. hozam  Finomító. operá- ] Szelepek, pumpák,  ] Hőmérséklet, 
vezérlő És biztonság maxi- ] torok fűtők és kijelzők] nyomás, kémiai 
malizálása érzékelők 
Interaktív angol JA tanulók tesztered-] Tanulók egy Gyakorlatok, javas- ] Billentyűzet bevitel 
tanár ményeinek maxi- csoportja, ől latok és javítások 
malizálása hivatal kijelzése 




















2.5, ábra. Példák ágenstípusokra és TKBÉ-leírásuk 


kormányzás és fékezés. Ezek mellett szükséges egy képernyő vagy beszédszintetizátor 
a kimenet megjelenítéséhez az utasok számára, és valószínűleg valamilyen mód arra, 
hogy más járművekkel kommunikálhasson, udvariasan vagy másképp. 

A vezetési környezetben levő céljai eléréséhez a taxinak tudnia kell, hogy hol van, 
mi más van az úton, és hogy milyen gyorsan halad. Alapvető érzékelői között lenni kell 
ezért egy vagy több vezérelhető tv-kamerának, sebességmérőnek és kilométerórának. 
A jármű helyes irányításához — különösen a kanyarokban — szüksége lesz gyorsulásmé- 
rőre, ezenkívül ismernie kell a jármű mechanikai állapotát, így szüksége lesz a szoká- 
sos motor- és elektromosrendszer-érzékelők rendszerére is. Lehetnek olyan műszerei is, 
amelyek nem érhetők e! az átlagos emberi sofőrök számára: egy műholdas globális 
pozicionáló rendszer (GPS), amely megadja a pontos pozícióját egy elektronikus térké- 
pen, vagy infravörös- és hangradar-érzékelők más autótól és tárgyaktól való távolságok 
érzékelésére. Végül szüksége lesz egy mikrofonra vagy billentyűzetre, aminek a segít- 
ségével az utasok az úti céljukat megadhatják. 

A 2.5. ábrán felvázoltuk az alapvető TKBÉ-elemeket számos további ágenstípusra. 
További példák a 2.5. feladatban jelennek meg. Egyes olvasóink számára meglepő 
lehet, hogy az ágenstípusok listájában olyan programokat is szerepeltetünk, amelyek a 
billentyűzet bemenetének és a karakteres képernyő kimenetének teljesen mesterséges 
környezetében működnek. , igen", mondhatja valaki, ,ez nem egy valódi környezet. 
ugye?". A tény az, hogy nem a , valódi" és a , mesterséges" környezetek közötti különb- 
ségtétel számít, hanem az ágens viselkedése, a környezet keltette érzékelési sorozat, 
valamint a teljesítménymérték közötti viszony komplexitása. Egyes , valódi" környeze- 
tek valójában igen egyszerűek. Például egy robot, amit a futószalagon érkező alkat- 
részek vizsgálatára terveztek, sok egyszerűsítő feltevéssel élhet: a világítás állandó, a 
futószalagon csak általa ismert alkatrészek vannak, és csak két cselekvés létezik (elfo- 
gad vagy elutasít). 
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Ezzel ellentétben bizonyos szoftverágensek (vagy szoftverrobotok, azaz SZOft- 
botok) részletgazdag, korlátok nélküli környezetekben léteznek. Képzeljünk el egy 
szoftbotot, amelyik egy nagy utasszállító gép szimulátorával repül. A szimulátor egy 
részletgazdag, komplex környezet, amelyben más repülőgépekkel kapcsolatos és földi 
műveletek is vannak, és a szoftverágensnek valós időben kell választania az akciók 
széles választékából. Vagy képzeljünk el egy szoftbotot, amelyet internetes hírforrások 
figyelésére terveztek, és az érdekes híreket megmutatja az ügyfeleinek. A helyes mű- 
ködéshez szüksége lesz valamilyen természetes nyelv feldolgozási képességre, meg 
kell tanulnia, hogy melyik ügyfelét mi érdekli, és szüksége lesz a tervei dinamikus meg- 
változtatására — például amikor az egyik hírforráshoz megszűnik a kapcsolata vagy 
amikor egy új forrás létesül. Az internet egy olyan környezet, amelynek komplexitása 
versenyez a fizikai világéval. és amelynek lakói között sok mesterséges ágens van. 





A környezetek tulajdonságai 


Az MI-ben felmerülő feladatkörnyezetek választéka nyilvánvalóan hatalmas. Mindazon- 
által meghatározhatunk viszonylag kevés számú dimenziót, amelyek mentén a feladat- 
környezeteket kategorizálhatjuk. Ezek a dimenziók nagymértékben meghatározzák 
a helyénvaló ágenstervezést és az ágensimplementációk alaptechnikáinak alkalmazha- 
tóságát. Először felsoroljuk a dimenziókat, azután több feladatkörnyezetet elemzünk az 
elképzelések bemutatására. Az itt szereplő definíciók informálisak — a későbbi fejezetek 
sokkal pontosabban fogalmazzák meg a környezeteket, és mindegyik fajtára példákat 
mutatnak majd. 


s Teljesen megfigyelhető (fully observable) vagy részlegesen megfigyelhető 
(partially observable). Ha az ágens szenzorai minden pillanatban hozzáférést 
nyújtanak a környezet teljes állapotához, akkor azt mondjuk, hogy a környezet tel- 
jesen megfigyelhető.! Egy környezet ténylegesen teljesen megfigyelhető, ha az 
érzékelők minden olyan aspektusát észlelik, amelyek a cselekvés kiválasztásához 
relevánsak — a relevancia pedig a teljesítménymértéktől függ. A teljesen meg- 
figyelhető környezetek kényelmesek, mivel az ágensnek nem kell semmilyen bel- 
ső állapotot nyilvántartania a környezet nyomon követéséhez. Egy környezet lehet 
részlegesen megfigyelhető a zajos és pontatlan szenzorok miatt, vagy mivel az 
állapot egyes részei egyszerűen nem szerepelnek a szenzorok adatai között — 
például egy helyi koszérzékelő szenzorral rendelkező porszívóágens nem tudja 
megmondani, van-e piszok más négyzetekben. és egy automata taxi nem láthatja, 
hogy más vezetők mit gondolnak. 

.  Determinisztikus (deterministic) vagy sztochasztikus (stochastic). Amennyiben 
a környezet következő állapotát jelenlegi állapota és az ágens által végrehajtott cselek- 


4 A könyv első kiadása a hozzáférhető  taccessible) és a nem hozzáférhető (inaccessible) kifejezéseket 
használta a teljesen és a részlegesen megfigyelhető (fully és partially observable) helyett; a nemdetermin- 
isztikus (nondeterministic) a sztochasztikus (stochastic) helyett. valamint a nem epizódszerű (nonepisodic) 
a sorozatszerű (seguential) kifejezés helyett szerepelt. Az új terminológia jobban illeszkedik az elterjedt 
gyakorlathoz. 
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vés teljesen meghatározza, akkor azt mondjuk, hogy a környezet determinisztikus, 
egyébként sztochasztikus. Teljesen megfigyelhető, determinisztikus környezetben 
az ágensnek elvben nem kel! a bizonytalansággal törődnie. Amennyiben azonban a 
környezet részlegesen megfigyelhető, úgy sztochasztikusnak rűnhet. Különösen igaz 
ez, ha a környezet összetett, nehezen teszi lehetővé nem megfigyelhető aspektusai- 
nak követését. Így gyakran jobb az ágens szemszögéből determinisztikusnak vagy 
sztochasztikusnak tekinteni egy környezetet. A taxivezetés ebben az értelemben 
nyilvánvalóan sztochasztikus, mivel senki sem tudja megjósolni a forgalmat ponto- 
san, továbbá egy motor minden figyelmeztetés nélkül lerobbanhat, és a kerekek 
váratlanul kidurranhatnak. A porszívóvilág, ahogy leírtuk, determinisztikus, de egyes 
variációk tartalmazhatnak sztochasztikus elemeket, például véletlenszerűen megjelenő 
piszkot vagy megbízhatatlan szívási mechanizmust (2.12. feladat). Ha a környezet 
más ágensek cselekvéseit leszámítva determinisztikus, akkor azt stratégiainak 
(strategic) nevezzük. 

s  Epizódszerű (episodic) vagy sorozatszerű 5 (seguential). Epizódszerű környezet- 
ben az ágens tapasztalata elemi , epizódokra" bontható. Minden egyes epizód az 
ágens észleléseiből és egy cselekvéséből áll. Nagyon fontos, hogy a következő epi- 
zód nem függ az előzőben végrehajtott cselekvésektől. Epizódszerű környezetekben 
az egyes epizódokban az akció kiválasztása csak az aktuális epizódtól függ. Sok osz- 
tályozási feladat epizódszerű. Például az összeszerelő soron levő hibás alkatrészeket 
észlelő ágens minden egyes döntését az aktuális alkatrész alapján hozza, függetlenül 
a korábbi döntésektől, továbbá az aktuális döntés nem befolyásolja, hogy a követke- 
ző alkatrész hibás lesz-e. Másrészt, sorozatszerű környezetekben az aktuális döntés 
befolyásolhat minden továbbit. A sakk és a taxivezetés sorozatszerű: a rövid távú ak- 
ciók mindkét esetben hosszú távú következményekkel járhatnak. Az epizódszerű 
környezetek sokkal egyszerűbbek a sorozatszerűeknél, hiszen az ágensnek nem kell 
előre gondolkodnia. 

s Statikus (static) vagy dinamikus (dynamic). Ha a környezet megváltozhat, amíg 
az ágens gondolkodik, akkor azt mondjuk, hogy a környezet az ágens számára dina- 
mikus; egyébként statikus. A statikus környezetekkel egyszerű bánni, mivel az 
ágensnek nem kell állandóan a világot figyelnie, miközben dönt a cselekvés felől, és 
nem kell az idő múlásával sem törődnie. Másrészt, a dinamikus környezetek állan- 
dóan azt kérdezik az ágenstől, hogy mit akar tenni; ha még nem döntötte el, az annak 
számít, hogy úgy döntött, hogy nem tesz semmit. Ha a környezet nem változik az 
idő előrehaladtával, de az ágens teljesítménymértéke igen, akkor azt mondjuk, hogy 
a környezet szemidinamikus (semidynamic). A taxivezetés nyilvánvalóan dinami- 
kus: a többi autó és a taxi továbbhalad, miközben a vezetési algoritmus azon bizony- 
talankodik, hogy mit is tegyen. Az órával játszott sakk szemidinamikus. A kereszt- 
rejtvények statikusak. 

s Diszkrét (discrete) vagy folytonos (continuous). A diszkrét/folytonos felosztás 
alkalmazható a környezet állapotára, az időkezelés módjára, az ágens észleléseire, 
valamint cselekvéseire. Például egy diszkrét állapotú környezet, mint amilyen a 
sakkjáték, véges számú különálló állapottal rendelkezik. A sakkban szintén diszkrét 


5 A  sorozatszerű" (segvential) szót a számítástodományban a , párhuzamos" (paralel) ellentéteként is hasz- 
nálják. A két jelentés alapvetően független egymástól. 


2.3. KÖRNYEZETEK TERMÉSZETE TT 


az akciók és cselekvések halmaza. A taxivezetés folytonos állapotú és idejű problé- 
ma: a sebesség, a taxi és más járművek helye folytonos értékek egy tartományát járja 
végig a folytonos időben. A taxivezetés akciói szintén folytonosak (például kanyaro- 
dási szögek stb.). Szigorúan véve a digitális kameráktól érkező bemenet diszkrét, de 
tipikusan úgy kezeljük, mint amely folyamatosan változó mennyiségeket és helyeket 
reprezentál. 

s Egyágenses (single agent) vagy többágenses (multiagent). Az egyágenses és több- 
ágenses környezetek közötti különbségtétel egyszerűnek tűnhet. Például a kereszt- 
rejtvényt megfejtő ágens önmagában nyilvánvalóan egyágenses környezetben van. 
míg egy sakkozó ágens egy kétágensesben. Vannak azonban kényes kérdések. Elő- 
ször is: leírtuk azt, hogy egy entitás hogyan tekinthető ágensnek, ugyanakkor nem 
magyaráztuk meg, mely entitások tekintendők ágensnek. Egy A ágensnek (például a 
taxisofőrnek) egy B objektumot (egy másik járművet) ágensnek kell tekintenie, vagy 
egyszerűen egy sztochasztikusan viselkedő dolognak, a tengerparti hullámokhoz vagy 
a szélben szálló falevelekhez hasonlatosan? A választás kulcsa az, hogy vajon B visel- 
kedése legjobban egy A viselkedésétől függő teljesítménymérték maximalizálásával 
írható-e le. Például a sakkban a B ellenfél saját teljesítménymértékét próbálja maxi- 
malizálni, amely — a sakk szabályainak következtében — A teljesítménymértékét 
minimalizálja. Így a sakk egy versengő (competitive) többágenses környezet. Más- 
részről, a taxi vezetési környezetben az ütközések elkerülése az összes ágens teljesít- 
ménymértékét maximálja, így az részben kooperatív (cooperative) többágenses 
környezet. Emellett részben versengő is, hiszen például csak egy autó tud egy parkoló- 
helyet elfoglalni. A többágenses környezetekben felmerülő ágenstervezési problémák 
gyakran egészen mások, mint egyágenses környezetekben. Többágenses környezetek- 
ben például a kommunikáció (communication) gyakran racionális viselkedésként 
bukkan fel; egyes részlegesen megfigyelhető versengő környezetekben a sztochaszti- 
kus viselkedés racionális, hiszen így elkerülhetők a megjósolhatóság csapdái. 





Ahogy várható, a legnehezebb a részlegesen megfigyelhető, sztochasztikus, sorozat- 
szerű, dinamikus, folytonos és többágenses eset. Az is kiderül, hogy a valós helyzetek 
legtöbbje olyan bonyolult, hogy valódi determinisztikusságuk vitatott kérdés; gyakorla- 
ti okokból sztochasztikusként kezelendők. A taxivezetés mindezen szempontok szerint 
nehéz. 

A 2.6. ábra ismerős környezetek tulajdonságait sorolja fel. Vegyük észre, hogy a vá- 
laszok nem mindig egyértelműek. Például a sakkot teljesen megfigyelhetőnek tüntettük 
fel; szigorúan véve ez hibás, mivel a rosálásra, menet közbeni ütésre és ismétléses dön- 
tetlenre vonatkozó egyes szabályok megkövetelik a játék menetével kapcsolatos adatok 
megjegyzését, amelyek a táblázat állapotának részeként nem figyelhetők meg. A meg- 
figyelhetőség ezen kivételei persze csekélyek egy taxivezető, egy angol nyelvtanár 
vagy egy orvosi diagnosztikai rendszerhez képest. 

A táblázatban bizonyos további válaszok a feladatkörnyezet definiálásától függ- 
nek. Az orvosi diagnosztikai feladatot egyágensesnek tüntettük fel, mivel a betegben 
zajló betegségi folyamat eredményesen nem modellezhető ágensként, de egy orvosi 
diagnosztikai rendszernek szükség esetén törődnie kell ellenszegülő betegekkel és 
szkeptikus munkatársakkal, így a környezetnek lehet többágenses aspektusa. Továbbá az 
orvosi diagnosztika epizódszerű, ha valaki a feladatot úgy tekinti, mint a tünetek listája 
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2.6. ábra. Példák feladatkörnyezetekre és jellemzőik 


alapján történő diagnózis kiválasztását; a probléma sorozatszerű, ha a feladat tartalmaz- 
hat egy vizsgálatsorozat-javaslatot, az eredmények kiértékelését a kezelés folyamán és 
így tovább. Továbbá sok környezet epizódszerű az ágensek egyéni akcióinál magasabb 
szinteken. Például egy sakktorna játszmák sorozatát tartalmazza, minden játék egy epi- 
zód, mivel (nagyjából) az ágens adott játszmabeli lépéseinek hozzájárulása az ágens 
teljesítményéhez nem függ a korábbi játszmákban választott lépéseitől. Másrészről, az 
egy játszmán belüli döntéshozatal biztosan sorozatszerű. 

A könyvhöz tartozó példaprogramtár (aima.cs.berkelev.edu) tartalmaz számos kör- 
nyezetimplementációt, egy általános célú környezetszimulátorral együtt, amely egy vagy 
több ágenst helyez el egy szimulált környezetben, megfigyeli a viselkedésüket az idő- 
ben, és kiértékeli őket egy adott teljesítménymérték szerint. Ilyen kísérleteket gyakran 
nem egy, hanem több, egy környezetosztályból (environment class) származó környe- 
zetre hajtanak végre. Például egy taxisofőr szimulált forgalomban történő értékelésére 
több szimulációt futtatnánk különböző forgalommal, világítással, és időjárási viszonyok- 
kal. Ha az ágenst egyedi esetre terveztük, kihasználhatjuk az adott környezet speciális 
tulajdonságait, de nem találhatjuk meg a vezetés általában jó módját. Ezért a programtár 
tartalmaz egy környezetgenerátort (environment generator) minden környezetosz- 
tályra, amelyik kiválaszt bizonyos környezeteket (bizonyos valószínűséggel) az ágens 
futtatására. Például a porszívó környezetgenerátor véletlenszerűen állítja be a piszok 
mintázatát és az ágens helyét. Ezek után az ágens átlagos teljesítményére vagyunk kíván- 
csiak az adott környezetosztályra nézve. Egy racionális ágens az adott környezetosztályra 
maximalizálja ezt az átlagos teljesítményt. A 2.7. és 2.12. közötti feladatok végigvisznek 
egy környezetosztály kialakításán és abban többféle ágens kiértékelésén. 
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2.4. AZ INTELLIGENS ÁGENSEK STRUKTURÁJA 

Az ágenseket eddig viselkedésük leírásán keresztül vizsgáltuk — azon cselekvés alapján, 
amelyet egy adott észlelési sorozat hatására végrehajtanak. Most neki kell esnünk a ke- 
mény diónak: hogyan működnek belül. A mesterséges intelligencia feladata az ágens- 
program (agent program) megtervezése: egy függvényé, amely megvalósítja az ész- 
lelések és a cselekvések közötti leképezést. Feltételezzük, hogy ez a program valami- 
féle fizikai érzékelőkkel és beavatkozókkal ellátott számítóeszközön fog futni — ezt 
architektúrának (architecture) nevezzük: 


ágens - architektúra 4- program 


Nyilvánvalóan a kiválasztott programunknak olyannak kell lennie, ami megfelelő az 
architektúra számára. Ha a program például Sétál jellegű akciókat fog javasolni, akkor 
jobb, ha az architektúrának vannak lábai. Az architektúra lehet egyszerű számítógép, vagy 
lehet egy robotautó számos fedélzeti számítógéppel, kamerával és más érzékelőkkel. Álta- 
lánosságban az architektúra a szenzoroktól érkező észleléseket elérhetővé teszi a program 
számára, futtatja a programot, és cselekvéseit létrejöttük pillanatában a beavatkozók felé 
továbbítja. E könyv túlnyomó része az ágensprogramok tervezéséről szól, bár a 24. és 25. 
fejezet kifejezetten az érzékelőkkel és a beavatkozókkal foglalkozik. 


Ágensprogramok 


A könyvben tervezett ágensprogramok mindannyian azonos vázzal rendelkeznek: 
bemenetként fogadják az zá zijst észleléseket a szenzoroktól. és visszaküldenek egy 
cselekvést a beavatkozókhoz.ő Vegyük észre a különbséget az ágensprogram, amely az 
aktuális észlelést veszi bemenetként, és az ágensfüggvény között, amely a teljes ész- 
lelési történetet fogadja. Az ágensprogram azért fogadja csak az aktuális észlelést 
bemenetként, mert csak ez érkezik a környezettől - ha az ágens cselekedetei a teljes 
észlelési sorozattól függnek. az ágensnek emlékeznie kell az észlelésekre. 

Az ágensprogramot egy egyszerű pszeudokódú nyelv segítségével fogjuk leírni, amit 
a B) függelék definiál. (Az interneten elérhető kódtár valóságos programozási nyelve- 
ken írt megvalósításokat tartalmaz.) Például a 2.7. ábra egy egészen egyszerű ágenst 
mutat, amely nyomon követi az észlelési sorozatot, és felhasználja egy akciókat tartal- 
mazó táblázat megcímzésére annak eldöntésére, hogy mit csináljon. A táblázat reprezen- 
tálja az ágensfüggvényt, amit az ágensprogram testesít meg. Ahhoz, hogy ily módon egy 
racionális ágenst építsünk, nekünk, mint tervezőknek, olyan táblázatot kell megal- 
kotnunk, amely minden lehetséges észlelési sorozathoz a megfelelő cselekvést tar- 
talmazza. 

Példaértékű annak megfontolása, hogy az ágensek tervezésének táblázatvezérelt 
megközelítése miért van kudarcra ítélve. Legyen P a lehetséges észlelések halmaza és 


6 vannak más lehetőségek is az ágensváz számára, például leírhatjuk az ágensprogramot korutinok (corou- 
tines) formájában, amelyek a környezethez képest aszinkron módon futnak. Minden ilyen korutin rendelkezik 
egy bemeneti és egy kimeneti porttal, és egy olyan ciklust tartalmaz, amelyik beolvassa a bemeneti portról az 
észleléseket, és kiírja a cselekvéseket a kimeneti portra. 
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function TÁBLÁZAT-VEZERLÉSŰ-ÁGENS(észíelés) returns egy cselekvés 
static: . észlelések, egy sorozat, kezdetben üres 
táblázat, egy táblázat. az észlelési sorozat indexeli. kezdetben teljesen feltöltött 


csatold az észlelést az észlelések végére 
cselekvés — KIKERESÉS(észlelések, ráblázar) 
return cselekvés 











2.7. ábra. A TÁBLÁZAT-VEZÉRLÉSŰ-ÁGENS program minden egyes új észlelésre meghívódik, és minden 
alkalommal visszaad egy cselekvést. Saját adatstruktúrájában követi nyomon az észlelési sorozatot. 


T az ágens élettartama (az általa vett észlelések teljes száma). A táblázat) 7 rarlPlfelemet 
fog tartalmazni. Vegyük példaként az automata taxit: az egyetlen kamerától érkező 
vizuális bemenet körülbelül 27 megabájtmásodperc sebességgel érkezik (30 kocka 
másodpercenként, 640 x 480 képpont 24 bit színinformációval). Ez alapján egyórányi 
vezetéshez olyan táblázatot kapunk, amely több mint 10259 900 000 000 pejegyzést tartal- 
maz. Még a sakkhoz tartozó táblázat is — amely a való világ egy kicsiny, jól viselkedő 
részlete — legalább 1059 bejegyzést tartalmazna. Ezen táblázatok ijesztő mérete (a meg- 
figyelhető világegyetemben az atomok száma kevesebb mint 107") azt jelenti, hogy (a) 
ebben az univerzumban egyetlen fizikai ágensnek sem lesz elég helye a táblázat tárolá- 
sára, (b) a tervezőnek nem lenne elég ideje a táblázat elkészítéséhez, (c) egyetlen ágens 
sem lenne képes a táblázat helyes bejegyzéseit megtanulni saját tapasztalatából, és (d) 
még ha a környezet eléggé egyszerű is egy megvalósítható méretű táblázathoz, a terve- 
zőnek még akkor sincs segítsége ahhoz, hogyan töltse ki a táblázat bejegyzéseit. 

Mindezek ellenére, a TÁBLÁZAT-VEZÉRLÉSŰ-ÁGENS megteszi azt, amit akarunk: meg- 
valósítja a kívánt ágensfüggvényt. Az MI alapvető kihívása, hogy hogyan írjunk olyan 
programot, amely — a lehetőségek határain belül — nagyszámú táblázatbejegyzések he- 
lyett kisméretű programkóddal produkál racionális viselkedést. Sok példánk van arra, 
hogy ez más területeken megvalósítható: például az 1970-es évek előtt a mérnökök és az 
iskolás gyerekek által használt hatalmas négyzetgyöktáblázatokat ma már egy elektro- 
nikus kalkulátorokon futó ötsoros program váltotta fel, amely a Newton-módszert alkal- 
mazza. A kérdés az, hogy megteheti-e az MI azt az általános intelligens viselkedésre, 
amit Newton tett meg a négyzetgyökökre? Abban biszünk, hogy a válasz igen. 

E fejezet hátralevő részében négy alapvető ágensprogramtípust vázolunk, amely 
megtestesíti a szinte minden intelligens rendszer mögött meghúzódó alapelveket: 


s Egyszerű reflexszerű ágensek. 

" . Modellalapú reflexszerű ágensek. 
"  Célorientált ágensek. 

"  Hasznosságorientált ágensek. 


Ezek után általánosságban elmagyarázzuk, hogyan alakíthatjuk át ezeket tanuló ágen- 
sekké. 
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Egyszerű reflexszerű ágensek 


A legegyszerűbb fajtájú ágens az egyszerű reflexszerű ágens (simple reflex agent). 
Ezek az ágensek az aktuális észlelés alapján választják ki a cselekvéseket, figyelmen 
kívül hagyva az észlelési történet többi részét. Például a porszívó ágens, amelynek 
ágensfüggvényét a 2.3. ábra táblázatos formában mutatja, egy egyszerű reflexszerű 
ágens, mivel döntései csak a jelenlegi helyszínen és azon alapulnak, hogy ott van-e 
piszok. A 2.8. ábra mutatja ezen ágens programját. 

Vegyük észre, hogy az ágensprogram igen kicsi a megfelelő táblázathoz képest. A legnyil- 
vánvalóbb méretcsökkentés az észlelési történet figyelmen kívül hagyásából következik, 
amely a lehetőségek számát 47-ről 4-re csökkenti. Egy további, kisebb csökkenés abból 
a tényből fakad, hogy amikor az aktuális négyzet piszkos, az akció nem függ a helyszíntől. 












function REFLEXSZERŰ-PORSZIVÓ-ÁGENS( helyszín , állapot) returns egy cselekvés 






át állapot — Piszkos then return Felszívás 
else if helyszín — A then return Jobbra 
else if helyszín — B then return Balra 






2.8. ábra, Egy egyszerű reflexszerű ágens programja a kétállapotú porszívókörnyezetben. A 2.3. ábrán 
megadott ágensfüggvényt valósítja meg. 


Képzeljük magunkat az automata taxisofőr helyébe! Ha az előttünk haladó autó 
fékez, és a féklámpái kigyulladnak. akkor észre kell vennünk. és el kell kezdenünk 
fékezni. Más szavakkal, valamilyen feldolgozás zajlik a képi bemeneten, hogy megál- 
lapítsunk egy feltételt, amit az , előző autó fékez"-nek hívunk; azután ez kivált valami- 
lyen kialakított kapcsolatot az ágens programjában a , kezdj fékezni" cselekvéshez. Ezt 
a kapcsolatot feltétel-cselekvés szabálynak (condition-action rule)" hívjuk, és 


ha az-előző-autó-fékez akkor kezdj-fékezni 


formában írjuk. Az embereknek sok hasonló kapcsolatuk van, egy részük tanult válasz 
(ami a vezetést illeti), míg más részük feltétlen reflex (mint például a pislogás, amikor 
valami megközelíti a szemünket). A későbbiekben több különböző módot is látni fo- 
gunk arra, hogy ilyen kapcsolatok hogyan tanulhatók és valósíthatók meg. 

A 2.8. ábra programja egy egyedi porszívókörnyezetre specifikus. Egy általánosabb és ru- 
galmasabb megközelítés az, hogy először egy általános célú értelmezőt építünk feltétel-cse- 
lekvés szabályokra, majd szabályhalmazokat hozunk létre specifikus feladatkörnyezetek 
számára. A 2.9. ábra ezen általános program struktúráját adja meg sematikus formában, 
megmutatva, hogy a feltétel-cselekvés szabályok hogyan teszik lehetővé az ágens számára 
az észlelések és cselekvések összekötését. (Ne aggódjon, ha ez túl egyszerűnek tűnik: ha- 
marosan sokkal érdekesebbé válik.) Az ágens döntési folyamatának aktuális belső állapotát 
négyszögekkel jelöljük, a folyamatban felhasznált háttértudás reprezentálására pedig ováli- 


T A kapcsolatot szituáció cselekvés (sitvation-action rule), produkciós (production rule) vagy ha-akkor 
szabálynak (if-then rule) is nevezik. 
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TOZDÁUIOY 


Feltétel-cselekvés szabályok 








2.9. ábra. Egy egyszerű reflexszerű ágens sematikus diagramja 


sokat használunk. Az ágensprogram, amely szintén igen egyszerű, a 2.10. ábrán látható. A 
BEMENET-FELDOLGOZÁS függvény a bemenetből állítja elő az aktuális állapot absztrakt le- 
írását, a SZABÁLY-ELLESZTÉS függvény pedig az első olyan szabályt adja vissza a szabályok 
halmazából, amely illeszkedik az adott állapot leírására. Vegyük észre, hogy a , szabályok" 
És az , illeszkedés" fogalmakkal történő leírás tisztán koncepcionális — egyedi megvalósítá- 
sok akár egy logikai áramkört megvalósító logikai kapu halmazból is állhatnak. 

Az egyszerű reflexszerű ágenseknek megvan az az értékelendő tulajdonsága, hogy 
egyszerűek, ugyanakkor igen korlátozott intelligenciájúnak bizonyulnak. A 2.10. ábrán 
látható ágens csak akkor fog működni, ha a helyes döntés kizárólag az aktuális észle- 
lés alapján meghozható — azaz akkor, ha a környezet teljesen megfigyelhető. Már a 
megfigyelhetőség legkisebb hiánya ís komoly problémát okozhat. Például a korábban 
bemutatott fékezési szabály feltételezi, hogy az előző-autó-fékez feltétel megállapítható 
az aktuális észlelésből — az aktuális videoképből — amennyiben az előző autónak közép- 
re szerelt féklámpája van. Sajnálatos módon, a régebbi modelleken különbözőképpen 
helyezkednek el a hátsó helyzetjelzők, a féklámpák és az indexlámpák, így egyetlen kép 
alapján nem mindig lehetséges azt megállapítani, hogy az autó fékez-e. Egy egyszerű 
reflexszerű ágens, amely egy ilyen autó mögött halad, vagy folyamatosan szükségtele- 
nül fékezne, vagy ami még rosszabb, sosem fékezne. 





fimction EGYSZERŰ-REFLEXSZERŰ-ÁGENS(észlelés) returns egy cselekvés 
static: szabályok, feltétel-cselekvés szabályok halmaza 


állapot — BEMENET-FELDOLGOZÁS(észtelés) 
szabály — SZABÁLY-ILLESZTÉS(állapot, szabályok) 
cselekvés — SZABÁLY-CSELEKVÉSÍSzabály] 
return cselekvés 











2.10. ábra. Egy egyszerű reflexszerű ágens. A jelenlegi szituációra (amit az észlelés határoz meg) illesz- 
kedő feltételű szabály megkeresésével, majd a hozzá tartozó cselekvés végrehajtásával működik. 
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Hasonló problémát láthatunk felbukkanni a porszívóvilágban. Tegyük fel, hogy egy 
egyszerű reflexszerű ágenst megfosztunk a helyzetérzékelő szenzorától, és csak piszokér- 
zékelője van. Egy ilyen ágensnek csak két észlelése van: [Xoszos) és [Tiszta]. Felszívhat 
válaszul a [Koszos]-ra: de mit tegyen. ha [Tiszta] az észlelés? A Balra mozgás (mindörök- 
re) sikertelen lesz. ha például az A négyzetben kezd, a Jobbra mozgás pedig (mindörökre) 
sikertelen, ha például a B négyzetben kezd. A végtelen ciklusok gyakran elkerülhetetlenek 
részlegesen megfigyelhető környezetben működő egyszerű reflexszerű ágensek számára. 

Elképzelhető menekvés a végtelen ciklusokból, ha az ágens randomizálhatja (ran- 
domize) cselekvéseit. Például ha a porszívó ágens [Tisztáj-t észlel, feldobhat egy érmét 
a Bal és Jobb közötti választáshoz. Könnyű megmutatni, hogy az ágens el fogja érni 
a másik négyzetet átlagosan két lépésen belül. Ezután, ha a négyzet piszkos, feltakarítja, 
és a tisztítási feladat befejeződik. Ily módon egy randomizált egyszerű reflexszerű 
ágens túlteljesíthet egy determinisztikus egyszerű reflexszerű ágenst. 

A 2.3. alfejezetben említettük, hogy a helyes formájú randomizált viselkedés lehet 
racionális bizonyos többágenses környezetekben. Egyágenses környezetekben a ran- 
domizáció általában nem racionális. Egy hasznos trükk, amely segítheti az egyszerű 
reflexszerű ágenst bizonyos szituációkban, de a legtöbb esetben ennél sokkal jobbat 
érhetünk el kifinomultabb determinisztrikus ágensekkel. 





Modellalapú reflexszerű ágensek 


A részleges megfigyelhetőség kezelésének leghatékonyabb módja, ha az ágens nyomon 
követi a világ jelenleg nem látható részét. Azaz, az ágensnek nyilván kell tartania vala- 
miféle belső állapotot (internal state), amely az észlelési történeten alapul, és így a 
jelenlegi állapot nem megfigyelt aspektusainak legalább egy részét tükrözi. A fékezési 
probléma esetében a belső állapot nem túlságosan terjedelmes — csak a kamerától szár- 
mazó előző képkocka, amely lehetővé teszi az ágens számára annak megállapítását, 
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Mit okoznak a cselekvéseim?) 
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Feltétel-cselekvés szabályok, 
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2.11. ábra. Belső állapottal rendelkező reflexszerű ágens 
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function REFLEXSZERŰ-ÁGENS-ÁLLAPoTfészlelés) returns egy cselekvés 
static: állapot, a világ jelenlegi állapotának leírása 
szabályok, feltétel-cselekvés szabályok halmaza 
cselekvés, a legutolsó cselekvés, kezdetben semmi 


állapot — ÁLLAPOT-Fissírés(átlapot, cselekvés, észlelés) 
szabály — SZABÁLY-ILLESZTÉS(állapot, szabályok) 
cselekvés —— SZABÁLY-CSELEKVÉSÍ szabály] 

return cselekvés 











2.12. ábra. A modellalapú reflexszerű ágens. Nyomon követi a világ jelenlegi állapotát egy belső mo- 
dellben. Ezek után a reflexszerű ágenshez hasonlóan választ egy cselekvést. 


hogy a jármű két szélén levő két piros lámpa egyszerre gyullad és alszik-e ki. Más 
vezetési feladatokhoz, mint például a sávváltáshoz, az ágensnek nyomon kell követnie 
hol tartózkodik a többi autó, amennyiben nem látja mindegyiket egyszerre. 

Ezen belső állapot frissítése az idő előrehaladtával kétféle tudás beépítését igényli az 
ágensprogramba. Először is szükségünk van olyan információra, hogy a világ hogyan 
alakul az ágenstől függetlenül — például egy előző autó általában közelebb lesz most, 
mint egy pillanattal azelőtt. Másodszor, szükségünk van valamilyen információra arról, 
hogy az ágens saját cselekvései hogyan változtatják meg a világot — például amikor az 
ágens a kormányt az óramutató járásának megfelelően tekeri, az autó jobbra fordul, 
vagy öt percig északnak tartó vezetés után egy autópályán általában körülbelül öt mér- 
földdel lesz északabbra, mint ahol öt perce volt. Ezt, a , világ működésének mikéntjéről" 
szóló tudást — akár egyszerű logikai áramkörökkel, akár teljes tudományos elméletekkel 
valósítjuk meg — a világ modelljének (model) hívjuk. Egy ilyen modellt használó ágenst 
pedig modellalapú ágensnek (model-based agent). 

A 2.11. ábra szemlélteti a belső állapottal rendelkező reflexszerű ágens struktúráját, 
megmutatva azt, ahogyan a jelenlegi észlelés a régi belső állapottai kombinálódva 
létrehozza a jelenlegi állapot frissített leírását. Az ágensprogram a 2. 12. ábrán látható. 
Az érdekes rész az ÁLLAPOT-FRISSÍTÉS eljárás, amely a belső állapot leírásának létre- 
hozásáért felelős. Az új észleléseknek az állapotról szóló tudás tükrében történő ér- 
telmezése mellett az ágensprogram nyomon követi a világ láthatatlan részeit a világ 
fejlődését leíró információ segítségével, az ágensprogramnak pedig azt is tudnia kell, 
hogy az ágens cselekvései milyen hatással lesznek a világ állapotára. Részletesebb 
példák a 10. és 17. fejezetben találhatók. 


Célorientált ágensek 


A környezet jelenlegi állapotának ismerete nem mindig elég annak eldöntéséhez, hogy 
mit tegyünk. Például egy kereszteződésben a taxi mehet egyenesen, de fordulhat jobb- 
ra vagy balra is. A helyes döntés attól függ, hogy a taxi hova szeretne eljutni. Más 
szavakkal, a jelenlegi állapot leírása mellett az ágensnek valamiféle cél- (goal) infor- 
mációval is rendelkeznie kell, amely leírja a kívánatos helyzeteket — például azt, hogy 
az utas jusson el a célállomásig. Az ágensprogram ezt összevetheti a lehetséges cselek- 
vések eredményeiről szóló információkkal (ugyanazokkal, amelyeket a reflexszerű 
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2.13. ábra. Egy modellalapú, célorientált ágens. Nyomon követi a világ állapotát és az elérendő célok 
halmazát is, és kiválaszt egy cselekvést, amely (végső soron) céljainak eléréséhez vezet. 


ágens esetében a belső állapot frissítésekor használt) annak érdekében, hogy a céljához 
vezető cselekvést meghatározza. A 2.13. ábra bemutatja a célorientált ágens felépítését. 

Néha a célorientált cselekvés választás egyszerű, amikor a cél teljesülése azonnal 
egyetlen cselekvéssel elérhető. Máskor sokkal trükkösebb, amikor az ágensnek befor- 
dulások és visszakanyarodások sorozatát kell megfontolnia a cél eléréséhez. A keresés 
(search) (lásd 3-6. fejezet) és a tervkészítés (planning) (lásd 11—12. fejezet) a mester- 
séges intelligencia azon területei, amelyek az ágens céljait elérő cselekvéssorozat meg- 
találásával foglalkoznak. 

Vegyük észre, hogy ez a fajta döntéshozatal alapjaiban különbözik az előzőkben 
ismertetett feltétel-cselekvés szabályoktól, ezek magukban foglalják a jövő figyelem- 
bevételét - mind a , Mi fog történni, ha ezt és ezt teszem?", mind a , Boldoggá tesz ez 
majd engem?" kérdéseket. Reflexszerű ágensek tervezésében ezeket explicit módon 
nem használjuk, mivel a tervező különböző esetekre előre meghatározta a helyes 
cselekvést. A reflexszerű ágens fékez, ha féklámpát lát kigyulladni. Célorientált elmé- 
letben gondolkodhat úgy, hogyha az előző autó féklámpái égnek, akkor az le fog lassul- 
ni. Az alapján, ahogy a világ általában működik, az egyetlen cselekvés, amely eléri azt 
a célt, hogy ne koccanjon neki más autóknak. a fékezés. 

Bár a célorientált ágens kevésbé tűnik hatékonynak, sokkal rugalmasabb, mivel a 
döntéseit alátámasztó tudás explicit módon megjelenik, és így módosítható. Ha elkezd 
esni az eső, frissítheti a tudását arról, hogy a fékek mennyire lesznek hatékonyak — ez 
automatikusan az összes releváns viselkedés olyan megváltozását eredményezi, hogy 
azok az új körülményhez igazodjanak. Reflexszerű ágensek esetében ugyanakkor, a fel- 
tétel-cselekvés szabályok nagy számát kellene átírnunk. Természetesen a célorientált 
ágens különböző úti célok elérésében is rugalmasabb. Egyszerűen egy új cél megadá- 
sával a célorientált ágenstől egy új viselkedés megjelenését kaphatjuk. A reflexszerű 
ágens , mikor fordulj" és , mikor menj egyenesen" szabályai csak egy cél esetében fog- 
nak működni: ki kell őket cserélni ahhoz, hogy egy új helyre menjen. 
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Hasznosságorientált ágensek 


A környezetek többségében a célok önmagukban nem elegendőek jó minőségű viselke- 
dés létrehozásához. Például többféle cselekvéssorozat vezet a taxi végállomásának — és 
így a céljának — eléréséhez, de némelyik gyorsabb, biztonságosabb, megbízhatóbb vagy 
olcsóbb, mint mások. A célok csak durva különbséget tesznek , boldog" és , boldogta- 
lan" állapotok között, egy általánosabb teljesítménymérték ezzel szemben a világ álla- 
potainak (vagy állapotsorozatainak) megfelelő összehasonlítását tehetné lehetővé, azt 
megadva, hogy pontosan mennyire tennék boldoggá az ágenst, ha elérné azokat. Mi- 
vel a , boldogság" nem hangzik túl tudományosan, ezért a szokásos terminológia azt 
mondja, hogy a világ egyik állapota előnyösebb egy másikhoz képest, ha nagyobb 
a hasznossága (utility) " az ágens számára. 

A basznosságfüggvény (utility function) egy állapotot (vagy állapotok egy soroza- 
tát) egy olyan valós számra képezi le, amelyik a hozzá rendelt boldogság fokát írja le. 
A hasznosságfüggvény teljes meghatározása kétféle olyan helyzetben tesz lehetővé 
racionális döntéseket, amikor a célok erre alkalmatlanok. Egyrészt, amikor egymásnak 
ellentmondó célok vannak, amelyeknek csak egy része érhető el (mint például a bizton- 
ságosság és a sebesség), akkor a hasznosságfüggvény meghatározza a helyes kompro- 
misszumot. Másrészt, amikor több cél van, amelyek elérésére az ágens törekedhet, és 
egyikük sem érthető el teljes bizonyossággal, a hasznosság olyan módszert ad, amivel 
a siker valószínűsége a célok fontosságához mérhető. 

A 16. fejezetben megmutatjuk, hogy minden racionális ágensnek úgy kell működnie, 
mintha rendelkezne hasznosságfüggvénnyel, amelynek várható értékét maximalizálni 
akarja. Egy ágens, amelynek van egy explicit hasznosságfüggvénye, ily módon racio- 
nális döntéseket hozhat, és ezt egy általános algoritmussal teheti meg, amely nem függ 
a maximalizálandó specifikus hasznosságfüggvénytől. Ezáltal a racionalitás , globális" 
definíciója — amely azon ágensfüggvényeket tekinti racionálisnak, amelyek a legnagyobb 
teljesítményt hozzák — átváltozik a racionáliságens-tervezés egy ,.helyi" kényszerévé, 
amely kifejezhető egy egyszerű programban. 

A hasznosságalapú ágens struktúrája a 2.14. ábrán látható. Valódi hasznosságalapú 
ágens programok az V. részben szerepelnek, ahol olyan döntéshozó ágenseket terve- 
zünk, amelyeknek a részlegesen megfigyelhető környezetekben elkerülhetetlen bizony- 
talanságot is kezelniük kell. 


Tanuló ágensek 


Leírtunk többféle módszert arra, hogy ágensprogramok hogyan választják ki cselekvé- 
seiket. Nem magyaráztuk meg azonban eddig, hogy hogyan jön létre az ágensprogram. 
Híres korai cikkében Turing (Turing, 1950) azzal az ötlettel foglalkozik, hogy intelli- 
gens gépeit ténylegesen kézzel programozza. Megbecsüli, mennyi munkát vehet ez 
igénybe, és megállapítja, hogy ,. valamilyen eredményesebb módszer kívánatosnak 
látszik". Az általa javasolt módszer az, hogy építsünk tanuló gépeket, majd tanítsuk 


§ A hasznosság" szó itt a hasznosság minősége" kifejezésre utal. nem az áram- vagy vízszolgáltatókra. 
(Az angol utility sző többes jelentésű, a szerző ezért magyarázza meg helyes értelmezését a lábjegyzetben. — A ford.) 
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ln Hogyan fog kinézni, ha az A 
cselekvést hajtom végre? 
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2.14. ábra. Egy modellalapú, hasznosságalapú ágens. A világ modellje mellett egy hasznosságfüggvényt 
is alkalmaz, amely a világ állapotaihoz rendelt preferenciáit méri. Ezek után olyan cselekvést választ, 
amely a legjobb várható hasznossághoz vezet, amit az összes lehetséges végállapot előfordulási valószí- 
nűségével súlyozott átlagolásával számít ki. 


ezeket. Az MI sok területén ez ma a javasolt módszer korszerű rendszerek építésére, 
A tanulásnak van egy másik előnye is, ahogy megállapítottuk korábban: lehetővé teszi 
az ágens számára, hogy kezdetben ismeretlen környezetben működjön, és kompeten- 
sebbé váljon, mint ahogy azt kezdeti tudása lehetővé tette volna. Ebben a fejezetben rö- 
viden bemutatjuk a tanuló ágensek főbb elveit. A könyv majdnem minden fejezetében 
rámutatunk a tanulás lehetőségeire és módszereire az egyes ágensfajtákban. A VI. rész 
merül el mélyebben a különféle tanulási algoritmusokban. 

Egy tanuló ágens négy koncepcionális komponensre bontható fel, ahogy azt a 2.15. 
Ábra mutatja. A legfontosabb különbségtétel a javításokért felelős tanuló elem (learning 
element) és a külső cselekvések kiválasztásáért felelős végrehajtó elem (performance 
element) között van. A végrehajtó elem az, amit eddig a teljes ágensnek tekintettünk: ez 
végzi az észleléseket, és ez dönt a cselekvésekről. A tanuló elem a kritikustól (eritic) 
kapott, az ágens működéséről szóló visszajelzést használja annak megállapítására, hogy 
a végrehajtó elemet hogyan kell módosítani annak érdekében, hogy a jövőben jobban 
működjön az ágens. 

A tanuló elem tervezése nagyrészt a végrehajtó elem tervezésétől függ. Amikor egy olyan 
ágenst próbálunk tervezni, amely megtanul egy bizonyos képességet, az első kérdés nem a 
, hogyan fogom én ezt megtanulni?", hanem a , milyen teljesítményelemre lesz az ágensem- 
nek szüksége ennek végrehajtásához, ha már megtanulta, hogyan kell?". Ha adott egy meg- 
tervezett ágens, tanuló eljárások az ágens minden részének javításához készíthetők. 

A kritikus megmondja a tanuló elemnek, hogy az ágens milyen jól működik egy rög- 
zített teljesítményszabványhoz viszonyítva. A kritikus szükséges, hiszen az észlelések 
önmagukban nem jelzik az ágens sikerességét. Például egy sakk program fogadhat egy 
olyan észlelést, hogy mattot adott az ellenfelének, de szüksége van egy teljesítmény- 
szabványra, hogy tudja, ez egy jó dolog. Az észlelés önmagában nem mondja meg ezt. 
Fontos, hogy a teljesítményszabvány rögzített legyen. Koncepcionálisan tekinthető 
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2.15, ábra. Tanuló ágensek egy általános modellje 


úgy. mintha az ágensen teljesen kívül lenne, mivel az ágens nem módosíthatja azt saját 
viselkedésének megjavítása érdekében. 

A tanuló ágens utolsó komponense a problémagenerátor (problem generator). 
Ennek feladata, hogy olyan cselekvéseket javasoljon, amelyek új és informatív tapasz- 
talatokhoz vezetnek. Az a helyzet, hogy ha a végrehajtó elem a saját feje után menne, 
akkor adott tudása alapján mindig a legjobb cselekvéseket választaná. De ha az ágens 
hajlandó egy kis felfedezésre, és rövid távon talán néhány szuboptimális cselekvésre, 
hosszú távon sokkal jobb cselekvéseket fedezhet fel. A problémagenerátor feladata, 
hogy ilyen felfedező cselekvéseket javasoljon. Ezt teszik a tudósok is, amikor kísérle- 
teket végeznek. Galilei nem gondolta, hogy a pisai torony tetejéből köveket leejteni 
önmagában értékes dolog. Sem a köveket nem próbálta összetörni, sem a szerencsétlen 
arra járók agyát nem akarta , megváltoztatni". Célja saját agyának megváltoztatása volt 
azáltal, hogy az objektumok mozgásának egy jobb elméletét ismerje fel. 

Hogy az általános tervet konkrétabbá tegyük, térjünk vissza az automata taxi példá- 
jához. A végrehajtó elem tartalmazza mindazon tudást és eljárások halmazát, amelyek 
a taxivezetés cselekvéseinek kiválasztásához szükségesek. A taxi ezen végrehajtó elem 
segítségével megy ki az utakra és közlekedik. A kritikus megfigyeli a világot, és tovább- 
adja az információt a tanuló elemnek. Például miután a taxi három forgalmi sávon 
keresztül egy gyors balkanyart vett, a kritikus megfigyeli a többi vezető által használt 
sokkoló nyelvezetet. Ebből a kísérletből a tanuló elem képes egy szabályt formálni, 
miszerint ez egy rossz cselekvés volt, és a végrehajtó elem módosul az új szabály be- 
illesztésével. A problémagenerátor megfigyelheti a viselkedés bizonyos területeit, melyek 
javításra szorulnak, és kísérleteket javasol, mint például a fékek kipróbálását különböző 
útfelszíneken és különböző viszonyok között. 

A tanuló elem módosíthatja az ágensdiagramokon (2.9., 2.11., 2.13. és 2.14. ábrák) 
atudás" komponensek bármelyikét. A legegyszerűbb esetek magukban foglalják az 
észlelési szekvenciából történő direkt tanulást. Az egymást követő környezeti állapot 
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párok megfigyelése lehetővé teszi az ágens számára annak megtanulását, hogy a , világ 
hogyan változik", és cselekvései eredményeinek megfigyelése lehetővé teszi a , mit 
okoznak a cselekvéseim" megtanulását. Például ha a taxi vezetője adott erővel fékez, 
mikor a taxi nedves úton halad, akkor hamarosan tapasztalni fogja, ténylegesen mekkora 
lassulást ért el. Világos, hogy ez a két tanulási feladat sokkal nehezebb, ha a környezet 
csak részlegesen figyelhető meg. 

Az előző bekezdésben szereplő tanulási formák nem igényelnek hozzáférést külső 
teljesítményszabványhoz — bizonyos értelemben a mérték univerzális: a kísérletekkel 
összhangban levő előrejelzések készítése. A helyzet némiképp bonyolultabb egy hasz- 
nosságalapú ágens számára, amelyik a hasznosságinformációt szeretné megtanulni. 
Például tegyük fel, hogy a taxisofőr ágens nem kap borravalót az utasoktól, akiket az út 
folyamán teljesen összerázott. A külső teljesítményszabványnak informálnia kell az 
ágenst, hogy a borravaló elvesztése egy negatív hozzájárulás az általános teljesítmé- 
nyéhez - ezek után az ágens megtanulhatja. hogy a hirtelen manőverek nem járulnak 
hozzá a hasznosságához. Bizonyos értelemben a teljesítményszabvány a beérkező ész- 
lelés egy részét elkülöníti jutalomként (reward) (vagy büntetésként — penalty), amely 
az ágens viselkedési minőségének direkt visszacsatolása. A rögzített teljesítmény- 
szabványok, mint például állatokban a fájdalom vagy éhség, ily módon értelmezhetők. 
Ezt a kérdést a 21. fejezetben tárgyaljuk. 

Összegezve, az ágenseknek sokféle komponensük van, és ezen komponensek sokféle- 
képpen reprezentálhatók az ágensprogramban, így úgy tűnik, sokféle tanulási módszer 
létezik. Van ugyanakkor egy egyesítő motívum. A tanulás az intelligens ágensekben 
összefoglalható úgy, mint egy folyamat, amely az ágens minden komponensét úgy mó- 
dosítja, hogy az összhangba kerüljön a rendelkezésre álló visszacsatolt információval, 
ily módon növelve az ágens általános teljesítményét. 
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Ebben a fejezetben szélsebesen végigszaladtunk a mesterséges intelligencián. amelyet 
úgy tekintettünk, mint az ágenstervezés tudományát. A következő fontos pontokra kell 
emlékeznünk: 


" Egy ágens (agent) olyan valami, amely észlel és cselekszik egy környezetben. 
Az ágensfüggvény (agent function) meghatározza, hogy egy tetszőleges észlelési 
sorozathoz milyen cselekvést hajtson végre az ágens. 

5 A teljesítménymérték (performance measure) értékeli az ágens viselkedését egy 
környezetben. Egy racionális ágens (rational agent) úgy cselekszik, hogy maxima- 
lizálja a teljesítménymérték várható értékét az addigi észlelési sorozat alapján. 

5 A feladatkörnyezet (task environment) leírása tartalmazza a teljesítménymérték, 
a külső környezet, a beavatkozók és a szenzorok meghatározását. Egy ágens terve- 
zése során az első lépés mindig a feladatkörnyezet minél teljesebb leírása. 

s A feladatkörnyezetek számos lényeges dimenzió mentén különbözhetnek. Lehetnek 
teljesen vagy részben megfigyelhetők, determinisztikusak vagy sztochasztikusak, 
epizódszerűek vagy sorozatszerűek, statikusak vagy dinamikusak, diszkrétek vagy 
folytonosak, valamint egyágensesek vagy többágensesek. 
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s Az ágensprogram (agent program) implementálja az ágensfüggvényt. Többféle 
alapvető ágensfelépítés létezik attól függően, hogy milyen információ jelenik meg 
és használódik fel a döntési folyamatban. A konstrukció különbözhet hatékonyságá- 
ban, kompaktságában és rugalmasságában. Az ágensprogram megfelelő konstrukció- 
ja a körmyezet természetétől függ. 

s Az egyszerű reflexszerű ágensek (simple reflex agents) azonnal válaszolnak az 
észlelésekre, míg a modellalapú reflexszerű ágensek (model-based reflex agents) 
a világ aktuális észlelésekből nem nyilvánvaló aspektusait belső állapotukban tart- 
ják nyilván. A célorientált ágensek (goal-based agents) céljaik elérése érdekében 
cselekszenek, a hasznosságorientált ágensek (utility-based agents) pedig saját 
, boldogságukat" próbálják meg maximalizálni. 

s Minden ágens javíthatja a teljesítményét tanulás (learning) segítségével. 


Irodalmi és történeti megjegyzések 


A cselekvés központi szerepe az intelligenciában — a praktikus következtetés fogalma 
— egészen Arisztotelész Nikomakhoszi Etikájáig vezethető vissza. A praktikus követ- 
keztetés McCarthy (McCarthy, 1958) nagy hatású cikkének is tárgya volt: Programs 
with Common Sense (Józan ésszel bíró programok). A robotika és szabályozáselmélet 
területei természetüknél fogva alapvetően fizikai ágensek tervezésével foglalkoznak. 
A vezérlő tceontroller) koncepciója a szabályozáselméletben megegyezik az MI ágens 
fogalmával. Talán meglepő, hogy az MI történelmének nagy részében az ágensek elkü- 
lönített komponenseire — kérdés-felelet rendszerek, tételbizonyítók, látórendszerek és 
így tovább - koncentrált inkább, mint a teljes ágensekre. Az ágensek leírása Genesereth 
és Nilsson (Genesereth és Nilsson, 1987) cikkében egy nagy hatású kivétel volt. A tel- 
jes ágenskép ma már széles körben elfogadott a szakmában, és ez lett az újabb írások 
központi témája (Poole és társai 1998; Nilsson 1998). 

Az I. fejezet a racionalitás koncepciójának gyökereit a filozófiára és közgazdaság- 
tanra vezette vissza. Az MI-ben a nyolcvanas évek közepéig ez a koncepció csak peri- 
feriális érdeklődést kapott, amikor elkezdte elborítani a terület megfelelő technikai 
megalapozásának tárgyalásait. Jon Doyle cikke azt jósolta, hogy a racionális ágensek 
tervezése képezi majd az MI fő küldetését. míg más népszerű területek leválnak új 
tudományágakat formálva (Doyle, 1983). 

A környezetek tulajdonságainak gondos figyelembevétele és hatásuk a racionális 
ágensek tervezésére leginkább a szabályozáselméleti tradícióban látható — például a 
klasszikus szabályozó rendszerek (Dorf és Bishop, 1999) teljesen megfigyelhető, deter- 
minisztikus környezeteket kezelnek; a sztochasztikus optimális vezérlés (Kumar és 
Varaiya, 1986) részlegesen megfigyelhető, sztochasztikus környezeteket kezel; és 
a hibrid szabályozó (Henzinger és Sastry. 1998) olyan környezetekkel foglalkozik, 
amelyek mind diszkrét, mind folyt. elemeket tartalmaznak. A teljesen és a részle- 
gesen megfigyelhető környezetek közötti különbségtétel az operációkutatás területén 
kifejlődött dinamikus programozás (dynamic programming) irodalmában szintén 
központi kérdés (Puterman, 1994), amit a 17. fejezetben fogunk tárgyalni. 

A reflexszerű ágensek voltak az elsődleges modellek a pszichológiai behavioristák, 
mint például Skinner (Skinner, 1953) számára, aki megpróbálta az organizmusok pszi- 
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chológiáját kizárólag bemenet/kimenet, avagy inger/válasz leképezésekre visszavezetni. 
A pszichológiában a behaviorizmustól a funkcionalizmusig jutó fejlődés, amelyet leg- 
alább részben a számítógép-metafora ágensekre történő alkalmazása idézett elő (Putnam, 
1960; Lewis, 1966), az ágens belső állapotának a megjelenését eredményezte. Az MI 
munkáinak nagy része az állapottal rendelkező tiszta reflexszerű ágensek ötletét túl egy- 
szerűnek tartja ahhoz, hogy előrelépést jelentsen, de Rosenschein (Rosenschein, 1985) és 
Brooks (Brooks, 1986) munkája megkérdőjelezte ezt a feltételezést (25. fejezet). Az el- 
múlt években jelentős munka zajlott annak érdekében, hogy hatékony algoritmusokat 
találjanak komplex környezetek nyomon követésére (Hamscher és társai, 1992). A Remote 
Agent program, amely a Deep Space One űrhajót vezérelte (leírása a 60. oldalon található) 
egy különösen meggyőző példa (Muscettola és társai, 1998; Jonsson és társai, 2000). 

A célorientált ágenseket mindenhol feltételezték, kezdve Arisztotelész gyakorlati gon- 
dolkodásáról alkotott nézetétől McCarthy logikai MI-ről írt korai cikkeiig. A Shakey the 
Robot (Fikes és Nilsson, 1971; Nilsson, 1984) volt egy logikai, célorientált ágens első 
robot formájú megtestesülése. A célorientált ágensek teljes logikai elemzése Genesereth 
és Nilsson (Genesereth és Nilsson, 1987) cikkében jelent meg, és egy célorientált prog- 
ramozási módszertant, az úgynevezett ágensorientált programozást Shoham (Shoham, 
1993) dolgozott ki. 

A célorientált nézőpont a kognitív pszichológia hagyományában is domináns a prob- 
lémamegoldás területén, kezdve a jelentős mértékben meghatározó Human Problem 
Solving (Emberi problémamegoldás) (Newell és Simon, 1972) művel, és folytatódva 
Newell későbbi munkájában (Newell, 1990). A célok, tovább bontva vágyakra (általá- 
nos) és szándékokra (jelenleg követett), központi témái a Bratman (Bratman, 1987) által 
kifejlesztett ágenselméletnek is. Ez az elmélet hatással volt mind a természetes nyelv 
megértésére, mind a többágenses rendszerekre. 

Horvitz kifejezetten azt javasolja, hogy az MI alapja a racionalitás mint az elvárt 
hasznosság maximalizálása legyen (Horvitz és társai, 1988). Pearl írása (Pearl, 1988) 
volt az első az MI-ben, amely részletesen tárgyalta a valószínűséget és a hasznosság- 
elméletet; az írás a bizonytalanság melletti következtetés és döntéshozatal praktikus 
módszereinek kifejtésével valószínűleg a legnagyobb önálló tényező volt a hasznosság- 
orientált ágensek felé történő elmozdulásban a kilencvenes években (V. rész). 

A 2.15. ábrán bemutatott általános tanuló ágens tervezés klasszikus a gépi tanulás 
irodalmában (Buchanan és társai, 1978; Mitchell, 1997). Ezen felépítés programokban 
megtestesülő példái legalább olyan messze nyúlnak vissza, mint Arthur Samuel dáma- 
játékot játszó tanuló programja (Samuel, 1959, 1967). A tanuló ágenseket a VI. rész tár- 
gyalja részletesen. 

Az ágensek és ágenstervezés iránti érdeklődés gyorsan növekedett az elmúlt években, 
részben az internet, valamint az automatizált és mobil szoftbotok iránti igény növekedésé- 
vel (Etzioni és Weld, 1994). A releváns cikkeket a Readings in Agentsben (Huhns és 
Singh, 1998), valamint a Foundations of Rational Agencyben (Wooldridge és Rao, 1999) 
gyűjtötték össze. A Multiagent Systems (Weiss, 1999) nyújtja az ágenstervezés sok aspek- 
tusának egységes alapját. Az ágenseknek szentelt konferenciák között van az International 
Conference on Autonomous Agents, az International Workshop on Agent Theories, Archi- 
tectures, and Languages, és az International Conference on Multiagent Systems. Végezetül, 
a Dung Beetle Ecology (Ganajtúró bogár ökológia) (Hanski és Cambefort, 1991) érdekes 
információk gazdag választékát kínálja a ganajtúró bogarak viselkedéséről. 
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Feladatok 


2.1. 


2.2. 


2.4. 


2.6. 


2.7. 


Definiálja saját világait a következő fogalmakkal: ágens, ágensfüggvény, ágens- 
program, racionalitás, autonómia, reflexszerű ágens, modellalapú ágens, célori- 
entált ágens, hasznosságorientált ágens, tanuló ágens! 


Mind a teljesítménymérték, mind a hasznosságfüggvény azt méri, hogy mennyire 
dolgozik jól egy ágens. Magyarázza el a köztük levő különbséget! 


Ez a gyakorlat felfedi az ágensfüggvények és a programok közötti különbségeket. 

(a) Lehetséges több mint egy ágensprogram, amely egy adott ágensfüggvényt 
valósít meg? Adjon meg egy példát vagy mutassa meg, miért nem lehetséges! 

(b) Vannak olyan ágensfüggvények, amelyeket nem lehet programmal meg- 
valósítani? 

(c) Rögzítve egy géparchitektúrát, igaz-e. hogy minden egyes ágensprogram 
pontosan egy ágensfüggvényt valósít meg? 

(d) Lehetséges több mint egy ágensprogram, amely egy adott ágensfüggvényt 
valósít meg? 


Vizsgáljuk meg különböző porszívóvilág-beli ágensfüggvények racionalitását! 

(a) Mutassa meg, hogy a 2.3. ábrán látható egyszerű porszívó ágensfüggvény 
igenis racionális a 70. oldalon felsorolt feltételezésekkel! 

(b) Írjon le egy racionális ágensfüggvényt arra a módosított teljesítnénymérték- 
re, amely levon egy pontot minden elmozdulásért! Szüksége van-e a függ- 
vénynek megfelelő ágensprogramnak belső állapotra? 

(c) Mutasson lehetséges ágensterveket olyan esetekre, amikor tiszta négyzetek 
Piszkossá válhatnak, és a környezet geográfiája ismeretlen! Értelmes do- 
10g-e, hogy ezekben az esetekben az ágens saját tapasztalataiból tanuljon? 
Ha igen, akkor mit kellene megtanulnia? 


Az alábbi ágensek mindegyikére dolgozza ki a feladatkörnyezetek TKBÉ-leírását! 
(a) Robot focijátékos; 

(b) Intemetes könyvvásárló ágens; 

(c) Autonóm Mars terepjáró; 

(d)  Matematikusok tételbizonyító segítője. 


A 2.5. példa minden egyes ágenstípusára jeliemezze a környezeteket a 2.3. fejezet- 
ben megadott tulajdonságok alapján, majd válasszon ki megfelelő ágensterveket! 


A következő feladatok mindegyike egy környezetnek és egy sor ágensnek a 
megvalósítására vonatkozik a porszívóvilágban. 


Valósítson meg egy teljesítménymérő környezetszimulátort a 2.2. ábrán mutatott 
és 70. oldalon specifikált porszívóvilágra! Implementációja legyen moduláris, 
hogy könnyen megváltoztathassa az érzékelőket, a beavatkozókat és a környezeti 
jellemzőket (méret, alak, piszok elhelyezkedése stb.). (Megjegyzés: Bizonyos ope- 
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2.8. 


29. 


2.10. 


2.11. 


2.12. 


rációs rendszerekre és programozási nyelvekre vannak kész implementációk az 
internetes kódtárban.) 


Tervezzen és valósítson meg egy tiszta reflexszerű ágenst a 2.7. feladat környe- 
zetére! Minden lehetséges kezdeti koszeloszlásra és ágenselhelyezkedésre futtassa 
te a környezetszimulátort ezzel az ágenssel! Jegyezze fel az ágens teljesítménymér- 
tékét minden egyes konfigurációra és az átlagos pontszámát is! 


Vizsgálja meg a 2.7. gyakorlat egy módosított környezetét, amelyben az ágenst 

egy ponttal büntetik minden egyes elmozdulásért. 

(a) Lehet-e tökéletesen racionális egy egyszerű reflexszerű ágens ebben a kör- 
nyezetben? Magyarázza meg, miért! 

(b) Mi a helyzet az állapottal rendelkező refiexszerű ágensekkel? Tervezzen 
egy ilyen ágenst! 

(c) Hogyan változna meg az (a) és (b) pontokra adott válasza, ha az ágens ész- 
lelései a környezet összes négyzetére megmondják neki, hogy azok tiszták 
vagy piszkosak? 


Vizsgálja meg a 2.7. feladat porszívókörnyezetének egy módosított változatát, 

amelyben a környezet alakja — mérete, határai és akadályai — ismeretlen, mint 

ahogy a kosz kezdeti elhelyezése is az! (Az ágens mehet Fel és Le, valamint Balra 
és Jobbra is.) 

(a) Lehet-e tökéletesen racionális egy egyszerű reflexszerű ágens ebben 
a környezetben? Magyarázza meg, miért! 

(b) Egy randomizált ágensfüggvénnyel rendelkező reflexszerű ágens jobban 
teljesíthet egy egyszerűnél? Tervezzen egy ilyen ágenst, és mérje meg a tel- 
jesítményét különböző környezetekben! 

(c) Tud olyan környezetet tervezni, ahol az Ön randomizált ágense igen rosszul 
fog teljesíteni? Mutassa meg az eredményeit! 

(d) Egy állapottal rendelkező reflexszerű ágens jobban teljesíthet egy egyszerű- 
nél? Tervezzen egy ilyen ágenst, és mérje meg a teljesítményét különböző 
környezetekben! Tud ilyen típusú racionális ágenst tervezni? 


Ismételje meg a 2.10. feladatot egy olyan esetre, amikor az elhelyezkedés érzékelőt 
egy ütközés" érzékelő váltja fel, ami érzékeli az ágens olyan elmozdulási kísérle- 
teit, amikor nekiütközik egy akadálynak vagy átlépi a környezet határát! Tegye fel, 
hogy az ütközésérzékelő működése leáll! Hogyan kellene az ágensnek viselkednie? 


Az eddigi feladatok porszívókörnyezetei determinisztikusak voltak. Vizsgáljon 

meg lehetséges ágensprogramokat a következő sztochasztikus variációkra: 

(a) Murphy törvénye: az idő 2596-ában a Felszívás művelet nem tudja feltaka- 
rítani a padlót, ha az piszkos, illetve kiönti rá a koszt, ha az tiszta. Hogyan 
érinti az ágens programját az, ha a piszokérzékelő az idő 1096-ában rossz 
választ ad? 

(b) Kisgyerekek: minden időlépésben minden négyzetnek 109£ esélye van be- 
koszolódni. Tud javasolni egy racionális ágenstervet erre az esetre? 


II. RÉSZ 
PROBLÉMA- 
MEGOLDÁS 
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Ebben a fejezetben megnézzük, hogy egy ágens hogyan tudja megtalálni azt a cselek- 
véssorozatot, amely elvezet a célhoz. ha erre egyetlen egyedi cselekvés sem elegendő. 


A 2. fejezetben említett legegyszerűbb ágensek a reflexszerű ágensek voltak, amelyek 
cselekvései az állapotok és a cselekvések közötti közvetlen leképzésen alapulnak. 
Az ilyen ágensek nem képesek olyan környezetben tevékenykedni, ahol e leképzés 
tárolási igénye túl nagy lenne, vagy ahol a leképezés megtanulása túl sok időt venne 
igénybe, A célorientált ágensek azonban sikerrel járhatnak a jövőbeli cselekvéseknek 
és annak a számbavételével, hogy ezen cselekvések kimenetelei mennyire kívánatosak. 

Ebben a fejezetben a célorientált ágensek egyik típusát, a problémamegoldó ágenst 
(problem-solving agent) ismertetjük. A problémamegoldó ágensek úgy határozzák 
meg, mit is kell tenniük, hogy olyan cselekvéssorozatokat keresnek, amelyek a kívánt 
állapotokba vezetnek. Azzal kezdjük, hogy pontosan megfogalmazzuk a , problémát" 
És a , megoldását" felépítő alkotóelemeket, és számos példával illusztráljuk ezen defi- 
níciókat. Ezek után néhány általános rendeltetésű keresési algoritmust mutatunk be, 
amelyek e problémák megoldására alkalmasak, majd az egyes algoritmusok előnyeit 
összehasonlítjuk. Az algoritmusok nem informáltak (uninformed) abban az érte- 
lemben, hogy a probléma definícióján túlmenően más információval a problémáról 
nem rendelkeznek. A 4. fejezet informált (informed) keresési stratégiákat tárgyal, 
amelyek rendelkeznek valamilyen elképzeléssel arról, hogy a megoldást merrefelé is 
kell keresni. 

Ebben a fejezetben az algoritmuselmélet területén használt fogalmakat alkalmazzuk. 
Az aszimptotikus komplexitás (azaz az 0() jelölésmód) és az NP-teljesség fogalom- 
körében nem járatos olvasó számára az A) függelék nyújt bővebb információkat. 


3.1. PROBLÉMAMEGOLDÓ ÁGENSEK 


Az intelligens ágensekről feltesszük, hogy a teljesítménymértéküket maximalizálják. 
Mint azt a 2. fejezetben láttuk, a feladat valamelyest leegyszerűsödik, ha az ágens egy 
célt (goal) tud maga elé tűzni, és megpróbálja azt elérni. Először vizsgáljuk meg, hogy 
az ágens hogyan és miért teheti ezt meg. 

Tegyük fel, hogy az ágensünk a romániai Arad városában tartózkodik, és országjáró 
túrája vége felé közeledik. Az ágens teljesítménymértéke számos tényezőt tartalmaz: 
például szépen le szeretne barnulni, tökéletesíteni szeretné a román nyelvtudását, látni 
szeretné az összes nevezetességet, élvezni az éjszakai életet (amilyen van), kerülni 
a másnaposságot stb. A döntési probléma igen bonyolult, sok kompromisszummal és 


98 3. PROBLÉMAMEGOLDÁS KERESÉSSEL 


útikönyvek gondos tanulmányozásával jár. Tételezzük most fel, hogy ágensünk egy 
Bukarestből érvényes, vissza nem váltható repülőjeggyel rendelkezik másnapra. Ebben 
a helyzetben értelmes célnak (goal) tűnik, hogy eljusson Bukarestbe. Mindazon cselek- 
véseket további mérlegelés nélkül el lehet dobni, amelyekkel nem lehet időben Buka- 
restbe érni, amivel az ágens döntési problémája nagymértékben egyszerűsödik. A célok 
segítik megszervezni a viselkedést, mivel korlátozzák az ágens által elérendő dolgok 
számát. A pillanatnyi helyzeten és az ágens hasznosságmértékén alapuló célmegfogal- 
mazás (goal formulation) a problémamegoldás első lépése. 

Célnak a világ állapotainak egy halmazát tekintjük, pontosabban azon állapotok halma- 
zát, amelyekben a cél teljesül. Az ágens feladata megkeresni, hogy amely cselekvések s0- 
rozata juttatja el őt egy célállapotba. Mielőtt azonban ezt megtehetné, el kell döntenie, 
hogy milyen cselekvéseket és állapotokat vizsgáljon meg. Amennyiben olyan szintű cse- 
lekvésekkel kellene dolgoznia, mint például ,.a bal lábadat tedd előrébb fél méterrel" 
vagy ,a kormánykereket hat fokkal tekerd balra", az ágens még a parkolóból sem len- 
ne képes kihajtani, nemhogy időben eljutni Bukarestbe, mivel az ilyen részletek szintjén 
a világban túl sok a bizonytalanság, és a megoldás túl sok lépésből állna. A probléma- 
megfogalmazás (problem formulation) az a folyamat, amely során eldöntjük, hogy 
amely cselekvéseket és állapotokat vegyünk figyelembe, ha egy cél adott. Ezt a folya- 
matot részletesebben is tárgyalni fogjuk. Egyelőre tételezzük fel, hogy az ágens az 
egyik nagyobb városból egy másik nagyobb városba való autózás szintjén szemléli a 
cselekvéseket. Ebből adódóan a figyelembe vett állapotok annak felelnek meg, hogy 
az ágens éppen egy adott városban van.! 

Az ágensünk azt tűzte ki célul, hogy Bukarestbe megy, és azt fontolgatja, hogy Arad- 
ról hová menjen. Három út vezet ki Aradról: egy Nagyszeben felé, egy Temesvár felé 
és egy Nagyzerénd felé. Ezek egyike sem éri el közvetlenül a célt, így amennyiben 
ágensünk nem ismeri ki magát tökéletesen Romániában, nem fogja tudni, hogy melyik 
úton induljon el.2 Más szóval az ágens nem fogja tudni eldönteni, hogy a lehetséges 
cselekvések közül melyik a legjobb, mert nincs elegendő információja a cselekvések 
hatására előálló állapotokról. Amennyiben az ágensnek nem áll rendelkezésére további 
tudás, akkor itt megakad. A legjobb amit tehet, hogy a cselekvésekből véletlenszerűen 
kiválaszt egyet. 

Tegyük fel azonban, hogy ágensünknek akár papíron, akár a fejében van egy Romá- 
nia-térképe. A térkép jelentősége, hogy információt nyújthat az ágensnek azokról az 
állapotokról, ahova eljuthat, illetve a végrehajtható cselekvésekről. Az ágens ezen in- 
formációt felhasználhatja egy hipotetikus utazás megtervezésére ezeken a városokon 
keresztül, hogy megtalálja a legjobb utat, amely végül elvezet Bukarestbe. Miután a tér- 
képen megtalált egy utat Aradról Bukarestbe, a célját el tudja érni, ha az utazás egyes 
állomásaihoz tartozó vezetési szakaszokat végrehajtja. Általánosságban: amennyiben 
egy ágens előtt közvetlenül több ismeretlen értékű lehetőség áll, ki tudja választani, 


) Vegyük észre, hogy ezek az állapotok valójában a világ állapotaiból képezett nagy haimazoknak felelnek 
meg. mivel a világ állapotai a valóság minden aspektusát meghatározzák. Fontos észben tartani a problémameg- 
oldás állapotai és a világ állapotai közötti különbséget. 

2 Feltételezzük, hogy legtöbb olvasónk ugyanebben a cipőben jár, és könnyen át tudja érezni ágensünk 
tanácstalanságát. Ezúton elnézést kérünk a romániai olvasóktól, akik számára ezen pedagógiai eszköz nem je- 
lent segítséget. 
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hogy mit tegyen, ha először megvizsgálja a különböző lehetséges cselekvéssorozatokat, 
amelyek ismert értékű állapotokba vezetnek, majd ezután kiválasztja a legjobbat. 

Az ilyen sorozat előállítási folyamatát keresésnek (search) nevezzük. A keresési 
algoritmus bemenete egy probléma, kimenete pedig egy cselekvéssorozat formájában 
előálló megoldás (solution). Miután előállt egy megoldás, az abban szereplő cselekvé- 
seket végre lehet hajtani. Ezt végrehajtási (execution) fázisnak szokás nevezni. Így 
előállt egy egyszerű , fogalmazd meg, keresd meg, hajtsd végre" ágenstervezési séma. 
Az előállt sémát a 3.1. ábra mutatja. A cél és a megoldandó probléma megfogalmazá- 
sa után az ágens egy keresési eljárást hív meg. Ezek után a megoldást használja cselek- 
vései vezérlésére, azt teszi, amit a megoldás a következő lépésnek javasol — ez tipiku- 
san a cselekvéssorozat első lépése —, és a végrehajtott lépést törli a cselekvéssorozatból. 
Miután a megoldást végrehajtotta, az ágens új célt keres. 





function EGYSZERŰ-PROBLÉMA-MEGOLDÓ-ÁGENS(érzékelés) returns egy cselekvés 
inputs: érzékelés, egy érzékelés 
static: sorozat, egy cselekvéssorozat, kezdetben üres 
állapot, a világ pillanatnyi állapotának valamilyen leírása 
cél, egy cél, kezdetben üres 
probléma, egy probléma megfogalmazása 


állapot — ÁLLAPOT-FRissírés(állapot, érzékelés) 

áf sorozat üres then 
cél 1 CÉL-MEGFOGALMAZÁS(állapot) 
probléma 1— PROBLÉMA-MEGFOGALMAZÁS(állapot, érzékelés) 
sorozat — KERESÉS(probléma) 

cselekvés — AJÁNLÁS(sorozat, állapot) 

sorozat —— MARADÉK(sorozat, állapot) 

return cselekvés 











3.1. ábra. Egy egyszerű problémamegoldó ágens. Először a célt és a problémát fogalmazza meg, majd a 
problémát megoldó cselekvéssorozatot keres, végül a cselekvéseket egyenként végrehajtja. Amikor kész 
vele. egy másik célt fogalmaz meg, és az egészet újrakezdi, jegyezzük meg. hogy a cselekvéssorozata vég- 
rehajtása alatt az ágens az érzékeléseivel nem foglalkozik. Feltételezi, hogy az általa megtalált megoldás 
mindig működőképes. 


Először a problémamegfogalmazás folyamatát írjuk le, majd a fejezet további része- 
it a KERESÉS függvény különböző változatainak ismertetésére fordítjuk. Ebben a feje- 
zetben nem tárgyaljuk részletesen az ÁLLAPOT-FRISSÍTÉS És a CÉL-MEGFOGALMAZÁS 
függvényeket. 

Mielőtt a részletekbe belemerülnénk, egy pillanatra álijunk meg és nézzük meg, hogy 
a problémamegoldó ágens hogyan illik bele a 2. fejezetben tárgyalt ágensek és környe- 
zetek sokaságába. A 3.1. ábrán látható ágenstervezet feltételezi, hogy a környezet stai 
kus (static), mivel a probléma megfogalmazása és megoldása semmilyen változásról 
nem vesz tudomást, amely esetleg a környezetben beáll. Az ágenstervezet azt is felté- 
telezi, hogy a kezdeti állapot ismert. Ennek ismerete akkor a legkönnyebb, amikor 
a környezet megfigyelhető (observable). Az , alternatív cselekvések számontartása" tu- 
lajdonképpen azt tételezi fel, hogy a környezet diszkrét (discrete). Végül a legfontosabb: 
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az ágenstervezet azt is feltételezi, hogy a környezet determinisztikus (deterministic). 
A problémamegoldások egyedi cselekvéssorozatok, így a váratlan eseményeket nem 
is tudják figyelembe venni. A megoldások végrehajtása ráadásul az érzékelésről nem is 
vesz tudomást! Annak az ágensnek, amely mondhatni csukott szemmel hajtja végre a 
terveit, eléggé biztosnak kell lennie a dolgában (szabályozáselméletben az ilyen rend- 
szereket nyílt hurkúnak — open-loop - hívják, mert az érzékelések figyelmen kívül ha- 
gyása az ágens és a környezete közötti hurkot felbontja). E feltételezések azt jelentik, 
hogy a környezetek lehető ltegegyszerűbbikéve! foglalkozunk, és ez egyben indokolja 
azt is, hogy e fejezet miért a könyv elején található. A 3.6. alfejezet rövid bepillantást 
ad abba, hogy mi történik, amikor a megfigyelhetőség és a determinizmus feltételezé- 
séről lemondunk. Ezt a témát sokkal mélyebben a 12. és a 17. fejezet tárgyalja. 


Jól definiált problémák és megoldások 


Egy probléma (problem) formális megragadásához az alábbi négy komponensre van 
szükség: 


s A kiinduló állapot (initial state), amiből az ágens kezdi a cselekvéseit. A romániai 
ágensünk kezdeti állapotát például Benn(Arad)-ként lehetne leírni. 

s Az ágens rendelkezésére álló lehetséges cselekvések (actions) halmaza. A leg- 
inkább használatos leírás? az állapotátmenet-függvényt (successor function) alkal- 
mazza. Egy adott x állapot esetén az ÁLLAPOTÁTMENET-Fv(x) visszaadja a rendezett 
(cselekvés, utódállapot) párok halmazát, ahol minden cselekvés az x állapotban 
legális cselekvések egyike, és minden utódállapotot egy cselekvésnek az x állapotra 
való alkalmazásával nyerünk. A Benn(Arad) állapotban az állapotátmenet-függvény 
a romániai problémára a 


((Menj(Nagyszeben), Benn(Nagyszeben)), (Menj(Temesvár), Benn(Temesvár)), 
(Menj(Nagyzerénd), Ben(Nagyzerénd) ) ) 


párokat adná vissza. 

A kezdeti állapot és az állapotátmenet-függvény együttesen implicit módon defini- 
álják a probléma állapotterét (state space): azon állapotok halmazát, amelyek a ki- 
induló állapotból elérhetők. Az állapottér egy gráfot alkot, amelynek csomópontjai 
az állapotok és a csomópontok közötti élek a cselekvések. (Románia 3.2. ábrán 
látható térképe állapottérként értelmezhető, ha minden útját kétirányú gépkocsi- 
vezetési cselekvésként fogjuk fel). Az állapottér egy útja (path) az állapotok egy 
sorozata, amely állapotokat a cselekvések egy sorozata köt össze. 

s A célteszt (goal test), amely meghatározza, hogy egy adott állapot célállapot-e. 
Néha létezik a lehetséges célállapotok egy explicit halmaza, és a teszt egyszerűen 
megnézi, hogy az ágens elérte-e ezek egyikét. Romániában az ágens célja a ( Benn(Bu- 
karest)) szingleton. 


3 Egy altematív megfogalmazás az operátorok (operators) egy halmaza, amelyeket egy állapotra alkalmazva 
lehet az utódállapotokat generálni. 
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Néha a cél valamilyen absztrakt tulajdonsággal van definiálva, nem pedig explicit 
módon felsorolt állapothalmazzal. A sakkban például az úgynevezett , sakk-matt" 
állapot elérése a cél, amelyben az ellenfél királya az őt ért támadás elől nem tud 
elmenekülni. 

s Egy útköltség- (path cost) függvény, amely minden úthoz hozzárendel egy költséget. 
A problémamegoldó ágens azt a költségfüggvényt fogja választani, amely a saját ha- 
tékonysági mértékének felel meg. A Bukarestbe siető ágens számára az idő a lényeg, 
így az útköltség lehetne például az út a km-ben kifejezett hossza. Ebben a fejezetben 
az út költségének az utat alkotó egyes cselekvések költségének összegét fogjuk tekin- 
teni az út mentén. Az x állapotból az y állapotba vezető cs cselekvés lépésköltsége 
(step cost) legyen /A(x, cs, y). Romániában a lépésköltségeket a 3.2. ábra mutatja 
úttávolságok formájában. Feltételezzük. hogy a lépésköltségek nemnegatívak.! 


Az előbbi elemek definiálják a problémát és egy közös adatstruktúrába foghatók, amit a 
problémamegoldó algoritmus bemenetének tekintünk. A probléma megoldása (solution) 
nem más, mint a kiinduló állapotból a célállapotba vezető út. A megoldás kvalítását az 
útköltségfüggvény méri, és egy optimális megoldásnak (optimal solution) a megoldások 
közt a legkisebb lesz az útköltsége. 


A problémák megfogalmazása 


Az előbbi részben a , hogyan jutunk el Bukarestbe" probléma olyan megfogalmazását 
javasoltuk, amely a kezdeti állapotból, az állapotátmenet-függvényből, a célállapot- 
tesztből és az útköltségből áll. Ez a megfogalmazás értelmesnek tűnik, a valós világ 
számos aspektusát mégis figyelmen kívül hagyja. Hasonlítsuk csak össze az általunk 
választott egyszerű állapotleírást, Benn(Arad), egy tényleges országjáró kirándulással, 
ahol a világ állapota rengeteg mindent tartalmazhat: kivel utazunk. mit közvetít a rádió, 
milyen tájat látunk az ablakon át, van-e közelben rendőr, milyen messze van a követ- 
kező pihenőhely, milyen az út állapota, milyen az időjárás és sok-sok más. 

Ezeket a részleteket kihagytuk az állapotleírásokból, mert nem lényegesek a Buka- 
restbe vezető út megkeresésében. Egy reprezentációból a részletek eltávolítását abszt- 
rakciónak (abstraction) nevezzük. 

Az állapotleírás absztrahálása mellett magukat a cselekvéseket is absztrahálni kell. 
Egy vezetési cselekvésnek számos hatása van. Amellett, hogy megváltoztatja a gép- 
kocsi és utasai helyét, időbe telik, üzemanyagot fogyaszt, szennyezi a levegőt és meg- 
változtatja az ágenst (azt mondják, hogy az utazás kiszélesíti a látókört). A mi megfogal- 
mazásunkban csak a helyváltoztatást vesszük figyelembe. Van számos olyan cselekvés, 
amit teljesen elhagyunk: például a rádió bekapcsolását, az ablakon való kinézést, a lassí- 
tást, mert rendőr van a közelben stb. És persze a , fordítsd a kormányt balra 3 fokkaP" 
szintű cselekvésekkel sem foglalkozunk. 

Lehetünk-e pontosabbak a megfelelő absztrakciós szint meghatározásában? A meg- 
választott absztrakt állapotokra és cselekvésekre úgy gondolunk, hogy azok a részletes 


4 A negatív költségek következményeivel a 3.17. feladatban foglalkozunk. 
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3.2. ábra. Románia egy részének sematikus országúti térképe 


valós állapotok és cselekvések egész halmazaihoz tartoznak. Most tekintsük az absztrakt 
probléma egy megoldását: például az Aradról Nagyszebenbe, majd Rimnicu Vilceába, 
Pitegtibe és Bukarestbe vezető utat. Ez az absztrakt megoldás rengeteg részletesebb út- 
nak felel meg. Például Nagyszeben és Rimnicu Vilcea között vezethettünk bekapcsolt 
rádióval, majd az utazás további részére kikapcsolhattuk a rádiót. Az absztrakció érvé- 
nyes, ha az absztrakt megoldást megoldássá fejthetjük ki egy részletesebb világban is. 
Elégséges feltétel az, hogy minden olyan részletes állapothoz, mint az , Aradon van", 
létezik egy részletes út valamelyik olyan állapotboz, mint a , Nagyszebenben van" stb. 
Az absztrakció hasznos, ha a megoldásbeli cselekvések végrehajtása az eredeti problé- 
mánál egyszerűbb. Ebben az esetben ezek eléggé egyszerűek ahhoz, hogy egy átlagos 
gépkocsivezető ágens végre tudja azokat hajtani minden további keresés vagy tervkészí- 
tés nélkül. Így egy jó absztrakció megválasztása magában foglalja az érvényesség meg- 
őrzése mellett a lehető legtöbb részlet törlését, és annak biztosítását, hogy az absztrakt 
cselekvéseket könnyű legyen véghezvinni. Ha nem lenne meg a hasznos absztrakciók 
megalkotásának képessége, akkor az intelligens ágensek a valós világban teljesen hasz- 
navehetetlenek lennének. 





3.2. PÉLDAPROBLÉMÁK 


A problémamegoldó megközelítést rengeteg feladatkörben alkalmazták. Néhányat az 
alábbiakban sorolunk fel, megkülönböztetve az úgynevezett játék- és a valósvilág-beli 
problémákat. A játékproblémák (toy problems) rendeltetése, hogy segítségükkel 
a különféle problémamegoldó módszereket illusztrálni tudjuk vagy ki tudjuk próbálni. 
Az ilyen problémák egzakt tömör leírása megadható. Ez azt jelenti, hogy különböző kuta- 
tók így könnyűszerrel használhatják az algoritmusok hatékonysági összehasonlításához 
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3.3. ábra. A porszívóvilág állapottere. Az élek cselekvéseket jelentenek: B — Balra, J z Jobbra, $ — Szív. 


A valósvilág-beli problémák (real-world problems) azok, amelyek megoldása tényleg 
érdekes az emberek számára. Ezeknek nincs egyetlen általánosan elfogadott megfogal- 
mazásuk, mi azonban megpróbáltuk érzékeltetni az általános megfogalmazásuk jellegét. 


Játékproblémák 


Az első vizsgált példa a 2. fejezetben bevezetett porszívóvilág (vacuum world) (lásd 
2.2. ábra). Ezt problémaként az alábbi módon definiálhatjuk: 


. Állapotok: az ágens két hely egyikében lehet. Mindegyik lehet piszkos, de lehet 
tiszta is. Így 2 x 2? — 8 lehetséges állapotról beszélhetünk. 

s Kezdeti állapot: akármelyik állapot lehet kezdeti állapot. 

.  Állapotátmenet-függvény: a három (Balra, Jobbra, Szív) cselekvés alkalmazásából 
adódó legális állapotokat generálja. A teljes állapottér a 3.3. ábrán látható. 

s  Célteszt: ellenőrzi, hogy minden négyzet tiszta-e. 

s Útköltség: minden lépés költsége 1. így az út költsége megegyezik az út lépéseinek 
a számával. 


A valós világgal összevetve e probléma jellemzői a diszkrét lokációk, a diszkrét kosz, 
a megbízható takarítás, valamint az, hogy takarítás után piszok soha nem keletkezik 
újra (a 3.6. alfejezetben ezeket a feltételezéseket feladjuk). Fontos megjegyezni, hogy 
az állapotot az ágens és a kosz helyzete együttesen határozza meg. Egy nagyobb, n 
helyű környezetben s 2" állapot van. 

A 3.4. ábrán bemutatott 8-as kirakójáték (8-puzzle) egy 3 x 3-as táblából, 8 számo- 
zott kockából és egy üres helyből áll. Az üres hely melletti kockát be lehet csúsztatni 
az üres helyre. A cél egy meghatározott állás, mint például az ábra jobb oldalán látható 
állás elérése. A probléma szokásos megfogalmazása a következő: 
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Kiinduló állapot 


3. ábra. A 8-as kirakójáték egy tipikus feladványa 


. Állapotok: az állapotleírás meghatározza mind a nyolc kocka és az üres hely pozí- 
cióját a kilenc lehetséges pozíció egyikében. 

s Kezdeti állapot: akármelyik állás lehet kezdeti állapot. Figyeljük meg, hogy min- 
den egyes célt pontosan az állapotok feléből lehet elérni (3.4. feladat). 

s  Állapotátmenet-függvény: a négy cselekvés (üres hely megy Balra, Jobbra, Fel, 
Le) alkalmazásából adódó legális állapotokat generálja. 

s  Célteszt: ellenőrzi, hogy az állapot megegyezik-e a 3.4. ábrán mutatott célállapottal 
(más célkonfiguráció is lehetséges). 

s. Útköltség: minden lépés költsége 1. így az út költsége megegyezik az út lépéseinek 
a számával. 


Milyen absztrakciókhoz folyamodtunk itt? A cselekvéseket a kezdeti és végállapotuk 
erejéig absztraháltuk, elmozdítás közben egy kocka közbülső helyzeteit figyelmen 
kívül hagytuk. Az olyan cselekvésektől is elvonatkoztattunk, mint a tábla megrázása, 
ha a kockák megakadtak, vagy a kockák késsel való kiszedése és visszahelyezése. Amit 
kaptunk, az a játék szabálykészlete, a manipulációk fizikai részleteitől eltekintve. 

A kirakójáték a csúsztatós kirakójátékok (sliding-block puzzles) családjába tarto- 
zik, amelyeket gyakran új kereső algoritmusok tesztelésére alkalmaznak az MI-ben. Ez 
az általános osztály NP-teljes, így nem várható, hogy lényegesen jobb módszert lehet 
találni az itt és a következő bekezdésben leírt keresési algoritmusoknál. A 8-as kirakó- 
játéknak 942 — 181 440 elérhető állapota van, és így e játék könnyen megoldható. 
A 15-ös kirakójátéknak (a 4 x 4-es táblán) kb. 10 billió állapota van, és a legjobb algo- 
ritmusok a véletlenül generált eseteket optimálisan néhány milliszekundum alatt oldják 
meg. A 24-es játéknak (az 5 x 5-ös táblán) kb. 1025 állapota van, és a véletlenszerűen 
kiválasztott esetek optimális megoldása még mindig kemény dió a jelenlegi gépek és 
algoritmusok számára. 

A 8-királynő probléma (8-gueens problem) célja, hogy 8 királynőt úgy helyezzünk 
el egy sakktáblán, hogy egyáltalán ne támadják egymást. (Egy királynő egy vele azonos 
sorban, oszlopban vagy átlóban lévő bábut támad.) A 3.5. ábra egy sikertelen megoldá- 
si kísérletet mutat: a jobb szélső oszlopban lévő királynőt támadja a bal felső sarokban 
lévő királynő. 

Bár hatékony célalgoritmusok léteznek ezen probléma és a teljes n-királynő probléma 
megoldására, a királynőfeladat mindamellett érdekes tesztproblémája marad a keresési 
algoritmusoknak. Két fő megfogalmazása létezik. Az inkrementális megfogalmazás- 
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3.5. ábra. Egy majdnem jó megoldás a 8-királynő problémára. (A megoldás megkeresését az olvasóra 
bízzuk.) 


ban (incremental formulation) az operátorok az állapotleírást bővítik, az üres állapot- 
tól kezdve. A 8-királynő probléma esetén ez azt jelenti, hogy a királynőket egyenként 
helyezzük el a sakktáblán. A teljes állapot leírásban (complete-state formulation) 
először felhelyezzük mind a 8 királynőt, majd mozgatjuk őket. Az útköltség mindkét 
esetben érdektelen számunkra, mert csak a végső állapot számít. A probléma első ink- 
rementális megfogalmazása lehet a következő: 


Állapotok: egy állapot a 0 ... 8 királynő, tetszőleges elrendezése a táblán. 
Kezdeti állapot: a táblán nincs egy királynő sem. 
Állapotátmenet-függvény: helyezz egy új királynőt egy üres mezőre. 
Célteszt: 8 királynő a táblán és egyik sincs támadás alatt. 


9... 


Ebben a megfogalmazásban 64 x 63 x ... 57 sz 1.8 x 10! lehetséges vizsgálandó soro- 
Zatunk van. Sokkal ésszerűbb választás lenne, ha figyelembe vennénk azt a tényt, hogy 
egy már eleve támadt mezőre nincs értelme letenni egy királynőt: 


. Állapotok: n(0£ n £ 8) királynő olyan elrendezése a táblán, hogy az n bal oldali 
oszlopban oszloponként egy található úgy, hogy nem támadják egymást. 

s,  Állapotátmenet-függvény: helyezz egy királynőt a bal szélső, még üres oszlopba 
úgy, hogy azt ne támadja egyetlen királynő sem. 


Ez a megfogalmazás a 8-királynő probléma állapotterét 1.8 x 10!9-ről 2057 méretű 
térré csökkenti, minekutána megoldást könnyű megtalálni. Másrészt 100 királynő a ko- 
rábbi megfogalmazás 109 állapothoz vezet, míg a javítottnál csak kb. 105? állapotunk 
lesz (3.5. feladat). Ez óriási redukció, a javított eset azonban még mindig túl nagy az 
ebben a fejezetben ismertetett algoritmusok számára. A teljes állapot leírásról a 4. fe 
jezetben olvashatunk, az 5. fejezet viszont egy olyan egyszerű algoritmust ki 
amellyel a millió királynőt számláló problémát is könnyen meg lehet oldani. 
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Valósvilág-beli problémák 


Már korábban láttuk, hogy az útkeresési problémát (route-finding problem) hogyan 
definiálhatjuk a megadott helyek és a közöttük lévő összeköttetések segítségével. 
Az útkereső algoritmusokat számos területen alkalmazzák. Használják például számí- 
tógép-hálózatokban útvonalkeresésre, katonai műveletek tervezésénél és légi útvonal- 
tervező rendszerekben is. Általában nehéz az ilyen problémákat specifikálni. Nézzük 
meg a légi útvonaltervezési probléma egy egyszerűsített példáját: 


. Állapotok: minden állapotot egy hely (például egy repülőtér) és az aktuális időpont 
azonosít. 

. Kezdeti állapot: a probléma specifikálja. 

. Állapotátmenet-függvény: azokat az állapotokat adja vissza, amelyek az aktuális 
repülőtérről valamely másikra olyan menetrendbeli járatok igénybevételével kelet- 
keznek (esetleg tovább pontosítva, hogy mely osztályra és melyik konkrét ülésre 
vonatkozik az utazás), amelyek később indulnak, mint az aktuális időpont plusz a 
repülőtéri tranzit ideje. 

.  Célteszt: elértük-e a célállomást? 

s Útköltség: függ a pénzügyi költségektől, várakozási időtől, repülési időtől, vámkeze- 
lési és útlevél-vizsgálati procedúráktól, az ülés minőségétől, a nap időszakától, a repü- 
lőgép típusától, az utaskedvezményektől stb. 


A kereskedelmi útvonaljavasló rendszerek a probléma valami hasonló megfogalmazá- 
sát használják, sok további bonyolítással, hogy a repülőtársaságok bonyolult viteldíj- 
struktúráit kezelni tudják. Minden tapasztalt utas tudja azonban, hogy nem minden re- 
pülőút zajlik a tervek szerint. Egy igazán jó rendszernek eshetőségi tervekkel — például 
az alternatív járatokra történő tartalék helyfoglalásokkal — is tudnia kell foglalkozni, 
ameddig persze ezeket a költség és az eredeti terv összeomlásának a valószínűsége 
igazolja. 

A körutazási problémák (touring problems) az útkeresési problémák rokonai egy 
fontos különbséggel. Tekintsük például azt a problémát, hogy , A 3.2. ábra minden egyes 
városába látogass el legalább egyszer úgy, hogy Bukarestből indulj, és az utat ott is fejezd 
be." Az útkeresési problémához hasonlóan a cselekvés itt is két szomszédos város közöt- 
ti utazásnak felel meg. De ebben a problémában az állapottér alapvetően más. Az ágens 
helye mellett minden egyes állapotban tárolni kell az ágens által korábban meglátogatott 
városokat is. Így a kiinduló állapot ebben az esetben a . Bukarestben vagyok, eddig meg- 
látogattam (Bukarestet) állapot lenne, míg egy tipikus közbenső állapot a ,,Vasluiban 
vagyok, eddig meglátogattam (Bukarestet, Csalánost, Vasluitj" állapot. A célteszt ellen- 
őrizné, hogy az ágens Bukarestben van-e, és végiglátogatta-e mind a 20 várost. 

Az utazó ügynök probléma (Travelling Salesperson Problem — TSP) egy kör- 
utazási probléma, amelyben minden várost pontosan egyszer kell meglátogatni. A cél 
a legrövidebb út megkeresése. A probléma NP-nehéz, de hatalmas erőfeszítések történ- 
tek a TSP-algoritmusok képességeinek javítására. Ezen algoritmusokat az utazó ügynö- 
kök útjainak megtervezése mellett nyomtatott áramkörök furatainak készítésénél a fúró 
automata mozgatásának megtervezésére, továbbá áruházak rakodógépeinek útvonalter- 
vezésére ís alkalmazták. 
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A VESI elhelyezési (VLSI kayout) problémában komponensek és összeköttetések 
millióit egy chipen kell elhelyezni, a terület, az áramköri késleltetés és a szórt kapa- 
citások minimalizálása és a gyártási kihozatal maximalizálása mellett. Az elhelyezési 
probléma a logikai tervezés fázisát követi. és általában két részből áll: cellaelrendezés- 
ből (cell layout) és huzalozásból (channel routing). A cellaelrendezés során az áram- 
kör primitív komponenseit cellákba rendezik, amelyek mindegyike valamilyen jól defi- 
niált funkciót lát el. Minden egyes cellának rögzített nyomtatási képe (méret és alak) 
van, és adott számú összeköttetést igényel a többi cellához. A cél az, hogy az egyes cel- 
lákat úgy helyezzük el a chipen, hogy azok ne lapolódjanak át, és a cellák között legyen 
megfelelő hely az összekötő vezetékek számára. A huzalozás során minden egyes veze- 
téknek megfelelő vezetési útvonalat keresünk a cellák között. Ezek a keresési prob- 
lémák hihetetlenül összetettek. de mindenképpen érdemes a megoldásukat megtalálni. 
A 4. fejezetben látni fogunk néhány algoritmust, amelyek képesek megoldani ezeket 
a problémákat. 

A robotnavigáció (robot navigation) a korábban leírt útkeresési probléma általáno- 
sítása. Az utak diszkrét halmaza helyett a robot egy folytonos térben mozog (elvben) 
végtelen cselekvés- és állapothalmazzal. Egy egyszerű, sík felületen mozgó kör alakú 
robot esetén az állapot lényegében kétdimenziós. Amennyiben a robotnak karja és lába 
ís van, akkor azokat is vezérelni kell, így a keresési tér sokdimenzióssá válik. Már a 
keresési tér végessé tételéhez is kifinomult technikákra van szükség. A 25. fejezetben 
megvizsgálunk néhány ilyen módszert. A probléma összetettsége mellett a valós ro- 
botoknak foglalkozniuk kell az érzékelőik által szolgáltatott jelek és a motorvezérlők 
hibáival is. 

Összetett objektumok robotok általi automatikus összeszerelését (automatic as- 
sembly seguencing) először a FREDDY robot mutatta be (Michie, 1972). Azóta lassú, de 
biztos előrehaladás tapasztalható ezen a területen. Ma már például villanymotorok auto- 
matikus összeszerelése gazdaságossági szempontból is kivitelezhető. Az összeszere- 
lési feladatoknál a probléma az alkatrészek összeszerelési sorrendjének megkeresése. 
Amennyiben rossz szerelési sorrendet választunk, valamikor a későbbiek folyamán egy 
adott alkatrészt nem tudunk egy másik alkatrész kiszerelése nélkül beszerelni. Annak 
eldöntése, hogy az összeszerelési sorrend egy lépése megvalósítható-e vagy sem, a ro- 
botnavigációhoz hasonló összetett geometriai keresési probléma. Így az összeszerelési 
sorrend megtervezésében a költséges feladat egy kivitelezhető következő lépés megter- 
vezése. Minden gyakorlati fontosságú algoritmusnak kerülnie kell az állapottér egy kis 
töredékén túlmenő feltárását. Egy másik fontos összeállítási probléma a fehérjeterve- 
zés (protein design), ahol a célkitűzés olyan aminosav-szekvencia megkeresése, amely 
valamilyen betegség gyógyítása szempontjából lényeges tulajdonságokkal rendelkezik 
és háromdimenziós fehérjévé formálható. 

Az utóbbi időben egyre nagyobb a kereslet az interneten kereső (Internet search- 
ing) szoftverrobotok iránt, amelyek kérdésekre választ, kapcsolódó információkat, 
vagy kereskedelmi üzletek lehetőségét kutatják fel. A keresési technikák szempontjá- 
ból ez igazán jó alkalmazás, mert eléggé nyilvánvaló, hogy az internethez egy gráfszerű 
kép rendelhető, ahol a csomópontok (weboldalak) linkekkel össze vannak kapcsolva. 
Az internetkeresés teljes leírását a 10. fejezetre hagyjuk. 
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3.3. MEGOLDÁSOK KERESÉSE 


Az előzőkben láttuk, hogyan kell egy problémát definiálni. A hátralévő lépés — a meg- 
oldás megkeresése — az állapottérben végrehajtott kereséssel történik. Ebben a részben 
olyan keresési technikákkal foglalkozunk, amelyek egy explicit keresési fát (search 
tree) használnak, amelyet az állapotteret együttesen definiáló kezdeti állapotból és az 
állapotátmenet-függvényből generálnak. Általánosságban, ha egy állapotot több úton is 
elérhetünk, inkább keresési gráfról. mint keresési fáról beszélünk. Ezzel az igen fontos 
bonyolítással később a 3.5. alfejezetben foglalkozunk. 


(a) Kezdeti állapot 










(b) Arad kifejtése után 


1c) Nagyszeben kifejtése után 


3.6. ábra. Az Arad és Bukarest közötti útkeresési probléma részleges keresési fái. A kifejtett csomó- 
pontokat árnyékoltuk, a legenerált, de még ki nem fejtett csomópontok vastagon keretezettek, a még le 
nem generált csomópontokat pedig halvány szaggatott vonalak jelzik. 
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A 3.6. ábrán láthatjuk az Arad és Bukarest közötti útkereső probléma keresési fájának 
egy kezdeti kifejtését. A keresési fa gyökere az a keresési csomópont (search node), 
amely a Benn(Arad) kezdeti állapotnak felel meg. Az első lépés annak ellenőrzése, hogy 
vajon ez célállapot-e. Nyilvánvalóan nem az, de fontos ellenőrizni, hogy meg tudjuk ol- 
dani az olyan beugrató problémákat is, mint amilyen például az , Aradról indulva jussunk 
el Aradra", Mivel ez nem célállapot, egyéb állapotokat is meg kell vizsgálnunk. Ezt az 
aktuális állapot kifejtésével (expanding) tesszük, azaz az állapotátmenet-függvénynek 
az aktuális állapotra történő alkalmazásával, amivel az állapotok egy új halmazát gene- 
ráljuk (generating). Ebben az esetben három új állapotot kapunk: Benn(Nagyszeben), 
Benn(Temesvár) és Benn(Nagyzerénd). Most el kell döntenünk, hogy a három lehető- 
ség közül melyik utat kövessük. 

A keresés lényege a következő: egy lehetőséget kiválasztani, és a többit későbbre ha- 
lasztani arra az eshetőségre, ha az első választás nem vezetne megoldásra. Tételezzük 
fel, hogy elsőnek Nagyszebent választjuk. Ellenőrizzük, hogy ez célállapot-e (nem az), 
majd kifejtjük, aminek hatására a Benn(Arad), Benn(Fogaras). Benn(Nagyvárad) és 
Benn(RimnicuvVilcea) állapotokat kapjuk. Ezek után e négy közül bármelyiket választ- 
hatjuk, vagy akár vissza is mehetünk és választhatjuk Nagyzeréndet vagy Temesvárt. 
Folytatjuk a kiválasztást, a célállapot-ellenőrzést és a kifejtést, míg egy megoldást nem 
találunk, vagy amíg el nem fogynak a kifejtendő állapotok. A kifejtendő állapot kivá- 
lasztását a keresési stratégia (search strategy) határozza meg. Az általános fakereső 
algoritmus informális megfogalmazását a 3.7. ábra mutatja. 





function FA-KERESÉSÍprobléma, stratégia) returns egy megoldás vagy kudarc 
a probléma kezdeti állapotából kiindulva iniciatizáld a keresési fát 
loop do 
áf nincs kifejtendő csomópont then return kudarc 
a stratégiának megfelelően válassz ki kifejtésre egy levélcsomópontot 
4 a csomópont célállapotot tartalmaz then return a hozzá tartozó megoldás 
else fejtsd ki a csomópontot és az eredményül kapott csomópontokat, és add a keresési fához 
end 








3.7. ábra. Az általános fakeresési algoritmus informális leírása 


Fontos megkülönböztetni az állapotteret és a keresési fát. Az útkeresési probléma 
esetében az állapottér csak 20 állapotból áll, minden egyes városhoz tartozik egy álla- 
pot. Ebben az állapottérben azonban végtelen sok út vezet, így a keresési fa végtelen 
sok csomópontból áll. Például az Arad-Nagyszeben, Arad-Nagyszeben-ÁArad, Arad— 
Nagyszeben-Arad-Nagyszeben három út az első három a végtelen számú útszekvenciá- 
ból. (Egy jó keresési algoritmus nyilvánvalóan elkerüli az ilyen utak követését. A 3.5. 
alfejezetben megmutatjuk hogyan.) 

A csomópontokat sokféle módon lehet reprezentálni, de mi feltételezzük, hogy egy 
csomópont egy öt komponensből álló adatszerkezet: 


. ÁLLAPOT: az állapottérnek a csomóponthoz tartozó állapota; 
§  SZÜLŐ-CSOMÓPONT: a keresési fa azon csomópontja, amely a kérdéses csomópontot 
generálta; 
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§ CSELEKVÉS: a csomópont szülő-csomópontjára alkalmazott cselekvés; 

s. ÚT-KÖLTSÉG: a kezdeti állapotból a kérdéses csomópontig vezető út általában g(n)-nel 
jelölt költsége, ahogy ezt a szülőmutatók jelzik; 

5 MÉLYSÉG: a kezdeti állapotból vezető út lépéseinek a száma. 


Fontos visszaidéznünk a csomópontok és az állapotok közti különbséget. A csomópont 
egy adatnyilvántartásra használt adatszerkezet, amit egy keresési fa leírására használunk. 
Egy állapot a világ egy konfigurációja. Így a csomópontok a SZÜLŐ-CSOMÓPONT mutatók 
által definiált meghatározott úton találhatók, míg az állapotok nem. Továbbá könnyen 
előfordulhat, hogy két különböző csomópont egyazon állapotot tartalmaz. ha ezt az 
állapotot két különböző cselekvéssorozattal generálták le. A csomópont-adatstruktúrát 
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3.8. ábra. A keresési fa alapvető építő adatstruktúrái a csomópontok. Minden csomópontnak van szülője, 
állapota és számos adminisztráló adatmezeje. A nyilak a gyerekektől a szülőkig mutatnak. 


Valahogy nyilván kell tartanunk a legenerált, kifejtésre váró csomópontokat is — ezt 
a gyűjteményt, listát peremnek (fringe) nevezik. A perem minden eleme egy levélcso- 
méópont (leaf node), azaz egy olyan csomópont, amelynek a fában nincsenek követői. 
A 3.6. ábrán a fák pereme a vastagon bekeretezett csomópontokból áll. A perem leg- 
egyszerűbb reprezentációja egy csomóponthalmaz lenne. A keresési stratéga ekkor 
olyan függvény lenne, amely a következő lépésben kifejtendő csomópontot ebből a hal- 
mazból választaná ki. Bár elvi szempontból ez nyilvánvaló megoldás, számításigény 
szempontjából drága lenne, mert a keresési stratégia függvénynek a halmaz minden 
egyes elemét végig kellene néznie, hogy ki tudja választani a legjobb csomópontot. 
Ezért a továbbiakban feltesszük, hogy a csomópontgyűjtemény egy várakozási sorként 
(agmene) van megvalósítva. A soron végezhető műveletek az alábbiak: 


. SoRT-LÉTREHOZ[elem, ...) létrehoz egy az adott elemeket tartalmazó sort. 
5 ÜRESY(sor) csak akkor ad vissza igaz értéket, ha a sor üres. 
s . ELSŐ-ELEM(sor) visszaadja a sor első elemét. 
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a TÁVOLÍTSD-EL-AZ-ELSŐ-ELEMET(Ssor) visszaadja az ELSŐ-ELEM(sor)-t és ezt eltávo- 
lítja a sorból. 

s  BEszÚR(elem, sor) egy elemet szúr be a sorba. 

. . BESZÚR-MiIND(elemek, sor) egy elemhalmazt beszúr a sorba. 


Ezen definíciók felhasználásával az általános fakeresési algoritmus egy formálisabb 
definícióját adhatjuk meg. Ezt a 3.9. ábra mutatja. 





function Fa-KEREsÉs(probléma. perem) returns egy megoldás vagy kudarc 


perem — BESZÚR(CSOMÓPONTOT-LÉTREHOZ(KIINNDULÓ-ÁLLAPOTÍ probléma), perem) 
loop do 
if ÜRESZ(pereni) then return kudarc 
csomópont 4— TÁVOLÍTSD-EL-Az-ELSŐ-ELEMETÍperem) 
if CéL-Teszríprobléma) alkalmazva az ÁLLAPOT(csomópont) állapotra igazat ad vissza 
then return MEGOLDÁSÍcsomóponi) 
perem §— BESZÚR-MIND(KIFEITícsomópont, probléma), perem) 





function KIFEJT(csomópont, probléma) returns a csomópontok halmazát 


követők — üres halmaz 

for each (cselekvés, eredmény) it ÁLLAPOTÁTMENET-FvIproblémal(ÁLLAPOT[csomóponi]) do 
5 — az új CSOMÓPONT 
Áurapor(s) — eredmény 
SZÜLŐ-CSOMÓPONTÍS] — csomópont 
CSELEKVÉS[s] — cselekvés 
Úr-KöLrTséG[s] — ÚrT-KöLrséG[csomópont] -- LÉPES-KÖLTSÉG(csomápont, cselekvés, 5) 
MéLysÉG (s) — MéLysÉG[csomópont] -t 1 
s hozzáadása a követők-höz 

return követők 











3.9. ábra. Az általános fakeresési algoritmus. (Vegyük észre, hogy a perem argurnentumnak egy üres 
somak kell lennie, és a sor típusa befolyással lesz a keresés sorrendjére.) A MEGOLDÁS függvény a szü- 
lőmutatók gyökérig való követésével kinyert cselekvéssorozatot adja vissza. 


A problémamegoldó hatékonyság mérése 


A problémamegoldó algoritmus kimenete vagy kudarc, vagy egy megoldás (egyes al- 
goritmusok végtelen hurokba kerülhetnek és soha nem térnek vissza válasszal). Mi az 
algoritmusok hatékonyságát négyféle módon fogjuk értékelni: 


a Teljesség (completeness): az algoritmus garantáltan megtalál egy megoldást, ameny- 
nyiben létezik megoldás 

s Optimalitás (optimality): a stratégia megtalálja az optimális megoldást, ahogy azt 
a 100-101. oldalon definiáltuk? 

"  Időigény (time complexity): mennyi ideig tart egy megoldás megtalálása? 

.  Tárigény (space complexity): a keresés elvégzéséhez mennyi memóriára van szükség? 
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Az idő- és tárigényről beszélve mindig a probléma nehézségének valamilyen mértékét 
tartjuk szem előtt. Az elméleti számítástudományban egy tipikus ilyen mérték az állapottér 
gráf nagysága, mivel a gráf a kereső program bemenetére adott explicit adatstruktúrának 
tekinthető (erre egy példa Románia térképe). Az MI-ben, ahol a gráfot implicit formában 
a kezdeti állapottal és az állapotátmenet-függvénnyel reprezentáljuk, és ahol a gráf sok- 
szor végtelen, akomplexitást három tényezővel fejezzük ki. Ezek: b — az elágazási ténye- 
ző (branching factor), vagyis a követők maximális száma minden csomópontban, d — a 
legsekélyebb célállapot mélysége és m — az állapottérben található utak maximális hossza. 
Az időt gyakran a keresés közben generáltő csomópontok számával, a tárat pedig 
a memóriában maximálisan tárolt csomópontok számával mérik. 
A keresés hatékonyságának becslésénél gondolhatunk a keresési költségre (search cost), 
amely tipikusan az időigénytől függ, de tartalmazhat egy tárigényt jelző komponenst is; 
vagy használhatjuk a keresés összköltségét (total cost), amely a megoldás útköltségét és a 
keresési költséget kapcsolja össze. Az Aradról Bukarestbe vezető útkeresési probléma ese- 
tén a keresési költség a keresés ideje, a megoldási költség pedig a teljes út hossza km-ben. 
Így amikor a teljes költséget akarjuk kiszámítani, kilométert és milliszekundumot kellene 
Összeadnunk. Ez nem mindig egyszerű, mert nem létezik semmilyen , hivatalos váltószám" 
a kettő között, ennél a problémánál azonban értelmesnek tűnhet a kilométereket millisze- 
kundumokra átszámítani a gépkocsi átlagsebességét használva (mert az ágensnek az idő 
a fontos). Ez lehetővé teszi, hogy az ágens megtalálja azt a kompromisszumot, amikor a 
legrövidebb út keresését célzó minden további számítás improduktívvá válik. A különböző 
javak közötti kompromisszum általános problémájára a 16. fejezetben még visszatérünk. 





3.4. NEM INFORMÁLT KERESÉS 


Ez az alfejezet öt keresési stratégiát tárgyal, amelyek a nem informált (vaknak is neve- 
zett) keresés (noninformed (blind) search) cím alá sorolhatók. A kifejezés azt jelenti, 
hogy ezen stratégiáknak semmilyen információjuk nincs az állapotokról a probléma defi- 
níciójában megadott információn kívül. Műki során mást nem tehetnek, mint a követ- 
kező állapotok generálása és a célállapot megkülönböztetése a nem célállapottól. Azokat a 
stratégiákat, amelyek tudják, hogy az egyik közbülső állapot , ígéretesebb", mint egy má- 
sik közbülső állapot, informált keresési (informed search) vagy heurisztikus keresési 
(heuristic search) stratégiának nevezzük. Ezeket majd a 4. fejezet tárgyalja. A keresési 
stratégiákat a csomópontok kifejtési sorrendje különbözteti meg egymástól. 






Szélességi keresés 


A szélességi keresés (breadth-first search) egy egyszerű keresési stratégia, ahol először 
a gyökércsomópontot fejtjük ki, majd a következő lépésben az összes a gyökércsomó- 
pontból generált csomópont, majd azok követőit stb. Általánosságban a keresési stratégia 


5 Egyes források ehelyett az időt a kifejtett csomópontok számával mérik. A két mérték legfeljebb egy b 
tényezőben tér el. Nekünk úgy tűnik, hogy a csomópontkifejtés végrehajtási ideje nő az adott kifejtésben generált 
csomópontok számával. 
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e see 


3.10. ábra. Szélességi keresés egy egyszerű bináris fában. Minden lépésnél a következő kifejtendő csomó- 
Pontot egy marker jelzi. 








bo ELGBG 














minden adott mélységű csomópontot hamarabb fejt ki. mielőtt bármelyik. egy szinttel 
lejjebbi csomópontot kifejtené. 

A szélességi keresést meg lehet valósítani a FA-KERESÉS algoritmussal egy olyan üres 
peremmel, amely egy először-be-először-ki (first-in-first-out — FIFO) sor, biztosítva 
ezzel, hogy. a korábban meglátogatott csomópontokat az algoritmus korábban fejti ki. 
Más szóval a FA-KERESÉS(probléma, FIFO-SOR()) meghívása szélességi keresést ered- 
ményez. A FIFO sor az összes újonnan legenerált követőt a sor végére teszi, magyarán 
a sekélyebb csomópontok korábban kerülnek kifejtésre, mint a mélyebben fekvők. 
A 3.10. ábra illusztrálja a keresés előrehaladását egy egyszerű bináris fa esetén. 

A szélességi keresés elemzéséhez az előbbi részben tárgyalt négy jellemzőt fogjuk 
használni. Könnyű belátni, hogy ez a keresés teljes. Ha a legsekélyebb célcsomópont 
valamilyen véges d mélységben fekszik, a szélességi keresés eljut hozzá az összes nála 
sekélyebben fekvő csomópontot kifejtve (feltéve persze, hogy a b elágazási tényező 
véges). A legsekélyebb célcsomópont nem szükségképpen optimális. Pontosabban a 
szélességi keresés optimális, ha az útköltség a csomópont mélységének nem csökkenő 
függvénye (például ha minden cselekvésnek ugyanannyi a költsége). 

Eddig a szélességi keresésnek csak a jó tulajdonságait láttuk. Ahhoz, hogy megértsük 
miért nem mindig ezt a stratégiát választjuk, meg kell vizsgálnunk a keresés végrehajtá- 
sához szükséges idő és memória mennyiségét. Ehhez egy olyan hipotetikus állapotteret 
veszünk alapul, amelyben minden egyes állapotot kifejtve b új állapot keletkezik. A ke- 
resési fa gyökércsomópontja b csomópontot generál az első szinten, amelyek mindegyike 
újabb b csomópontot, összesen b? csomópontot generál a második szinten. Ezek mindegyi- 
ke újabb b csomópontot generál, összesen p csomópontot a harmadik szinten és így 
tovább. Tételezzük fel, hogy ezen probléma megoldása d mélységben található. Ekkor 
a legrosszabb esetben a d-edik szinten az utolsót kivéve (mert a célt magát nem fejtjük ki) 
a csomópontok mindegyikét ki kell fejtenünk, a (d 4- 1)-edik szinten bét! - b csomó- 
Pontot generálva. A generált csomópontok össz-száma így: 


ba? a ba... 4 Aa eb) — OLAT) 


Minden legenerált csomópontot a memóriában el kell tárolni, mert vagy a perem ele- 
me, vagy egy perembeli csomópont őse. A tárigény így az időigénnyel azonos (meg egy 
további csomópont a gyökér számára). 

Azok, akik járatosak a komplexitáselemzésben, kezdenek aggódni (vagy izgatottak 
lesznek, ha szeretik a kihívásokat), amikor exponenciális komplexitást látnak, mint 
amilyen például az 0(b7t1). A 3.11. ábra megmutatja, hogy miért. Az ábra egy b — 10 
elágazási tényezővel rendelkező szétességi keresést mutat a d megoldás mélység több 
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Mélység Csomópontok Időigény Tárigény 
2 1100 0.11 másodperc £ Mbájt 
4 111100 11 másodperc 106 Mbájt 
6 107 19 perc 10 Gbájt 
8 109 31 óra 1 Tbájt 
10 1011 129 nap 101 Tbájt 
42 108 35 Év 10 Pbájt 
14 1015 3523 év 1 Ebájt 




















3.11. ábra. A szélességi keresés idő- és tárigénye. Az ábra adatai b — 10-es elágazási tényezőt, 10 000 
csomópont/percet és 1000 bájícsomópontot feltételeznek. 


értékére. A táblában feltételezzük, hogy másodpercenként 10 000 csomópontot generá- 
lunk, illetve egy csomópont tárolásához 1000 bájtra van szükség. Számos feladvány jel- 
legű probléma felel meg ezeknek a feltételezéseknek (egy 100-as tényezővel ide vagy 
oda), ha azokat modern személyi számítógépeken futtatjuk. 

A 3.II. ábra alapján két tanulságot vonhatunk le. Először is a szélességi keresés ese- 
tén a tárigény nagyobb problémát jelent az időigénynél. A legtöbb ember, amennyiben 
érdekli a válasz egy fontos problémára, türelmesen ki tud várni 31 órát, hogy egy 8 
mélységű keresés lefusson, de csak kevés számítógépnek van a kereséshez szükséges 
Tbájtnyi memóriája. Szerencsére léteznek ennél kevesebb memóriát igénylő keresési 
algoritmusok is. 

A második tanulság, hogy az időigény még mindig fontos tényező. Ha a problémánk 
12 mélységű, akkor (a feltételezéseink mellett) a szélességi keresésnek (vagy akármlyik 
nem informált keresési algoritmusnak) 35 évbe telne a megoldás megtalálása. Általá- 
nosságban az exponenciális komplexitású keresési problémák közül csak a legkisebb 
problémapéldányok oldhatók meg. 


Egyenletes költségű keresés 


A szélességi keresés optimális, ha minden lépés költsége azonos, mert mindig a legse- 
kélyebb ki nem fejtett csomópontot fejti ki. Egyszerű általánosítással egy olyan algorit- 
must találhatunk ki, amely tetszőleges lépésköltség mellett optimális. Az egyenletes 
költségű keresés (uniform cost search) mindig a legkisebb útköltségű n csomópontot 
fejti ki először, nem pedig a legkisebb mélységű csomópontot. Egyszerűen belátható, 
hogy a szélességi keresés ís egyenletes költségű keresés. amennyiben minden lépéskölt- 
ség azonos. 

Az egyenletes költségű keresés nem foglalkozik azzal, hogy hány lépésből áll egy 
bizonyos út, hanem csak az összköltségükkel törődik. Emiatt mindig végtelen hurok- 
ba kerül, ha egy csomópont kifejtése zérus költségű cselekvéshez és ugyanahhoz az 
állapothoz való visszatérést eredményez (például a NoOp cselekvés). A teljességet 
csak úgy garantálhatjuk, hogy minden lépés költsége egy kis pozitív e€ konstansnál 
nagyobb, vagy azzal egyenlő. Ez a feltétel egyben az optimalitás elégséges feltétele is. 
Ez azt jelenti, hogy egy út költsége az út mentén mindig növekszik. Ebből a tulajdon- 
ságból látszik, hogy az algoritmus a csomópontokat mindig a növekvő útköltség függ- 
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vényében fejti ki. Azaz az első kifejtésre kiválasztott célcsomópont egyben az optimá- 
lis megoldás is (emlékezzünk arra, hogy a FA-KERESÉS a célállapottesztet csak a kifej- 
tésre megválasztott csomópontokra alkalmazza). Javasoljuk, hogy próbálják ki az al- 
goritmust, hogy a Bukarestbe vezető legrövidebb utat megtalálják. 

Az egyenletes költségű keresést nem a mélység, hanem az útköltség vezérli, így 
komplexitását a b és a d függvényében nehéz jellemezni. Helyette legyen C" az opti- 
mális megoldás költsége, és tételezzük fel, hogy minden cselekvés költsége legalább e. 
Az algoritmus idő- és tárigénye legrosszabb esetben 0(b! tIC/eh, ami sokkal több lehet, 
mint b. Ez azért lehetséges, mert az egyenletes költségű keresés képes (és sokszor 
ezt meg is teszi) a kis lépésekből álló nagy fákat felkutatni a nagy és feltehetően hasz- 
nos lépéseket tartalmazó utak előtt. Amikor minden lépés költsége ugyanannyi, az 


(pit IC/e) persze azonos b"-nel. 


Mélységi keresés 


A mélységi keresés (depth-first search) mindig a keresési fa aktuális peremében a leg- 
mélyebben fekvő csomópontot fejti ki. A keresés lefolyását a 3.12. ábra illusztrálja. 
A keresés azonnal a fa legmélyebb szintjére jut el, ahol a csomópontoknak már nincse- 
nek követőik. Kifejtésüket követően kikerülnek a peremből és a keresés ,. visszalép" 
ahhoz a következő legmélyebben fekvő csomóponthoz, amelynek vannak még ki nem 
fejtett követői. 

Ez a stratégia egy olyan FA-KERESÉS függvénnyel implementálható, amelynek a sor- 
baállító függvénye az utolsónak-be-elsőnek-ki (last-in-first-out, LIFO), más néven 
verem. A mélységi keresést szokás a FA-KERESÉS függvény alternatívájaként egy re- 
kurzív függvénnyel is implementálni, amely a gyermekcsomópontokkal meghívja ön- 
magát (mélységkorláttal dolgozó rekurzív mélységi keresés algorítmusát a 3.13. ábra 
mutatja). 

A mélységi keresés nagyon szerény tárigényű. Csak egyetlen. a gyökércsomóponttól 
egy levélesomópontig vezető utat kell tárolnia, kiegészítve az út minden egyes csomó- 
pontja melletti kifejtetlen csomópontokkal. Egy kifejtett csomópont el is hagyható 
a memóriából, feltéve, hogy az összes leszármazottja meg lett vizsgálva. Egy b elága- 
zási tényezi s m maximális mélységű állapottér esetén a mélységi keresés tárigénye 
bm - 1. A 3.11. ábra feltételezéseivel élve és feltételezve, hogy a célcsomópont mély- 
ségű csomópontoknak nincsenek követőik, azt találjuk, hogy például d — 12 mélység 
esetén a mélységi keresés 118 kbájtot igényelne a 10 Pbájttal szemben, ami tízmilliár- 
dos redukciót jelent a tárigényben. 

A mélységi keresés visszalépéses keresésnek (backtracking search) nevezett válto- 
zata még kevesebb memóriát használ. A visszalépéses keresés az összes követő helyett 
egyidejűleg csak egy követőt generál. Minden részben kifejtett csomópont emlékszik, 
melyik követője jön a legközelebb. Ily módon csak O(m) memóriára van szükség, 
O(bm) helyett. A visszalépéses keresés még egy memória- (és idő-) spóroló trükkhöz 
folyamodik. Az ötlet a követő csomópont generálása az aktuális állapot módosításával, 
anélkül hogy az állapotot átmásolnánk. Ezzel a memóriaszükséglet egy állapotra és 
0(m) cselekvésre redukálódik. Ahhoz, hogy az ötlet működjön, amikor visszalépünk, 
hogy a következő követőt generáljuk, mindegyik módosítást vissza kell tudnunk csinálni. 
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3.12. ábra. Mélységi keresés egy bináris keresési fában. A kifejtett csomópontok, amelyeknek a perem- 
ben nincsenek követőik, el is hagyhatók a memóriából. Ezeket feketével jelöltük meg. A 3-as mélységű 
-csomópontokról feltételezzük, hogy nincsenek követőik, valamint azt is feltesszük, hogy M az egyetlen 
célcsomópont 


Nagy állapottérrel rendelkező problémák esetén. mint például robot-összeszerelés esetén, 
az ilyen módszerek lényegesek a sikerességhez. 

A mélységi keresés hátrányos tulajdonsága, hogy egy rossz választással egy hosszú 
(akár végtelen) út mentén lefelé elakadhat, miközben például egy más döntés elvezet- 
ne a gyökérhez közeli megoldáshoz. A 3.12. ábrán például a mélységi keresés kifejti az 
egész bal oldali részfát, annak ellenére, hogy a C csomópont a megoldás. Ha a J cso- 
mópont szintén megoldás lenne, a mélységi keresés azt adná vissza megoldásul, követ- 
kezésképpen a mélységi keresés nem optimális. Ha a bal oldali részfa korlátlanul mély 
lenne és nem tartalmazna megoldást, a mélységi keresés soha nem állna meg, követke- 
zésképpen a mélységi keresés nem teljes. A legrosszabb esetben a mélységi keresés 
a keresési fában az összes 0(b") csomópontot generálni fogja, ahol m a csomópontok 
maximális mélysége. Jegyezzük meg, hogy m sokkal nagyobb lehet, mint d (a legseké- 
lyebb megoldás mélysége), és korlátjan fák esetén értéke végtelen. 
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Mélységkorlátozott keresés 


A végtelen fák problémáját a mélységi keresés azáltal küszöböli ki, hogy az utak maxi- 
mális mélységére egy ( korlátot ad. Az ( mélységben lévő csomópontokat úgy kezeli, 
mintha nem is lennének követőik. A módszer neve a mélységkorlátozott keresés, 
MEKK (depth-limited search, DLS). A mélységkorlát a végtelen út problémáját ugyan 
megoldja, de a nemteljesség egy újabb forrását hozza be, ha ( c d -t választunk, azaz, 
ha a legsekélyebb célcsomópont a mélységkorláton túl van (ez nem is esélytelen, ha d 
eleve ismeretlen). A mélységkorlátozott keresés £ 5 d választással sem lesz optimális. 
A keresés időigénye 0060), tárigénye 0(b/ ). A mélységi keresés egy olyan speciális 
mélységkorlátozott keresésének tekinthető, amelynek mélységkorlátja € — oo. 

A mélységi korlátot néha a probléma ismeretére lehet alapozni. Például Románia 
térképén 20 város található, így tudjuk, hogy ha létezik egy megoldás, az maximálisan 
19 lépés hosszú lehet, így az ( — 19 egy lehetséges választás. Ha azonban a térképet 
tüzetesebben tanulmányoznánk, felfedeznénk, hogy minden város bármelyik másik 
városból legfeljebb 9 lépésben elérhető. Ez a szám, amit az állapottér átmérőjének 
(diameter) nevezünk, jobb mélységkorlátot ad, ami hatékonyabb mélységkorlátozott 
keresést eredményez. A legtöbb probléma esetén azonban mindaddig nem tudunk jó 
mélységkorlátot adni, amíg meg nem oldottuk a problémát. 

A mélységkorlátozott keresést az általános fakeresési vagy a rekurzív mélységi kere- 
sési algoritmus egyszerű módosításával lehet implementálni. A 3.13. ábra mutatja a re- 
kurzív mélységkorlátozott keresés pszeudokódját. Jegyezzük meg, hogy a mélységkor- 
látozott keresés kudarccal kétféle módon állhat le: a standard kudarc csomópont jelzi a 
megoldás hiányát, a vágás érték viszont jelzi a megoldás mélységkorláton belüli hiányát. 





function MÉLYSÉG-KORLÁTOZOTT-KERESÉS(problérma, kortár) returns egy megoldás vagy kudarc/vágás 
return REKURZÍV-MKK(CSOMÓPONTOT-LÉTREHOZ(KNINDULÓ-ÁLLAPOT probléma)), probléma, korlát) 


function REKURZÍV-MKK(csomópont, probléma, korlát) returns egy megoldás vagy kudarc/vágás 
vágás-megtörténr? — harnis 
if CéL-TEszrfproblémal(ÁLLAPor[csomópont]) then return MEGOLDÁSÍCsomápont) 
else if MéLYsÉG[csomópont] -- kortát then return vágás 
else for each követő in KIFEJT(csomópont, probléma) do. 
eredmény — REKURZÍv-MKK(követő, probléma, korlár) 
if eredmény — vágás then vágás-megtörténf? — igaz 
else if eredmény z kudarc then return eredmény 
if vágás-megtörtént? then return vágás else return kudarc 








3.13. ábra. A mélységkorlátozott keresés rekurzív implementációja 


Iteratívan mélyülő mélységi keresés 


Az iteratívan mélyülő keresés (iterative deepening search) — vagy iteratívan mélyülő 
mélységi keresés — egy általános stratégia, amit sokszor a mélységi kereséssel együtt 
alkalmaznak a legjobb mélységkorlát megtalálására. Az algoritmus képes erre, mert 
fokozatosan növeli a mélységkorlátot - legyen az először 0, majd I, majd 2 stb. - amíg 
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a célt meg nem találja. Ez akkor következik be, ha a mélységkorlát eléri a d-t, a legse- 
kélyebben fekvő célcsomópont mélységét. Az algoritmust a 3.14. ábra mutatja. Az ite- 
ratívan mélyülő keresés ötvözi a szélességi és a mélységi keresés előnyös tulajdonsá- 
gait. A mélységi kereséshez hasonlóan szerény, pontosabban O(bd) memóriaigénnyel 
rendelkezik. A szélességi kereséshez hasonlóan teljes, ha elágazási tényezője véges, és 
optimális, ha az útköltség a csomópontok mélységének nem csökkenő függvénye. 
A 3.15. ábra az ITERATÍVAN-MÉLYÜLŐ-KERESÉS első négy iterációját mutatja egy biná- 
ris fán, ahol az algoritmus a megoldást a negyedik iterációban találja meg. 

Az iteratívan mélyülő keresés tékozlónak tűnhet, mert felettébb sok állapotot több- 
ször is kifejt. Kiderül azonban, hogy a költségtöbblet nem lényeges. Ennek az az oka, 
hogy egy olyan keresési fában, ahol minden szinten ugyanaz (vagy közel ugyanaz) az 
elágazási tényező, majdnem az összes csomópont a legmélyebb szinten található, így 
nem túl sokat számít, hogy a magasabb szinteket többször is kifejtjük. Az iteratívan 
mélyülő keresésben a legmélyebb szinten (d mélység) található csomópontokat csak 
egyszer fejtjük ki, egy szinttel feljebb kétszer stb. egészen a gyökér gyerekeiig, amelye- 
ket d-szer fejtünk ki. Így a kifejtett csomópontok össz-száma: 


CS(IMK) — (db 4 (d—- DB? - ... 4 (1)b1 
amely 0(b") időkomplexitást eredményez. Összehasonlításul nézzük meg a szélességi 
keresés által generált csomópontok számát: 

CS(SZK) — bb... ba (pó b) 


Vegyük észre, hogy a szélességi keresés d 4 1 mélységben is generál csomópontokat, 
az iteratívan mélyülő kereséssel ellentétben. Ennek eredménye, hogy az íteratívan mé- 
lyülő keresés a szélességi keresésnél gyorsabb. annak ellenére, hogy a csomópontokat 
többször fejti ki. Konkretizálva, például b — 10 és d — 5 esetén ezek a számok: 


CS(IMK) — 50 -(- 400 -£ 3000 -- 20 000 -- 100 000 — 123 450 
CS(SZK) — 10 -- 100 -£ 1000 -- 10 000 4- 100 000 -4- 999 990 — 1 111 100 


Általánosságban nagy keresési térrel rendelkező problémák esetén és ha a megoldás 
mélysége nem ismert, a nem informált módszerek köréből az iteratívan mélyülő keresés 
a javasolt. 





function ÍTERATÍVAN-MÉLYÜLŐ-KERESÉS(probléma) returns egy megoldás vagy kudarc 
inputs: probléma, egy probléma 


for mélység — 0 to ov do 
eredmény —— MÉLYSÉGKORLÁTOZOTT-KERESÉS(probléma, mélység) 
if eredmény 5- vágás then return eredmény 











3.14. ábra. Az iteratívan mélyülő keresési algoritmus mélységkorlátozott keresést alkalmaz ismételten, 
növekvő mélységkorláttal. Az algoritmus megáll, ha a megoldást megtalálja, vagy ha a mélységkortáto- 
zott keresés kudarccal tér vissza, jelezve, hogy megoldás nem létezik. 
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3.15. ábra. Az iteratívan mélyülő keresési algoritmus négy iterációja egy bináris fán 














Az iteratívan mélyülő keresés a szélességi kereséssel abban rokon, hogy minden 
iterációban a csomópontok teljes rétegét megvizsgálja, mielőtt a következő rétegre tér- 
ne rá. Hasznosnak látszik az egyenletes költségű keresés iteratív változatának kifejlesz- 
tése, amely örökölné ez utóbbi optimalitását, mellőzve annak a tárkövetelményeit. 
Az ötlet a növekvő útköltségkorlát használata a növekvő mélységkorlát helyett. Az ered- 
ményül kapott algoritmussal, amelynek neve iteratívan megnyúló keresés (iterative 
lengthening search) a 3.11. feladat foglalkozik. Sajnos az derül ki, hogy az íteratívan 
megnyúló keresés overheadje tekintélyes az egyenletes költségű kereséshez képest. 


Kétirányú keresés 


A kétirányú keresés mögött az az ötlet húzódik, hogy egyszerre el lehet indítani egy 
keresést előrefelé a kiinduló állapotból, illetve hátrafelé a célállapotból, és a keresés ak- 
kor fejeződik be, ha a két keresés valahol találkozik (lásd 3.16. ábra). Az érv az, hogy 
b8/2 4. póf? sokkal kisebb, mint 47, illetve az ábrán szemlélve, hogy a két kisebb kör 
összterülete kisebb, mint annak a nagy körnek a területe, amelynek középpontja a ki- 
induló állapot, és amely a peremével a célállapotot eléri. 

A kétirányú keresést úgy implementálják, hogy az egyik vagy mindkét keresés egy 
csomópont kifejtése előtt megvizsgálja, hogy az nem része-e a másik keresési fa pere- 
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gél 


3.16. ábra. A kétirányú szélességi keresés sematikus ábrája. Az ábrán a két keresési irány majdnem 
találkozik, amikor a kiinduló csomópontból kinyúló egyik ág összeér egy a célcsomópontból kinyúló 
másik ággal. 


mének. Ha igen, megvan a cél. Ha a probléma például d — 6 megoldás mélységű, és 
mindegyik irányban a szélességi keresést futtatjuk csomópontonként, a két keresés a leg- 
rosszabb esetben akkor találkozik, ha mindegyik algoritmus a 3-as mélységben egy cso- 
mópont kivételével minden csomópontot kifejtett. A b — 10 esetén ez 22 200 csomópont 
generálását jelenti a standard szélességi keresés által generált 1 LIL ILI csomóponthoz 
képest. Annak ellenőrzését, hogy egy csomópont a másik keresési fához tartozik-e, egy 
hash-táblával konstans időben meg lehet oldani. A kétirányú keresés időkomplexitása 
így 0(41/?). Legalább az egyik keresési fát a memóriában kell tartani, hogy a tartozás 
ellenőrzése kivitelezhető legyen, a tárkomplexitás tehát szintén 0(41/?). Ez a tárkomp- 
lexitás a kétirányú keresés legnagyobb gyengéje. Ha mindkét keresés szélességi kere- 
sés, az algoritmus teljes és optimális (egyenletes költség esetén). Más módszerek kom- 
binációja vagy a teljesség, vagy az optimalitás, vagy mindkettő elvesztéséhez vezethet. 

Az időkomplexitás mérséklése a kétirányú keresést igen vonzóvá teszi, de mit is 
jelent a célállapotból hátrafelé keresni? Ez nem is olyan egyszerű, mint amilyennek 
hangzik. Legyenek x csomópont elődesomópontjai (predecessors), az Előd(x)-ek azon 
csomópontok, amelyek mindegyikének x a követő csomópontja. A kétirányú keresés 
feltételezi, hogy egy Előd(x) hatékonyan számítható. Legegyszerűbb az az eset, amikor 
az összes cselekvés az állapottérben reverzibilis, így Előd(x) — Követőtx). Más esetben 
azonban igen nagy ötletességre lehet szükség. 

Nézzük most, hogy mit is jelent az, hogy , cél", ha a célállapotból hátrafelé kell 
keresni. A 8-as kirakójáték és a romániai útkeresés esetén egyetlenegy célállapot lé- 
tezik csak, így a hátrafelé keresés és az előrefelé keresés ígen hasonlítanak egymás- 
ra. Amennyiben létezik a célállapotoknak egy explicit listája, mint például a 3.3. áb- 
ra két koszmentes célállapota, akkor megkonstruálhatunk egy olyan ál-célállapotot, 
amelynek közvetlen követői az aktuális célállapotok. Más módon, néhány redundáns 
csomópont-generálás elkerülhető azzal, hogy a célállapotok halmazát egyetlenegy 
célállapotnak tekintjük, amelynek minden elődje szintén egy állapothalmaz — konk- 
rétan azon állapotok halmaza, amelyek követője a célállapothalmaz eleme (lásd még 
3.6. alfejezet). 

A kétirányú keresés szempontjából a legnehezebb eset, amikor a célállapottesztnél 
a feltehetően nagy célállapothalmazról csak implicit feírás áll rendelkezésünkre, 
például a sakkban az összes állapot, ami kielégíti a , matt" célt. A hátrafelé keresésnek 
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az my cselekvés révén a omattx állapotba vezető összes állapot" tömör leírását kellene 
tudnia megkonstruálni, és hasonló módon folytatni. E leírásokat az előrefelé haladó kere- 
sés által generált állapotokkal kellene tesztelni. Ennek nincs általánosan hatékony módja. 
A keresési stratégiák összehasonlítása 


A 3.17. ábra a 3.4. alfejezetben megfogalmazott négy kiértékelési kritérium tükrében 
összehasonlítja a keresési stratégiákat. 








Kritérium ] Szélességi ! Egyenletes Iteratívan ] Kétirányú 
költségű (amennyiben 
alkalmazható) 
Teljes? Igent Igenő:b Igen? Igen?" 
Időigény  ] 0(béth) — [/O6btH€ Ia 0149) o) 
Tárigény [ OCbAtW) — [ O66M4C/a O(bd) 04?) 
Optimális? ( Igenő Igen Igen" Igene / 


























3.17. ábra. A keresési stratégiák értékelése. b az elágazási tényező, d a legsekélyebb megoldás mély- 
sége, m a keresési fa maximális mélysége, € a mélységkorlát. A felső indexszel jelzett kikötések a kö- 
vetkezők: " teljes, ha b véges; ? teljes, ha a lépésköltség 2 e, pozitív e-ra; " optimális, ha a lépésköltsé- 
gek mind azonosak; ! ha mindkét irányban szélességi keresést használunk. 
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Eddig figyelmen kívül hagytuk a keresés egyik legfontosabb megoldandó problémáját: 
a már korábban egy másik úton megtalált és kifejtett állapotok ismételt kifejtéséből 
adódó időpazarlást. Néhány probléma esetén ezen lehetőség soha nem merül fel, mert 
az állapottér egy fa, és minden állapotba csak egyetlen módon lehet eljutni. A 8-király- 
nő probléma hatékony megfogalmazása — amikor minden új királynőt a bal szélső 
szabad oszlopba helyezzük — nagyrészt épp ennek köszönheti hatékonyságát, vagyis 
hogy minden egyes állapotba csak egyetlen úton lehet eljutni. Ha a 8-királynő problé- 
mát úgy fogalmazzuk meg, hogy egy királynőt báramelyik oszlopban el lehet helyezni. 
akkor az n királynőt tartalmazó minden állapotot n! különböző úton el lehet érni. 
Számos problémánál azonban elkerülhetetlenek a megismételt állapotok. Ezek közé 
tartozik az összes olyan probléma, amelyben az operátorok reverzíbilisek. Többek között 
ebbe a csoportba tartoznak az útkeresési problémák és a csúszó lapka fejtörő játékok. 
Az ezen problémákhoz tartozó keresési fák végtelenek, de ha a megismételt állapotok 
egy részét levágjuk, akkor a keresési fát véges méretűre vághatjuk, ezáltal a keresési fá- 
nak csak az állapottér gráfot kifeszítő részét generálva. Szélsőséges esetben egy d -- 1 
méretű állapottérből (lásd 3.18. (a) ábra) egy 29 levelű fa lesz (lásd 3.18. (b) ábra). Egy 
élethűbb példa a négyzetrács (rectangular grid) (lásd 3.18. (c) ábra). A rácsban min- 
den állapotnak négy követője van. Az ismétlődő állapotokat tartalmazó fának így 41 
levele van. Minden adott állapottól d lépésnyire azonban csak kb. 24? különböző állapot 
van. d — 20 esetén ez kb. egybillió csomópontot, de csak 800 különböző állapotot jelent. 
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Az ismétlődő állapotok tehát a megoldható problémákat megoldhatatlan problémákká 
alakítják, amennyiben az algoritmus nem képes ezeket az állapotokat detektálni. 
A detektálás általában azt jelenti, hogy az új kifejtendő csomópontot a már kifejtett cso- 
mópontokkal hasonlítjuk össze. Egyezés esetén az adott csomóponthoz az algoritmus két 
utat talált, és valamelyiket eldobhatja. 

A mélységi keresés csak a gyökeret és az aktuális csomóponttal összekötő úton fekvő 
állapotokat tárolja. E csomópontoknak az aktuális csomóponttal való összehasonlítása 
lehetővé teszi a hurkok felismerését, amiket ezek után azonnal el lehet dobni. Ez meg ís 
véd attól, hogy a hurkok révén véges állapotterekből ne keletkezzenek végtelen keresé- 
si fák. Sajnos azonban nem tud megvédeni a nem hurkos utak exponenciális megsokszo- 
rozódásától az olyan problémákban, mint amilyenek a 3.18. ábrán látható. Ezt elkerülni 
csak úgy lehet, hogy több csomópontot tartunk a memóriában. Az idő és a tárigény 
között egy alapvető kompromisszum létezik. Az az algoritmus, amely elfelejti a történe- 
tét, kénytelen azt megismételni. 

Ha egy algoritmus minden meglátogatott állapotra emlékszik, akkor közvetlen 
módon fedezi fel az állapotteret. A FA-KERESÉS algoritmust módosíthatjuk úgy, hogy 
egy zárt listának (closed list) nevezett adatszerkezetet tartalmazzon, amely minden 
kifejtett csomópontot tárol. (A még ki nem fejtett csomópontokból álló peremet néha 
nyitott listának (open list) nevezik.) Ha az aktuális állapot egybeesik a zárt listán lévő 
állapotok egyikével, akkor eldobható, ahelyett hogy a kifejtésével kellene foglalkozni. 
Az új algoritmus neve GRÁF-KERESÉS (3.19. ábra). Az ismétlődő állapotokat tartalma- 
26 problémák esetén a GRÁF-KERESÉS sokkal hatékonyabb, mint a FA-KERESÉS. Az al- 
goritmus a legrosszabb esetre számított tár- rő időkomplexitása arányos az állapottér 
méretével, ami sokkal kisebb lehet, mint 0(b9). 

A gráfkeresés optimalitása már trükkös dolog. Korábban azt mondtuk, hogy egy 
ismételt állapot detektálásával az algoritmus két utat talált ugyanahhoz az állapothoz. 
A 3.19. ábrán látható GRÁF-KERESÉS algoritmus mindig az újonnan felfedezett utat 
dobja el. Nyilvánvaló, hogy ha az újonnan felfedezett út rövidebb, mint az eredeti, a 
GRÁF-KERESÉS elvéthet egy optimális megoldást. Szerencsére ki tudjuk mutatni (lásd 
3.12. feladat), hogy az egyenletes költségű és a konstans lépésköltségű szélességi kere- 
sés esetén ez nem történhet meg. E két optimális fakeresési stratégia egyben optimális 





(a) b (c) 


3.18. ábra. Egy exponenciálisan nagyobb keresési fát generáló állapottér. (a) Egy olyan állapottér, amely- 
ben két lehetséges cselekvés vezethet A-ból B-be, kettő B-ből €-be és így tovább. Ez az állapottér d--L 
állapotot tartalmaz, ahol d a maximális mélység. (b) Az (a) állapottér megfelelő keresési fája, 27 ággal, 
amely az állapotér 27 útjának felel meg. (c) Egy négyzetrács. A kezdeti (A) állapottól kétlépésnyire fekvő 
állapotokat szürke színnel jelöltük. 
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function GRÁF-KEREsÉsíprobléma, perem) returns egy megoldás vagy kudarc 


zárt lisra — egy üres halmaz 
perem — BESZÚR(CSOMÓFONTOT-LÉTREHOZ(KIINDULÓ-ÁLLAPOTÍprobléma]), perem) 
loop do 
if ÜREsX(perem) then return kudarc 
csomópont — VEDD-Az-ELSŐ-ELEMET(perem) 
if CÉL-TESzT probléma ÁLLAPOT[csomópont]) then return MEGOLDÁS(csonáponi) 
if ÁLLapor[csomóponr] nem eleme a zárt listának then 
adjuk hozzá az ÁLLAPOTÍcsamópont]-ot a zárt fistához 
perem — BESZÚR-MIND(KIFEJT(csomópont, probléma), perem) 











3.19. ábra. Az általános gráfkereső algoritmus. A zárt halmazt egy hash-táblával lehet implementálni, 
hogy az ismételt állapotokat hatékonyan ellenőrizni tudjuk. Ez az algoritmus feltételezi, hogy az s álla- 
pothoz vezető első út a legolcsóbb (lásd szöveg). 


gráfkeresési stratégia is. Az iteratívan mélyülő keresés azonban mélységi kifejtést hasz- 
nál és könnyen kerülhet egy csomópont felé vezető szuboptimális útra, mielőtt megtalál- 
ná a hozzá vezető optimális utat. Az iteratívan mélyülő gráfkeresésnél tehát egy újonnan 
felfedezett útnál meg kell vizsgálni, hogy ez nem jobb-e, mint az eredeti. És ha igen, 
szükség lehet az adott csomópont követőinél a mélységek és az útköltségek revíziójára. 

Jegyezzük meg, hogy a zárt lista használata azt jelenti, hogy a mélységi és az iteratí- 
van mélyülő keresés tárigénye már nem lineáris. Mivel a GRÁF-KERESÉS algoritmus 
minden csomópontot a memóriában megtart, egyes keresési fajták kivitelezhetetlenek 
a memóriakorlátok miatt. 
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A 3.3. alfejezetben azt tételeztük fel, hogy a környezet teljesen megfigyelhető és deter- 
minisztikus, valamint hogy az ágens tisztában van minden cselekvésének következmé- 
nyével. Ebből kifolyólag az ágens pontosan ki tudja számítani, hogy egy tetszőleges 
cselekvésszekvenciának milyen állapot az eredménye, és azt is tudja, hogy ő maga 
melyik állapotban van. Az érzékelései nem nyújtanak új információt az egyes cselek- 
vések után. Mi történik, ha a cselekvésekről és az állapotokról alkotott tudás nem teljes? 
Azt találjuk, hogy a nemteljesség különböző formái három elkülönülő problématípus- 
hoz vezetnek: 


1. Szenzor nélküli (sensorless vagy conformant) problémák: ha az ágensnek egyálta- 
lán nincsenek szenzorai, akkor (a tudásának megfelelően) a több lehetséges kezdeti 
állapot egyikében lehet, és minden cselekvése a lehetséges követő állapotok egyiké- 
hez vezethet. 

(ceontingency) problémák: ha a környezet részben megfigyelhető, vagy 

ha a cselekvések bizonytalanok, akkor az ágens érzékszervei új információt nyújta- 

nak minden cselekvés után. Minden lehetséges érzékelés egy eshetőséget határoz 
meg, amire az ágensnek terveznie kell. A problémát ellenfél problémának (adver- 
sarial) hívják, ha a bizonytalanságot egy másik ágens cselekvései okozzák. 
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3. Felfedezéses (explorational) probléma: ha a környezet állapotai és cselekvései nem 
ismertek, az ágensnek külön cselekednie kell, hogy azokat felderíthesse. A felfedezé- 
ses problémákat az eshetőségi problémák szélsőséges változatának lehet tekinteni. 


Példaként a porszívóvilág környezetét vesszük. Emlékezzünk vissza, hogy az álla- 
pottér nyolc állapotból áll (lásd 3.20. ábra). Három cselekvés van — Jobbra, Balra és 
Szív —, és a cél az összes kosz felszedése (a 7. és 8. állapot). Ha a környezet megfigyel- 
hető, determinisztikus és teljesen ismert, akkor a problémát triviálisan bármelyik ismer- 
tetett algoritmussal meg lehet oldani. Így például ha a kezdeti állapot az 5. állapot, akkor 
a [Jobbra, Szív] cselekvésszekvencia a 8. célállapotot éri el. A fejezet további részében e 
probléma szenzor nélküli és eshetőségi változatával foglalkozunk. A felfedezéses problé- 
mákat a 4.5. alfejezet, az ellenfélproblémákat a 6. fejezet tárgyalja. 


Szenzor nélküli problémák 


Tegyük fel, hogy a porszívóágens ismeri az összes cselekvésének a hatását, de szenzo- 
rokkal nem rendelkezik. Ekkor csak azt tudja, hogy kezdeti állapota az (1, 2, 3, 4, 5, 6, 
7, 8) halmaz egyik eleme. Azt lehetne gondolni, hogy az ágens sorsa reménytelen, 
azonban ágensünk igen jól feltalálja magát. Mivel tudja, hogy cselekvései mire képe- 
sek, kiszámíthatja például, hogy a Jobbra cselekvés a (2. 4, 6. 8) állapotok egyikébe 
viszi, és a Jobbra, Szív cselekvéssorozat eredményeképpen a (4, 8) egyikében köt ki. 
Végül a Jobbra, Szív, Balra, Szív sorozat garantáltan eléri a 7. célállapotot, függetlenül 
a kezdeti állapottól. Azt mondjuk, hogy az ágens a világot a 7. állapotba bele tudja 
kényszeríteni (coerce), akkor is, amikor nem is tudja, honnan indult, Összegezve: ha 
a világ nem teljesen megfigyelhető, az ágensnek az egyedi állapotokkal szemben azon 
állapothalmazokra kell tudnia következtetni, amely halmazok állapotaiba eljuthat. 








3.24. ábra. A porszívóvilág nyolc lehetséges állapota 
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Minden ilyen állapothalmazt egy hiedelmi állapotnak nevezünk (belief state), amely 
az ágens pillanatnyi hiedelmét fejezi ki, hogy ő maga vajon milyen fizikai állapotban 
lehet most. (A teljesen megfigyelhető környezetben minden hiedelmi állapot egyetlen 
fizikai állapotból áll.) 

Ahhoz, hogy egy szenzor nélküli problémát megoldhassunk, a fizikai állapotok teré- 
ben történő keresés helyett a hiedelmi állapotok terében kell keresni. A kezdeti állapot 
egy hiedelmi állapot, és minden cselekvés egy hiedelmi állapotból egy hiedelmi álla- 
potba képez le. Egy cselekvést úgy kell alkalmazni egy hiedelmi állapotra, hogy a hoz- 
zá tartozó minden fizikai állapotra kell azt alkalmazni, és az eredmények unióját kell ké- 
pezni. Egy út most több hiedelmi állapotot köt össze, a megoldás pedig egy olyan utat je- 
lent, amely csak célállapotokból álló hiedelmi állapotba vezet. A 3.21. ábra mutatja a de- 
terminisztikus szenzor nélküli porszívóvilág hozzáférhető hiedelmi állapotterét. Csak 12 
hozzáférhető hiedelmi állapot létezik, az egész hiedelmi állapottér azonban tartalmazza a 
fizikai állapotok minden lehetséges halmazát, azaz 25 — 256 hiedelmi állapotot. Általá- 
ban, ha a fizikai állapottérnek S állapota van, a hiedelmi állapottér állapotainak száma 25. 
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3.21. ábra, A determinisztikus, szenzor nélküli porszívóvilág hiedelmi állapotterének hozzáférhető része. 
Minden árnyalt doboz egyetlenegy hiedetmi állapothoz tartozik. Minden pillanatban az ágens egy konkrét 
hiedelmi állapotban tartózkodik, azonban nem tudja, hogy melyik fizikai állapotban van. A kezdeti hiedelmi 
állapot (a teljes tudatlanság) legfelül középen helyezkedik el. A cselekvéseket a címkézett nyilak jelölik. 
Az önhurkokat a nagyobb áttekinthetőség érdekében az ábrából kihagytuk. 
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A szenzor nélküli problémák eddigi elemzésében determinisztikus cselekvéseket té- 
teleztünk fel. Az elemzés lényegében érvényes marad, ha a környezet nemdeterminisz- 
tikus, azaz ha a cselekvéseknek néhány lehetséges kimenetele lehet. Ennek az az oka, 
hogy szenzorok nélkül az ágens nem képes megmondani, hogy milyen kimenetel tör- 
tént valójában. A különböző lehetséges kimenetelek így pótlólagos fizikai állapotok 
a követő hiedelmi állapotban. Tételezzük fel például, hogy a környezetben Murphy- 
törvény uralkodik: a Szív cselekvés néha koszt is hagy a szőnyegen, de csak akkor, ha 
ott előzetesen a kosznak nyoma sem volt." Ha a Szív cselekvést tehát a 4. fizikai állapotban 
alkalmazzuk (lásd 3.20. ábra), a két lehetséges kimenetel a 2. és a 4. állapot. A kezdeti 
(1,2,3,4, 5, 6, 7, 8) hiedelemállapotra alkalmazva a Szív olyan hiedelemállapothoz vezet, 
ami a cselekvés eredményeinek uniója a nyok fizikai állapotra. Kiszámítva, azt kapjuk, 
hogy az új hiedelmi állapot az ( I, 2, 3, 4, 5, 6, 7, 8). A Szív cselekvés a Murphy-törvény 
uralta világban egy szenzor nélküli ágens hiedelmi állapotát tehát nem változtatja meg! 
A probléma valójában megoldhatatlan (lásd 3.18. feladat). Ennek intuitív magyarázata 
az, hogy az ágens nem képes megmondani, hogy az aktuális mező koszos-e, ebből ki- 
folyólag nem képes megmondani, hogy a Szív cselekvés takarítani fog-e. vagy még több 
koszt hagy maga után. 


Eshetőségi problémák 


Ha a környezet jellege olyan, hogy az ágens a cselekvéseit követően szerezhet új infor- 
mációt a szenzorai révén, eshetőségi problémáról (contingency problem) beszélünk. 
Egy eshetőségi probléma megoldása sokszor egy fa alakját veszi fel, ahol egy-egy ág- 
nak a kiválasztása azon múlik, hogy odáig az ágens milyen érzékelésekhez jutott. 
Tegyük fel, hogy az ágens a Murphy-törvény világában rendelkezik helyzetérzékelő- 
vel és lokális koszérzékelővel, nincs azonban olyan szenzora, amely képes lenne koszt 
detektálni más négyzeteken. Így a (B, Kosz) érzékelés azt jelenti, hogy az ágens az 
(1. 3) állapotok egyikében van. Az ágens most a [Szív, Jobbra, Szív] cselekvési szek- 
venciát fogalmazhatta meg. A szívó cselekvés az (5, 7) állapotok egyikébe viszi az 
ágenst, és jobbra elmozdulva az állapota a (6, 8) állapotok egyikére változik. A szívó 
cselekvés alkalmazása a 6. állapotban, a 8. állapotot — a célt — eredményezi. Ha azonban 
a szívó cselekvést a 8. állapotban alkalmazzuk, a 6. állapotba térünk vissza (a Murphy- 
törvény jóvoltából), amely esetben tervünk kudarcba fullad. 

A hiedelmi teret a probléma e változatánál elemezve könnyen megállapíthatjuk, hogy 
semmilyen rögzített cselekvésszekvencia sem garantálja a probléma megoldását. De lesz 
megoldásunk, ha a cselekvések szigorú sorrendjéről lemondunk: 


ISzív, Jobbra, ha [Jobbra, Kosz) akkor Szív] 


A megoldások terét így azzal a lehetőséggel bővítjük, hogy a cselekvéseket a végre- 
hajtás alatt megjelenő eshetőségek alapján választjuk. A valós fizikai világ számos 
problémája eshetőségi probléma, hiszen pontos előrejelzés lehetetlen. Sok ember ezért 
tartja mindig nyitva a szemét séta és vezetés közben. 


$ Fehtételezzük, hogy már minden olvasó került hasonló helyzetbe, így át udják érezni ágensünk frusztráltságát. 
Elnézést kérünk a modem háztartási gépek tulajdonosaítól, akiknek ez a pedagógiai példa nem jelent segítséget. 
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Az eshetőségi problémák néha rögzített cselekvésszekvenciával is megoldhatók. 
Tekintsük például a teljesen megfigyelhető Murphy-törvény világot. Eshetőséggel ál- 
lunk szemben, ha az ágens a Szív cselekvést egy üres négyzet felett hajtja végre, hiszen 
a kosz akkor vagy meg fog jelenni, vagy sem. Ameddig az ágens soha nem teszi ezt, 
eshetőségek fel sem merülnek, és minden kezdeti állapotból létezik egy rögzített meg- 
oldási szekvencia (lásd 3.18. feladat). 

Eshetőségi problémák esetén az algoritmusok az e fejezetben található standard kere- 
sési algoritmusoknál bonyolultabbak. Ezekkel a 12. fejezet foglalkozik. Az eshetőségi 
problémák egy kissé eltérő ágens tervezési sémát is támogatnak, amelyekben az ágens 
egy garantált terv megtalálása előrt is cselekedhet. Ez hasznos, mert ahelyett, hogy 
a végrehajtás során előforduló minden eshetőséget előre figyelembe venne, gyakran 
jobb elkezdeni a végrehajtást, és megnézni, hogy mely eshetőségek következnek be va- 
lójában. A járulékos információ megadása után az ágens folytathatja a probléma meg- 
oldását. A keresés és a végrehajtás ily módon történő összefésülése (interleaving) a 
felderítéses problémák (lásd 4.5. alfejezet) vagy a játékok (6. fejezet) esetén ís hasznos. 
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Ez a fejezet olyan módszereket ismertetett, amelyekkel az ágens a cselekvéseit választ- 
hatja meg determinisztikus, megfigyelhető, statikus és teljesen ismert környezetben. 
Ilyen esetekben az ágens olyan cselekvéssorozatokat konstruálhat, amelyekkel a céljait 
elérheti. Ezt a folyamatot keresésnek (search) nevezzük. 


s A megoldás keresésének megkezdése előtt az ágensnek előbb meg kell fogalmaznia 
a célt (goal), majd a célt fel kell használnia a probléma megfogalmazására. 

s Egy probléma (problem) négy részből: a kiinduló állapotból (initial state). egy 
cselekvés- (action) készletből, egy célteszt- (goal test) függvényből és egy útkölt- 
ség- (path cost) függvényből áll. A probléma környezetét az állapottér (state space) 
írja le. Az állapottérben a kiinduló állapotból a célállapotba vezető út (path) a prob- 
léma egy megoldása (solution). 

s Egyetlen általános FA-KERESÉS algoritmus felhasználható bármilyen probléma meg- 
oldására. Az algoritmus konkrét változatai eltérő stratégiákat valósítanak meg. 

"A keresési algoritmusokat azok teljessége (completeness), optimalitása (optima- 
lity), időigénye (time complexity) és tárigénye (space complexity) alapján érté- 
keljük. A komplexitást a probléma b elágazási tényezője és a legsekélyebben fekvő 
megoldás d mélysége határozza meg. 

s A szélességi keresés (breadth-first search) először a legsekélyebben fekvő csomó- 
pontot fejti ki a keresési fában. Ez a keresés teljes, azonos költségű operátorok esetén 
optimális és 0(b1) idő- és tárigénnyel rendelkezik. Tárigénye miatt a legtöbb esetben 
nem célszerű alkalmazni. Az egyenletes költségű keresés (uniform-cost search) ha- 
sonló a szélességi kereséshez, de először a legkisebb g(n) útköltségű csomópontot fejti 
ki. Teljes és optimális, ha minden lépés költsége valamilyen pozitív c korlátnál nagyobb. 

s A mélységi keresés (depth-first search) először a keresési fa legmélyebben fekvő 
csomópontját fejti ki. Se nem teljes, se nem optimális, és időigénye 0(b"), tárigénye 
pedig O(bm), ahol m az állapottérbeli utak maximális mélysége. 
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s A mélységkorlátozott keresés (depth-limited search) egy korlátot ad a mélységi 
keresés keresési mélységére. 

s Az iteratívan mélyülő keresés (iterative deepening search) a cél megtalálásáig 
egyre növekvő mélységkorláttal hívja meg a mélységkorlátozott keresést. Teljes és 
egységnyi lépésköltség esetén optimális, időigénye 0(b1), tárigénye pedig 0(bd). 

s A kétirányú keresés (bidirectional search) radikálisan csökkentheti az időigényt, 
de nem mindig alkalmazható, és a tárigénye túl nagy lehet. 

"s Ha az állapotér inkább egy gráf, mint egy fa, kifizetődő lehet az ismétlődő állapo- 
tokat vizsgálni. A GRÁF-KERESÉS algoritmus az összes duplikált állapotot ki- 
küs; A 

s Ha a környezet csak részben megfigyelhető, az ágens a keresési algoritmust a hiedel- 
mi állapotok (belief states) terében alkalmazhatja, vagyis olyan lehetséges állapotok 
terében, amelyekben az ágens tartózkodhat. Egyes esetekben egyetlen megoldási 
szekvencia konstruálható, más esetekben az ágensnek eshetőségi tervre (contin- 
gency plan) van szüksége, hogy a felmerülő ismeretlen helyzetekkel megbirkózzon. 





Irodalmi és történeti megjegyzések 


Az ebben a fejezetben elemzett állapottér-keresési problémák többségének hosszú tör- 
ténete van az irodalomban, és e problémák sokkal kevésbé triviálisak, mint azt első rá- 
nézésre gondolnánk. A 3.9. feladatban említett hittérítők és kannibálok problémáját 
Amarel elemezte részletesen (Amarel, 1968). A mesterséges intelligencia területén 
Simon és Newell (Simon és Newell, 1961), míg a számítástudomány és az operációku- 
tatás területén Bellman és Dreyfus már korábban foglalkoztak e problémával (Bellman 
és Dreyfus, 1962). Az ilyen tanulmányok és Simon és Newell Logic Theoristra vonat- 
kozó munkája (Simon és Newell, 1957), valamint a GPS (Simon és Newell, 1962) hatá- 
sára váltak a keresési algoritmusok az 1960-as években az MI-kutatók fegyvertárának 
elsődleges eszközeivé, illetve ezek hatására vált a problémamegoldás kanonikus MI- 
feladattá. Sajnos eddig nagyon kevés történt a problémamegfogalmazás lépéseinek 
automatizálása irányában. A problémareprezentáció és -absztrakció frissebb tárgyalását 
Knoblock adta meg (Knoblock, 1990), beleértve olyan MI-programok leírását is, ame- 
lyek (részben) maguk végzik el ezeket a feladatokat. 

A 8-as kirakójáték a bonyolultabb 15-ös kirakójáték kisebb rokona, amit a híres 
amerikai játéktervező, Sam Loyd talált ki az 1870-es években (Loyd, 1959). A játék 
akkoriban gyorsan óriási, Rubik bűvös kockájához mérhető népszerűségre tett szert 
Amerikában. A matematikusok is felfigyeltek a problémára (Johnson és Story, 1879; 
Tait, 1880). Az American Journal of Mathematics szerkesztői megállapították: ,.A 15-ös 
kirakójáték az elmúlt hetekben teljesen lebilincselte az amerikai embereket — 10 ember- 
ből 9 nemre, korra és származásra való tekintet nélkül a játék bűvöletébe került. Ez 
azonban még nem hatott volna a szerkesztőkre olyan mértékben, hogy rávegye őket, 
erről a témáról cikkeket jelentessenek meg az American Journal of Mathematics folyó- 
iratban, de figyelembe véve azt a tényt, hogy..." (itt a 15-ös kirakójáték által felvetett 
érdekes matematikai kérdések rövid taglalása következett). A 8-as játék esetén P. D. A. 
Schofield számítógép segítségével elvégezte a probléma kimerítő elemzését (Schofield, 
1967). Ratner és Warmuth megmutatta, hogy a legrövidebb megoldás megkeresése 
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a 15-ös játék n x n-es általánosításánál az NP-teljes problémák osztályába tartozik 
(Ratner és Warmuth, 1986). 

A 8-királynő problémát először 1848-ban a Schach német sakkszaklapban névtelenül 
publikálták, később a problémát Max Bezzel nevéhez kapcsolták. A problémát 1850- 
ben újra publikálták, ami akkor felkeltette a kiváló matematikus, Karl Friedrich Gauss 
figyelmét, aki megkísérelte felsorolni az összes megoldást, azonban csak 72 megoldást 
talált meg. Az összes, 92 megoldást Nauck publikálta 1850-ben. A problémát Netto "7 
királynő esetére általánosította (Netto, 1901), Abramson és Young pedig találtak egy 
0(n) algoritmust (Abramson és Young, 1989). 

A fejezetben említett valósvilág-beli keresési problémák közül mindegyik komoly 
kutatási erőfeszítések tárgya volt. Az optimális repülőjárat megválasztásának módsze- 
teit általában bizaimasan kezelik, azonban Carl de Marcken kimutatta (magánközlés), 
hogy a repülőtársaságok által alkalmazott jegytarifák és egyéb korlátozások annyira 
összekuszálódtak, hogy az optimális járat megválasztása formálisan eldönthetetlen. 
Az elméleti számítástudományban standard kombinatorikus probléma az utazó ügynök 
problémája (TSP) (Lawler, 1985; Lawler és társai, 1992). A problémáról Karp bízo- 
nyította be, hogy NP-nehéz (Karp, 1972), azonban megoldására hatékony heurisztikus 
közelítő módszereket dolgoztak ki (Lin és Kernighan, 1973). Az euklideszi térben 
zajló TSP-re Arora dolgozta ki a teljesen polinomiális közelítő sémát (Arora, 1998). 
A VCSI-elrendezés módszereit Shahookar és Mazumder (Shahookar és Mazumder, 
1991) tekintették át, számos optimalizációs cikk VLSI-újságokban jelent meg. Robot- 
navigálási és szerelési problémákkal a 25. fejezet foglalkozik. 

A problémamegoldás nem informált keresési algoritmusai központi szerepet töltenek 
be a klasszikus számításelméletben (Horowitz és Sahni, 1978), az operációkutatásban 
(Dreyfus, 1969). Deo és Pang, továbbá Gallo és Pallottino egy frissebb áttekintést ad- 
nak erről a területről (Deo és Pang, 1984; Gallo és Pallottino, 1988). A szélességi kere- 
sést labirintusok megoldására Moore (Moore, 1959) fogalmazta meg. A dinamikus 
programozás (dynamic programming) módszere (Bellman és Dreyfus, 1962), amely 
szisztematikusan jegyzi meg az összes növekvő nagyságú részprobléma megoldását, 
egy gráfokon futó szélességi keresésnek tekinthető. A Dijkstra-féle kétpontos legrövi- 
debb út algoritmus (Dijkstra, 1959) az egyenletes költségű keresés kiindulópontja. 

Az iteratívan mélyülő algoritmus egy változatát Slate és Atkin használta először a 
CHESS 4.5 sakkprogramjában (Slate és Atkin, 1977), hogy a sakkórát hatékonyabban 
lehessen használni. De az ötletet gráfokban a legrövidebb út keresésére először Korf 
használta (Korf, 1985a). A Pohl bevezette kétirányú keresés (Pohl, 1969; 1971) bizo- 
nyos esetekben szintén igen hatékony lehet. 

A részben megfigyelhető és a nemdeterminisztikus környezeteket a probléma- 
megoldási megközelítésen belül nem tanulmányozták behatóan. A hiedelmi állapotok 
terében történő keresés bizonyos hatékonysági problémáival Genesereth és Nourbakhsh 
foglalkoztak (Genesereth és Nourbakhsh, 1993). Koenig és Simmons (Koenig és Sim- 
mons, 1998) az ismeretlen kezdeti pozícióból induló robotnavigálást tanulmányozták. 
Erdmann és Mason (Erdmann és Mason, 1988) pedig a szenzorok nélküli robot mani- 
puláció problémáját vizsgálták a hiedelem állapottérbeli keresés folytonos változatát 
használva. Eshetőségi kereséssel a tervkészítés területen belül foglalkoztak (lásd 12. fe- 
jezet). A bizonytalan információt felhasználó tervkészítést és cselekvést a valószínűség- 
elmélet és döntéselmélet eszköztárával oldották meg (lásd 17. fejezet). 
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Nilsson könyvei a klasszikus keresési algoritmusokkal kapcsolatban hasznos informá- 
ciókat tartalmaznak (Nilsson, 1971; 1980). Korf egy átfogó. naprakészebb áttekintést ad 
a klasszikus keresési algoritmusokról (Korf, 1988). Az új keresési algoritmusokról — 
amelyek feltárása figyelemre méltó módon folytatódik — olyan folyóiratokban jelennek 
meg cikkek, mint például az Arrificial Intelligence. 


Feladatok 


3.1. 


kh. 


3.3. 


3A. 


3.§. 


3.6. 


3.7. 


Definiálja saját szavaival a következő fogalmakat: állapot, állapottér, keresési fa. 
keresési csomópont, cél, cselekvés, állapotátmenet-függvény és elágazási tényező. 


Magyarázza meg, hogy a problémamegfogalmazásnak miért kell a célmegfogal- 
mazást követnie. 


Tegyük fel, hogy a LEGÁLIS-CSELEKVÉS(s) azon cselekvések halmazát jelöli, ame- 
lyek legálisak az s állapotban, és az EREDMÉNY(a. 5) pedig azt az állapotot, ami az 
s állapotban a végrehajtott legális cselekvés eredménye. Definiálja az ÁLLAPOTÁT- 
MENET-Fv-t a LEGÁLIS-CSELEKVÉS és az EREDMÉNY függvényében, és megfordítva. 


Mutassa meg, hogy a 8-as játék állapottere két diszjunkt részből áll, ahol egyik 
részhez tartozó állapotot semmilyen véges lépésszekvenciával sem lehet a má- 
sik részhez tartozó állapotba áttranszformálni. (Segítség: Berlekamp és társai, 
1982). Dolgozzon ki egy eljárást, amely el tudja dönteni, hogy az állapot melyik 
részhez tartozik, és magyarázza meg. hogy ez miért hasznos, ha az állapotokat 
véletlen módon generáljuk. 


Gondolja át az n-királynő problémát a 105. oldalon ismertetett , hatékony" ink- 
rementális megfogalmazást felhasználva. Magyarázza meg, hogy az állapottér 
mérete miért lesz legalább Vh! és becsülje meg azt a legnagyobb 71-et, amire a 
kimerítő feltárás még elfogadható. (Segítség: számolja ki az elágazási tényező 
alsó korlátját figyelembe véve, hogy mekkora a királynő által támadható sakk- 
táblahelyek maximális száma egy tetszőleges oszlopban.) 


Egy véges állapottér mindig véges keresési fához vezet-e? Mi a helyzet egy 
olyan véges állapottérrel, amely maga is egy fa? Meg tudja-e precízebben fogal- 
mazni, hogy milyen állapottérfajták vezetnek mindig véges keresési fákhoz? 
Átvéve (Bender, 1996)-ből. 


Az alábbiak mindegyikéhez adja meg a kiinduló állapotot, a céltesztet, az álla- 

potátmenet-függvényt és az útköltségfüggvényt. Válasszon meg egy olyan meg- 

fogalmazást, amely elegendően precíz, hogy azt implementálni lehessen. 

(a) Négy szín felhasználásával ki kell színeznie egy síkbeli térképet úgy, hogy 
minden szomszédos tartomány különböző színű legyen. 

(b) Egy I m magas majom egy szobában tartózkodik, ahol van két 1 m magas lá- 
da (amelyeket egymásra lehet rakni, lehet mozgatni, és meg lehet mászni), 
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3.8. 


3.9. 


3.10. 
HETE Az egyik az összes követőt egyszerre generálja a 8-as játék adatstruktúrájának m: 


és néhány banán lóg a 2,5 m magas mennyezetről. A majom el szeretné érni 
a banánt. 

(c) Van egy olyan programja, amely , illegális input rekord" üzenetet ad, ha az 
input rekordok egy bizonyos állományát dolgozza fel. Ön tudja, hogy egy- 
egy rekord feldolgozása a többitől független. Szeretné az illegális rekordot 
megtalálni. 

(d) Van három kancsója, egy 12 1-es, egy 8 I-es és egy 3 I-es és egy vízcsapja. 
A kancsókat megtöltheti, kiöntheti belőlük a vizet a földre, vagy az egyik- 
ből áttöltheti a vizet egy másikba. Pontosan ! I vizet kell kimérnie. 


Tekintsen egy olyan állapotteret, ahol a kezdő állapot az 1-es számú és az állapot- 

átmenet-függvény az n sorszámú állapotra két állapottal, a 2n és a 22 -- 1 sor- 

számú állapotokkal tér vissza. 

(a) Rajzolja fel az állapottérnek az 1-es állapottól a 15-es állapotig terjedő részét. 

(b) Tételezze fel, hogy a célállapot a 11-es. Listázza ki a csomópontok kifejtési 
sorrendjét szélességi, 3-as mélységkorláttal rendelkező mélységkorlátos és 
iteratívan mélyülő keresés esetén. 

(c) Jó lenne-e a probléma megoldására a kétirányú keresés? Ha igen, magya- 
rázza meg részletesen, hogyan fog ez működni. 

(d) Mennyi a kétirányú keresés elágazási tényezője mindkét irányban? 

(e) Vajon a (c) pontra adott válasz azt sugallja-e, hogy a problémának lehetsé- 
ges olyan átfogalmazása, hogy az 1-es állapotból egy adott célállapothoz 
majdnem keresés nélkül el tudnánk jutni? 


A hittérítők és kannibálok problémáját általában az alábbi módon szokás meg- 

adni. Három hittérítő és három kannibál egy folyó azonos oldalán tartózkodik. 

Rendelkeznek csónakkal, amely egy vagy két embert bír el. Találjuk meg 

annak a módját, hogy mindenkit a folyó másik oldalára átjuttassunk, arra ügyel- 

ve, hogy a hittérítők soha, sehol ne legyenek kisebbségben a kannibálokkal 
szemben. Ez a probléma híres az MI-ben, mert ez volt témája az első olyan 
publikációnak, ahol a problémamegfogalmazást analitikus szemszögből kísé- 

relték meg (Amarel, 1968). 

(a) Fogalmazza meg precízen a problémát. Csak azokat a megkülönböztetése- 
ket tegye meg, amelyek a helyes megoldás érdekében szükségesek. Rajzol- 
ja fel a teljes állapottér diagramját. 

(b) Implementálja és oldja meg optimális módon a problémát, megfelelő keresé- 
si algoritmust választva. Jó ötlet-e az ismétlődő állapotok ellenőrzése? 

(c) Véleménye szerint miért nehéz e feladvány az emberek számára, annak el- 
lenére, hogy az állapottér ilyen egyszerű? 


Implementálja az állapotátmenet-függvény két változatát a 8-as játék számára. 





solásával és editálásával. A másik hívásakor, csak egy követőt generál, a szülő 
állapot közvetlen módosításával (és szükség esetén a módosítások visszaállításá- 
val). Írja meg az iteratívan mélyülő keresés olyan változatait, amelyek a függvény 
fenti változatait használják, és hasonlítsa össze a megoldások hatékonyságát. 
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341. 
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3.12. 


3.13. 


3.14. 





3.15. 


hi) 
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A 119. oldalon az iteratívan megnyúló keresést (iterative lengthening search) 

említettük, amely az egyenletes költségű keresés iteratív változata. Az ötlet az 

útköltségre vonatkozó növekvő korlát használata. Egy újonnan generált csomó- 
pontot eldobunk, ha az útköltsége a korlátnál nagyobb. A következő iterációban 

a korlátot az előző iterációban eldobott csomópontok közül a legkisebb útkölt- 

ségre állítjuk be. 

(a) Mutassa meg, hogy ez az algoritmus általános útköltségek esetén optimális. 

(b) Tekintsen egy homogén fát b elágazási tényezővel, d megoldásmélységgel 
és egységnyi lépésköltséggel. Hány iterációra lesz szüksége az iteratívan 
megnyúló keresésnek? 

(c) Most tekintsen egy olyan lépésköltséget, amit a [0, 1) folytonos tartomány- 
ból sorsolnak, egy minimális pozitív ez költséggel. Hány iterációra lesz 
szükség a legrosszabb esetben? 

(d) Implementálja az algoritmust és alkalmazza a 8-as játék és az utazó ügy- 
nök probléma konkrét eseteire. Hasonlítsa össze az algoritmus hatékony- 
ságát az egyenletes költségű algoritmus hatékonyságával, és értelmezze az 
eredményeit. 


Bizonyítsa be, hogy az egyenletes költségű keresés és a szélességi keresés kons- 
tans lépésköltség mellett optimálisak, ha azokat a GRÁF-KERESÉS algoritmusával 
együtt alkalmazzuk. Mutasson egy olyan állapotteret változó lépésköltséggel, 
ahol a GRÁF-KERESÉS algoritmus, iteratív mélyülést használva, csak egy szub- 
optimális megoldást talál. 


Adjon meg egy olyan keresési teret, amelyben az iteratívan mélyülő keresési al- 
goritmus a mélységi keresésnél lényegesen rosszabb teljesítményt nyújt (például 
0(r17) az 0(n)-nel szemben). 


Írjon egy olyan programot, amely bementként két weblap URL-jét kapja meg, 
és megoldásul megtalálja az azokat összekapcsoló hivatkozási utat (linkeket). 
Mi a megfelelő keresési stratégia? Jó ötlet-e a kétirányú keresés? Alkalmazha- 
tó-e egy keresőgép az elődcsomópont függvény megvalósítására? 


Gondolja végig egy sík két pontja közötti legrövidebb út megtalálásának a prob- 

lémáját, ha a síkon konvex sokszög akadályok találhatók (lásd 3.22. ábra). Ez 

annak a problémának egy idealizált változata, amivel egy robotnak kell szembe- 
sülnie, amikor egy zsúfolt környezetben kell navigálnia. 

(a) Tegyük fel, hogy az állapottér a sík összes (x, y) pozíciójából áll. Hány álla- 
potról beszélhetünk ekkor? Hány út vezet a célig? 

(b) Magyarázza el röviden, hogy egy sokszög csúcsát egy másikkal a síkban 
összekötő legrövidebb útnak miért kell olyan egyenes vonalszakaszokból 
állnia, amelyek az egyes sokszögek csúcsait kapcsolják össze? Adjon most 
egy jó állapottér definíciót. Milyen nagy ez a tér? 

(c) Definiálja a keresési probléma implementálásához szükséges függvényeket, 
beleértve az állapotátmenet-függvényt, amely bemenetként egy csúcsot kap, 
És a belőle egyenes vonalban elérhető csúcsok halmazát adja vissza (ne felejt- 
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3.22. ábra. Egy elrendezés sokszögakadályokkal 


sük ki a szomszédos csúcsokat ugyanazon a sokszögön sem). Heurisztikus 
függvénynek az egyenes vonalbeli távolságot használja. 

(d)  Alkalmazzon a fejezetben ismertetett algoritmusok közül egyet vagy többet 
a tárgyterülethez tartozó problémák megoldására, és értékelje azok teljesít- 
ményét. 


3.16. A 3.15. feladat navigációs problémáját a következőképpen transzformálja át egy 
THREE. környezetbe: 

s — Azérzékelés az ágens által látható sokszögcsúcsok az ágenshez viszonyított 
helyzetének listája. Az érzékelés a robot pozícióját nem tartalmazza! A ro- 
botnak a saját pozícióját a térkép alapján kell megtanulnia. Azt is tételezzük 
fel ideiglenesen, hogy minden lokációnak eltérő a , panorámája". 

s Minden cselekvés egy a követendő egyenes utat leíró vektor lesz. Ha az úton 
nincsenek akadályok, a cselekvés sikeres. Egyébként a robot azon a ponton 
megáll, ahol az út az első akadályt metszi. Ha az ágens a zérus mozgás vek- 
torát adja vissza és a célpozícióban van (ami rögzített és ismert), akkor a 
környezetnek teleportálnia kell az ágenst egy véletlen lokációba (de nem 
egy akadályon belülre). 

s — A hatékonysági mérték 1 pontot kér az ágenstől a megtett távolság minden 
egységtávjáérni és 1000 ponttal díjazza a cél mindenkori elérését. 

(a) Implementálja ezt a környezetet és egy erre a környezetre vonatkozó prob- 
lémamegoldó ágenst. Minden teleportálás után az ágensnek új célt kell 
megfogalmaznia, beleértve a saját pozíció felfedezését. 

(b) Dokumentálja az ágens teljesítményét (kommentálja az ágens mozgását), és 
írjon egy jelentést az ágens 100 epizódra vonatkozó teljesítményéről. 

(c) Módosítsa a környezetet úgy, hogy az ágens az esetek 3096-ban ne a szán- 
dékolt helyen találja magát (a helyet a látható sokszögcsúcsokból sorsoljuk, 
ha van ilyen egyáltalán, különben nincs mozgás). Ez a valós robot hibás 
mozgásának egy durva modellje. Módosítsa ágensét úgy, hogyha az ilyen 
hibát detektál, derítse ki, hol van, és készítsen tervet, hogy az eredeti pozí- 
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3.17. 


3.18. 


4 


(e) 
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cióba visszakerülhessen, ahonnan az eredeti tervét folytatja. Emlékezzen 
arra, hogy néha az eredeti pozícióba való visszatérés is kudarccal végződhet! 
Mutasson egy olyan ágenst, amely két egymás utáni hibás mozgással is sike- 
resen megbirkózik, és eléri a célt. 

Most két különböző visszaállítási sémával kísérletezzen egy híba meg- 
történte után: (1) induljon az eredeti út legközelebb eső csúcsa felé, és (2) 
tervezze át az utat a cél felé az új pozícióból kiindulva. Hasonlítsa össze a 
három visszaállítási séma teljesítményét. Meg fogja-e változtatni az össze- 
hasonlítás eredményét a keresési költségek figyelembevétele? 

Most tételezze fel, hogy vannak lokációk azonos , panorámával" (tételezzük fel 
például, hogy a világ egy négyzetrács négyzetes akadályokkal). Milyen prob- 
lémákkal kell most az ágensnek szembenéznie? Milyenek most a megoldások? 


A 100. oldalon azt mondtuk, hogy nem tárgyaljuk a negatív útköltséggel rendel- 
kező problémákat. Ennek a feladatnak a kapcsán részletesebben megvizsgáljuk 
a kérdést. 


(a) 


(b) 


(c) 


(d) 


(e) 


Tegyük fel, hogy a cselekvéseknek tetszőlegesen nagy negatív költségük 
lehet. Magyarázza meg, hogy ez a lehetőség miért kényszerít minden opti- 
mális algoritmust a teljes állapottér felkutatására. 

Segíteni fog-e, ha ragaszkodunk ahhoz, hogy a lépésköltség egy negatív c 
konstansnál nagyobb vagy azzal egyenlő legyen? Mind a fákra, mind a grá- 
fokra gondoljon. 

Tételezzük fel, hogy cselekvések egy halmaza ciklust alkot úgy, hogy a hal- 
maz cselekvéseit valamilyen sorrendben végrehajtva az állapot nem változik. 
Milyen következményekkel jár egy ilyen környezetben tevékenykedő ágens 
optimális viselkedésére, ha ezen cselekvések mindegyike negatív költségű? 
Könnyen el tudunk képzelni nagy negatív költségű operátorokat még az 
útkeresési probléma esetén is. Például néhány útszakasz olyan gyönyörű 
tájakon halad, hogy az idő és üzemanyag tekintetében messze túlszárnyalja 
a normál költségeket. Pontos megfogalmazásban magyarázza el, hogy az em- 
berek miért nem kocsikáznak a végtelenségig a szép tájak körül, és hogyan 
lehetne az útkeresési problémához az állapotteret és az operátorokat defini- 
álni, hogy a mesterséges ágens is el tudja kerülni a ciklusokat. 

Tud olyan valódi problémakört mondani, amelyben a lépések költsége cik- 
lust okoz? 


Gondoljon a Murphy-törvény uralma alatt álló kétlokációjú, szenzor nélküli por- 
szívóvilágra. Rajzolja fel az (1, 2, 3, 4. 5, 6, 7, 8] kezdeti hiedelmi állapotból 
elérhető hiedelem-állapotteret, és magyarázza meg, hogy a probléma miért meg- 
oldhatatlan. Mutassa meg azt is, hogy ha a világ teljesen megfigyelhető, minden 
kezdeti állapotból létezik egy megoldási szekvencia. 


3.19. Tekintse a 2.2. ábrán látható porszívóvilágot. 
ÍS (a) A fejezetben ismertetett algoritmusok közül amelyik lenne alkalmas e prob- 





léma megoldására? Szükséges-e, hogy az algoritmus ellenőrizze az ismételt 
állapotokat? 
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bb) 


(c) 


(d) 


(e) 


A 3 x 3 világban alkalmazza a megválasztott algoritmust az optimális cse- 
lekvési szekvencia kiszámítására egy olyan kezdeti állapottal, ahol a felső 
három négyzet mindegyikében található piszok, és az ágens a középső 
négyzetben tartózkodik. 

Építsen kereső ágenst, és értékelje a teljesítményét egy olyan 3 x 3 porszívó- 
világ halmaz számára, ahol minden négyzetben 0,2 a kosz valószínűsége. 
A teljesítmény mérésénél mind az útköltséget, mind a keresési költséget 
vegye figyelembe, egy értelmes átszámítási tényezőt használva. 
Hasonlítsa össze az eddigi legjobb kereső ágens viselkedését egy olyan 
egyszerű, randomizált reflexszerű ágensével, amely koszt szív, ha azt meg- 
találja, különben véletlen módon mozog. 

Értékelje, hogy mi történne, ha a világot n x n-re nagyítanánk. Hogyan vál- 
tozna a kereső és a reflexszerű ágens teljesítménye n növelésével? 


4. INFORMÁLT KERESÉSI ÉS 
FELFEDEZŐ MÓDSZEREK 


Ebben a fejezetben látni fogjuk, hogy az állapottérrel kapcsolatos információ segítsé- 
gével az algoritmusok hogyan kerülhetik el a sötétben való tapogatózást. 


A 3. fejezetben láttuk, hogy a nem informált keresési stratégiák oly módon képesek 
problémák megoldásait megtalálni, hogy szisztematikusan új állapotokat generálnak és 
összehasonlítják azokat a célállapottal. Sajnos ezek a stratégiák a legtöbb esetben hí- 
hetetlenül rossz hatékonysággal dolgoznak. Ezen fejezet megmutatja, hogy egy — 
problémaspecifikus tudást alkalmazó — informált keresési stratégia hatékonyabban ké- 
pes a megoldást megtalálni. A 4.1. alfejezet bemutatja a 3. fejezetben tanulmányozott 
algoritmusok informált változatait, a 4.2. alfejezet pedig elmagyarázza, hogy a szük- 
séges problémaspecifikus információ hogyan szerezhető meg. A 4.3. és a 4.4. alfejezet 
olyan algoritmusokkal foglalkozik, amelyek az állapottérben tisztán lokális keresést 
(local search) hajtanak végre, egy vagy több aktuális állapotot értékelve és módosítva 
ahelyett, hogy szisztematikusan tárnák fel az utat a kezdeti állapottól indulva. Ezek az 
algoritmusok olyan problémák esetén jók. ahol az útköltség közömbös, és az egyetlen, 
ami számít, hogy megtaláljuk-e a megoldást. A lokális keresési algoritmusok családjába 
a statisztikai fizika inspirálta módszerek (szimulált lehűtés. simulated annealing) és az 
evolúciós biológia sugallta módszerek (genetikus algoritmusok, genetic algorithms) is 
beletartoznak. A 4.5. alfejezet végül az online kereséssel (online search) foglalkozik, 
ahol az ágens egy teljesen ismeretlen állapottérrel találja magát szembe. 





4.1. INFORMÁLT (HEURISZTIKUS) KERESÉSI STRATÉGIÁK 


Ez a fejezet megmutatja, hogy az informált keresési (informed search) stratégia — 
amely a probléma definícióján túlmenően problémaspecifikus tudást is felhasznál — ho- 
gyan képes hatékonyabban megtalálni a megoldást. 

Az általunk vizsgált általános megközelítést a legjobbat-először keresésnek 
(best-first search) nevezzük. A legjobbat-először keresés az általános FA-KERESÉS 
vagy GRÁF-KERESÉS algoritmusok olyan speciális esete, ahol egy csomópont kifej- 
tésre való kiválasztása egy f(/) kiértékelő függvénytől (evaluation function) függ. 
Hagyományosan a legkisebb értékű csomópontot választjuk kifejtésre, mert a kiérté- 
kelő függvény a céltól való távolságot méri. A legjobbat-először keresés az eddigi álta- 
lános keresési eljárások keretein belül egy prioritási sor segítségével implementálható, 
ami egy olyan adatstruktúra, mely a peremet a növekvő f-értékek szerint rendezi. 

A legjobbat-először keresés egy nagy múltú, azonban pontatlan elnevezés. Ameny- 
nyiben valóban képesek lennénk a legjobb csomópontot kifejteni, akkor egyáltalán nem 
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kellene keresnünk, nyílegyenesen elmasíroznánk a célhoz. Ezzel szemben csak a kiérté- 
kelő függvény szerint legjobbnak rűnő csomópontot tudjuk kiválasztani. Ha kiértékelő 
függvényünk mindentudó, akkor a kiválasztott csomópont egyben a legjobb csomó- 
pont is. A valóságban azonban a kiértékelő függvény néha pontatlan, és félrevezetheti 
a keresést. Azonban a továbbiakban is ragaszkodni fogunk a legjobbat-először keresés 
elnevezéshez, mert a legjobbnak tűnőt először keresés egy kicsit furcsán hangzana. 

A LEGJOBBAT-ELŐSZÖR-KERESÉS algoritmus tulajdonképpen egy keresési algoritmus 
család, amelynek az elemeit az eltérő kiértékelő függvények! nböztetik meg. Ezek- 
nek az algoritmusoknak a kulcseleme a A(r1)-nel jelölt heurisztikus függvény? (heuristic 
function): 






h(n) -— az n csomóponttól a célig vezető legolcsóbb út becsült útköltsége 


Például Romániában az Arad és Bukarest közötti legolcsóbb út költségét az Arad és Bu- 
karest közötti légvonaltávolsággal meg lehetne becsülni. 

A heurisztikus függvény a leginkább megszokott módja annak, hogy a problémára 
vonatkozó pótlólagos tudást a keresési algoritmusba be tudjuk injektálni. A heuriszti- 
kus függvényekkel részletesen a 4.2. alfejezetben foglalkozunk. Egyelőre tetszőleges, 
ám problémaspecifikus függvényeknek fogjuk őket tekinteni, egy kikötéssel: ha n egy 
célállapot, akkor h(n) — 0. A jelen fejezet hátralévő része két olyan utat mutat be. ahol 
a heurisztikus információt a keresés irányítására használjuk fel. 


A mohó legjobbat-először keresés 


A mohó legjobbat-először keresés? (greedy best-first search) azt a csomópontot fej- 
ti ki a következő lépésben, amelyiknek az állapotát a legközelebbinek ítéli a célállapot- 
hoz, abból kiindulva, hogy így gyorsan megtalálja a megoldást. A csomópontokat az al- 
goritmus tehát az f(n) — h(n) heurisztikus függvénnyel értékeli ki. 

Nézzük meg, hogy hogyan működik ez a romániai útkeresésnél a légvonalban mért 
távolságot (straight-line distance) felhasználva, amit Ar wr-vel fogunk jelölni. Ha a 
cél Bukarest, szükségünk lesz Bukarest légvonalbeli távolságaira, amelyeket a 4.1. ábra 
ad meg. Például h, wr(Benn(Arad)) — 366. Vegyük észre, hogy a ht wr értékeit magá- 
nak a problémának a leírásából kiszámítani nem lehet. Továbbá egy kis tapasztalat is 
szükséges ahhoz, hogy rájöjjünk. hogy a hr arr az úton megtett tényleges távolsággal kor- 
relál, és így számunkra hasznos heurisztika lehet. 

A 4.2. ábra egy Aradról Bukarestbe vezető út mohó legjobbat-először keresését mu- 
tatja, hrwr-t alkalmazva. Aradból az első kifejtett csomópont Nagyszeben, mert ez 
közelebb van Bukaresthez, mint Nagyzerénd vagy Temesvár. A következő kifejtendő 





1 A 4.3. feladatban azt kérjük Öntől. hogy mutassa ki. hogy ez a család néhány jól ismert nem informált 
keresést is tartalmaz. 
A hím) heurisztikus függvény bemenete ugyan egy csomópont, a függvény értéke azonban a csomóponthoz 
tartozó állapottól függ. 
A könyv első kiadásában ennek mohó keresés (greedy search) volt a neve. Más szerzők ezt legjobbat- 
először keresésnek (best-fírst search) nevezik. A második változat általunk választott általánosabb használata 
Pearit (Peart, 1984) követi. 
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Arad 366 —— Mehadia 241 
Bukarest 0 Neamt 234 
Craiova 160 Nagyvárad 380 
Dobreta 242 Pitegti 100 
Eforie 161 Rimniu Vilcea 193 
Fogaras 476 Nagyszeben 253 
Giurgiu TI —— Temesvár 329 
Hírsova 151 Csalános 80 
Tasi 226 Vaslui 199 
Lugos 244 —— Nagyzerénd 374 





4.1. ábra. A huuwr értékei — a légvonalbeli távolságok Bukarestig 


csomópont pedig Fogaras, mert az van a legközelebb. Fogaras majd generálja Bukarestet, 
ami egyben a célállapot. Erre a konkrét problémára a At, wr.-t alkalmazó mohó legjobbat- 
először keresés úgy talál megoldást, hogy soha sem fejt ki olyan csomópontot, ami nem 
a megoldási úton fekszik. Következésképpen minimális a keresési költsége. Azonban 
nem optimális: a Nagyszebenen és Fogarason keresztül Bukarestbe vezető út 32 kilo- 
méterrel hosszabb a Rimnicu Vilceán és Pitestin keresztül vezető útnál. Ebből látszik, 


(a) Kezdeti állapot DCATD 


(b) Arad kifejtése után 









42. ábra. A mohó legjobbat-először keresés lépései Bukarest esetén a légvonalban mért távolságot 
(hiruwr) alkalmazva. A csomópontok a saját 4-értékeikkel vannak felcímkézve. 
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hogy az algoritmus miért , mohó" — minden lépésben igyekszik annyira közel kerülni a 
célhoz, ahogy csak lehet. 

A hín) minimalizálása érzékeny a hibás kezdő lépésekre. Tekintsük például azt az 
esetet, amikor lasiról Fogarasra akarunk eljutni. A heurisztika alapján Neamtot kelle- 
ne először kifejteni, hiszen ez fekszik Fogarashoz a legközelebb, azonban ez zsákutca. 
A megoldás, hogy először elmegyünk Vasluira — egy olyan lépést teszünk, ami a heu- 
risztika szerint a céltól távolabb visz — és aztán elmegyünk Csalánosra, Bukarestre, 
majd Fogarasra. Ebben az esetben a heurisztika szükségtelen csomópontok kifejtését 
eredményezi. Továbbá, ha nem ügyelünk arra, hogy felismerjük az ismétlődő állapo- 
tokat, akkor soha nem találjuk meg a megoldást — a keresés Neamt és lasi között fog 
oszcillálni. 

A mobó legjobbat-először keresés a mélységi keresésre hasonlít abból a szempont- 
ból, hogy egyetlen út végigkövetését preferálja a célig, azonban zsákutcába jutva 
visszalép. Ugyanazokkal a problémákkal küszködik, mint a mélységi keresés - nem 
optimális és nem teljes (mert elindulhat egy végtelen úton és soha sem tér vissza újabb 
lehetőségeket kipróbálni). A mohó keresés legrosszabb esetre számított (worst-case) 
idő- és tárigénye 0(6"), ahol m a keresési tér maximális mélysége. Jól megválasztott 
heurisztikus függvénnyel a komplexitás azonban jelentősen csökkenthető. A csökkenés 
mértéke az adott problémától és a heurisztikus függvény minőségétől függ. 


A! keresés: a teljes becsült útköltség minimalizálása 


A legjobbat-először keresés leginkább ismert változata az A?" keresés (a kiejtése 
"A csillag"). A csomópontokat úgy értékeli ki, hogy összekombinálja g(/1) értékét — az 
aktuális csomópontig megtett út költsége -— és A(r1) értékét - vagyis az adott csomópont- 
tól a célhoz vezető út költségének becslőjét: 


f(n — 8(n) 4 hin) 


Mivel g(7) megadja a kiinduló csomóponttól az n csomópontig számított útköltséget, és 
h(n) az n csomóponttól a célcsomópontba vezető legolcsóbb költségű út költségének 
becslője, így az alábbi összefüggést kapjuk: 


.f(n) — a legolcsóbb, az n csomóponton keresztül vezető megoldás becsült költsége. 


Így amennyiben a legolcsóbb megoldást keressük, ésszerű először a legkisebb g(n) -- H(n) 
értékkel rendelkező csomópontot kifejteni. Ezen stratégia kellemes tulajdonsága, hogy ez 
a stratégia több mint ésszerű: amennyiben a h függvény eleget tesz bizonyos feltételek- 
nek, az A? keresés teljes és optimális. 

Az A? optimalítását könnyű elemezni, ha az algoritmust a FA-KERESÉS-sel együtt al- 
kalmazzuk. Ilyenkor A?! optimális lesz, ha A(n) egy elfogadható heurisztika 
(admissible heuristic), azaz ha hín) soha nem becsüli felül a cél eléréséhez szükséges 
költséget. Az elfogadható heurisztikák természetükből adódóan optimisták, mivel úgy 
gondolják, hogy a probléma megoldása kisebb költséggel jár. mint amekkora költséget 
a megoldás valójában igényel. Mivel g(m) az n csomópont elérésének pontos költsége, 
azonnali következményként adódik, hogy f(n) soha sem becsüli túl az "z csomóponton 
keresztül vezető legjobb megoldás valódi költségét. 
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Az elfogadható heurisztikus függvények talán egyik legnyilvánvalóbb példája 
a Bukarestbe történő utazás során felhasznált A; wr légvonalban mért távolság. A lég- 
vonalban mért távolság elfogadható, mert bármely két pont között a legrövidebb 
távolság a légvonalban mért távolság, így a légvonalbeli táv soha nem becsülhet túl. 
A 4.3. ábra a Bukarestet kereső A" fakeresés előrehaladását mutatja. A g értékeket a 
3.2. ábrán látható lépésköltségekből számítjuk ki. a Ah; ur értékei a 4.1. ábrán adottak. 
Vegyük észre, hogy Bukarest először az (e) lépés peremében jelent meg, azonban kifej- 
tésre nem került, mert Bukarest f-értéke (450) magasabb, mint Pitegtié (417). Ezt úgy 
lehetne megmagyarázni, hogy feher, hogy Pitestin keresztül létezik egy 417 költségű ol- 
csó megoldás, így az algoritmus egy 450 költségű megoldást nem fog választani. Ebből 
a példából megalkothatjuk annak az általános bizonyítását, hogy a FA-KERESÉS-t hasz- 
náló A" algoritmus optimális, ha h(n) elfogadható. Tegyük fel, hogy a peremen egy G; 
szuboptimális célcsomópont jelenik meg, és az optimális megoldás költsége legyen C". 
Így mivel G, szuboptimális és H(G.) - 0 (ami minden célállapotra igaz), tudjuk, hogy: 


JG.) — 8(G) 4 h(G) — 8(Gy 5 Ct 


(Gondoljunk most egy perembeli s csomópontra, amely a megoldási útvonalon fekszik 
(ilyennek mindíg léteznie kell, ha a megoldás létezik). Ha h(n) nem becsüli túl a meg- 
oldáshoz vezető út folytatását, akkor tudjuk, hogy: 


Í() — g(n) 4 hin) S Cct 


Kimutattuk tehát, hogy f(n) c C" c f(G.), így G, nem kerül kifejtésre, és az A? egy 
optimális megoldással tér vissza. 

A bizonyítás összeomlik, ha a FA-KERESÉS helyett a 3.19. ábra szerinti GRÁF-KERESÉS 
algoritmust használjuk. Az algoritmus visszatérhet szuboptimális megoldással, mert a 
GRÁF-KERESÉS algoritmus elvetheti az ismétlődő állapothoz vezető optimális utat, ha az 
nem elsőnek került kiszámításra (lásd 4.4. feladat). A problémát kétféle módon lehet meg- 
oldani. Az első megoldás a GRÁF-KERESÉS olyan kiterjesztése, hogy az az ugyanahhoz 
a csomóponthoz vezető két út ki a drágábbat fogja elvetni (lásd az értékelést a 3.5. 
alfejezetben). A pótlólagos adminisztrálás nem egyszerű, de az optimalitást garantálni 
fogja. A második megoldásnál azt kell biztosítani, hogy a bármelyik ismétlődő csomó- 
ponthoz vezető optimális út mindig az, amit az algoritmus elsőnek követ — mint ahogy ez 
az egyenletes költségű keresésénél volt. Ez a tulajdonság akkor áll fenn, ha a k(n) függ- 
vényre extra követelményeket fogalmazunk meg, megkövetelve annak konzisztenciáját 
(consistency), másképpen monotonitását (monotonicity). A A(n) heurisztikus függvény 
konzisztens, ha minden n csomópontra és annak egy tetszőleges a cselekvéssel generált 
minden 1 utódesomópontjára az n csomóponttól elért cél becsült költsége nem kisebb, 
mint az r-be kerülés lépésköltsége és az r/ csomóponttól elért cél becsült költsége: 


h(n) £ cín, a, 1) 4 hír) 


Ez az általános háromszög egyenlőtlenség (triangle ineguality) egy formája, amely 
azt fejezi ki, hogy egy háromszög egy oldala sem lehet hosszabb, mint a két másik oldal 
összege. Itt a háromszöget az n, az n és az n-hez legközebbi cél határozza meg. Könnyű 
megmutatni (4.7. feladat), hogy minden konzisztens heurisztika egyben elfogadható is. 
A konzisztencia legfontosabb következménye az, hogy: a GRÁF-KERESÉS-t használó A? 
algoritmus optimális, ha hín) konzisztens. 
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(a) Kezdeti állapot 


(b) Arad kifejtése után 














393-1405253 


(c) Nagyszeben kifejtése után 


A47z181329 





429-T53314 


646-2804366 415-2394176 671-2915380. 41322205193 


(d) Rimnicu Vilcea kifejtése után 


449-754374 


449754374 


59173389253 450245040 — SZE-BGÉRI60 417-3I79100 553-3004253 


(£) Pitesti kifejtése után 


449-TSAATA 


4I8z41840 615-4554160 647-41414193 


4.3. ábra. Az A" keresés lépései Bukarest keresése során. A csomópontok az f— g 4 hr értékekkel vannak 
felcímkézve. A A-értékek a Bukaresttől légvonalban mért távolságokat jelölik, melyeket a 4.1. ábrából 
vettünk át. 
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Bár a konzisztencia az elfogadhatóságnál szigorúbb követelmény, igazán nehéz 
olyan elfogadható heurisztikát találni, ami nem lenne egyben konzisztens. Az ebben 
a fejezetben tárgyalt összes elfogadható heurisztika mind konzisztens. Vegyük például a 
hrmr-t. Tudjuk, hogy az általános háromszög egyenlőtlenség teljesül, ha az oldalakat 
egyenes vonalú távolságokkal mérjük, és hogy az n és r/ közötti egyenesvonalú távol- 
ság c(n, a, r/)-nél nem nagyobb. A Ah, wr így egy konzisztens heurisztika. 

A konzisztencia egy másik fontos következménye az, hogy ha h(n) konzisztens, 
akkor az f(n) értékek akármilyen út mentén nem csökkennek. A bizonyítás bizonyos a 
mellett közvetlenül következik a konzisztencia definíciójából. Tegyük fel. hogy n" az n 
utódja, ekkor: 


g(n) — g(n) - c(n, a, nm) 
és 
fr) — g(n) 4 hír) — g(n) 4 eln, a, n) 4 hír?) 2 g(n) 4 hír) — fm) 


A GRÁF-KERESÉS-t használó A" algoritmus által kifejtett csomópontok sorozata tehát 
f(n)-ben nem csökkenő. A kifejtésre választott első célcsomópont így egy optimális 
megoldás is egyben, mert minden utána következő csomópont legalább ilyen költsé- 
ges lenne. 

Ha az f-költségek sohasem csökkenek, bármilyen utat választunk, akkor az állapot- 
térben határvonalakat (contour) húzhatunk be, hasonlóan egy topografikus térkép 
kontúrjaihoz. A 4.4. ábra erre mutat egy példát. A 400-zal felcímkézett határvonalon 
belül az összes csomópont f(n) értéke nem nagyobb 400-nál, és hasonló érvényes 
a többire is. Mivel az A" keresési algoritmus a legkisebb f értékkel rendelkező levél- 
csomópontot fejti ki először, láthatjuk, hogy az A? keresési algoritmus a gyökércsomó- 
pontból legyezőszerűen halad kifelé, növekvő f értékekhez tartozó koncentrikus sávok- 
ban hozzáadva a csomópontokat. 

Az egyenletes költségű keresés esetén (A" keresés A — 0 mellett) a csomópontsávok 
a kiinduló csomópont köré húzott koncentrikus , köröket" alkotnak. Pontosabb heurisz- 
tikus függvény alkalmazásával a sávok a célállapot felé elnyúlnak, és keskenyebben 
főkuszálódnak az optimális út körül. Ha C" az optimális megoldási út költségét jelöli, 
akkor az alábbiakat jelenthetjük ki: 


s Az A? keresési algoritmus kifejti az összes f(m) c C" értékkel rendelkező csomó- 
pontot. 

s Ezek után az A? keresési algoritmus egy célcsomópont kiválasztása előtt még kifejt- 
het néhány csomópontot a ..célhatárvonalon", amelyekre f(n) — C". 


Intuitíven nyilvánvaló, hogy az első megtalált megoldásnak optimális megoldásnak kell 
lennie, hiszen a következő határvonalakon az összes csomóponthoz nagyobb f költség, 
ebből adódóan nagyobb g költség tartozik (mivel minden célállapotra A(n) — 0). Intuití- 
ven az is nyilvánvaló, hogy az A" keresési algoritmus teljes. Ahogy egyre növekvő 
.f értékű sávokat adunk a kereséshez, előbb-utóbb elérünk egy sávot, amelyhez tartozó f. 
érték megegyezik egy célállapothoz vezető út költségével." 


9 A teljesség megkívánja, hogy a C" költségnél kisebb vagy azzal egyenlő költségű csomópontokból véges 
sok legyen. Ez a feltétel akkor lesz igaz, ha minden lépésköltség egy véges £-nál nagyobb és b véges. 
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44. ábra, Románia térképe. Az ábra Arad mint kiinduló állapot esetén az f — 380, f — 400 és f — 420 
értékekhez tartozó határvonalat mutatja, Egy adott határvonalon belüli csomópontokhoz a határvonal 
értékénél kisebb f költség tartozik. 


Vegyük észre, hogy az A" nem fejt ki f(n) 5 C" tulajdonságú csomópontokat. A 4.3. 
ábrán például Temesvár nem kerül kifejtésre annak ellenére, hogy ez a gyökérnek egy 
utódcsomópontja. Azt mondjuk, hogy a Temesvár alatti fát lenyestük (pruned). Mivel 
hir elfogadható, az algoritmus biztonságosan figyelmen kívül hagyhat egy ilyen fát, 
miközben az optimalitást garantálja. A nyesés gondolata — a lehetőségek eliminálása 
anélkül, hogy megvizsgálnánk azokat — igen fontos az MI sok területén. 

Egy végső észrevétel, az ilyen típusú —- a gyökérből kiinduló utakat bővítő — optimá- 
lis algoritmusok közül az A?" keresési algoritmus bármely adott heurisztikus függvény 
mellett optimális hatékonyságú (optimally efficient). Ez azt jelenti, hogy egyetlen más 
optimális algoritmus sem fejt ki garantáltan kevesebb csomópontot, mint az A" (kivéve 
talán az f(n) — C" típusú csomópontok körét, ahol holtverseny alakulhat ki). Ez azért 
van, mert az összes olyan algoritmus, amelyik nem fejti ki az összes csomópontot, 
melyre f(n) c C", kockáztatja az optimális megoldás elkerülését. 

Felettébb örömteli hír számunkra, hogy az A? keresési algoritmus teljes, optimális és 
az összes ilyen jellegű algoritmus között optimálisan hatékony. Sajnos ez azonban nem 
jelenti azt, hogy az A" algoritmus megoldja az összes kereséssel kapcsolatos problémán- 
kat. A buktató a dologban az. hogy a legtöbb probléma esetén a csomópontok száma a 
keresési tér célhatárvonalon belüli részén a megoldás hosszának még mindig exponen- 
ciális függvénye. Bár az eredmény bizonyítása túlmutat ezen könyv keretein, megmutat- 
ható, hogy az exponenciális növekedéssel mindenképp szembe kell néznünk, kivéve, ha 
a heurisztikus függvényünk hibája legfeljebb az aktuális útköltség logaritmusával nő. 
Az exponenciálisnál lassabb növekedés feltétele matematikai megfogalmazásban: 


It) — RNI £ O(log ht(n)) 


ahol h"(n) az n csomópontból a célcsomópontba való eljutás valódi költségét jelöli. 
Majdnem minden, a gyakorlatban használt heurisztikus függvény esetén a hiba legalább 
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arányos az útköltséggel, és az ebből adódó exponenciális növekedéssel egyetlen számí- 
tógép sem tud megbirkózni. Ezért ahhoz ragaszkodni, hogy egy optimális megoldást 
találjunk, gyakran nem is praktikus. Használhatjuk az A? olyan változatát, amely a 
szuboptimális megoldásokat gyorsan megtalálja, vagy pedig dolgozhatunk pontosabb, 
de nem elfogadható heurisztikákkal. Egy jól megválasztott heurisztikus függvény ettől 
függetlenül a nem informált keresési algoritmusokboz képest jelentős megtakarítást 
eredményezhet. A 4.2. alfejezetben megvizsgáljuk, hogy hogyan is lehet jó heurisztikus 
függvényt tervezni. 

Az A? algoritmusnak azonban nem a szükséges számítási idő a nagy problémája. 
Mivel az összes legenerált csomópontot a memóriában tárolja (ahogy ezt az összes 
GRÁF-KERESÉS algoritmus teszi), ezért az algoritmus általában lényegesen hamarabb fel- 
emészti a rendelkezésére álló memóriát, mintsem kifutna az időből. Ezért az A? sok 
nagyméretű problémához nem praktikus. A közelmúltban kifejlesztett algoritmusok a 
végrehajtási idő kismértékű növekedése mellett a memóriaproblémát megoldották, anél- 
kül hogy feláldoznák az optimalitást vagy a teljességet. Ezekkel az algoritmusokkal 
fogunk most foglalkozni. 


Memóriakorlátozott heurisztikus keresés 


Az A? memóriaigényének mérséklésére a legegyszerűbb módszer az iteratívan mélyü- 
lő algoritmus adaptálása heurisztikus keresés környezetre. Ennek eredménye az itera- 
tívan mélyülő A" algoritmus — IMA" - (iterative deepening A", IDA"). Az IMA" és 
a közönséges iteratívan mélyülő algoritmus közötti fő különbség az, hogy a vágási me- 
chanizmus nem a mélységen, hanem az f költségen (g -- h) alapul. Ezáltal minden egyes 
iterációban a vágási érték az a legkisebb f költség, ami az előbbi iterációban használt 
vágási értéknél nagyobb. Az IMA" praktikus megoldás számos olyan probléma esetén, 
ahol egységnyi a lépésköltség és elkerüli a rendezett csomópontsor memóriában való 
tartásának jelentős overheadjét. Sajnos, az IMA" algoritmus a valós értékű költségek- 
től ugyanúgy szenved, mint az egyenletes költségű keresés iteratív változata, amit a 
3.11. feladatban írtunk le. Ebben a fejezetben megvizsgálunk a memóriakorlátozott 
algoritmusok köréből két frissebb ötletet — az RLEK-t és az MA?-t. 

A rekurzív legjobbat-először keresés, az RLEK (recursive best-first search, 
RBFS) egy egyszerű rekurzív algoritmus, amely megkísérli a rendes legjobbat-először 
algoritmus működését mímelni, de csak lineáris tárat használva. Az algoritmust a 4.5. 
ábra mutatja. A struktúrája hasonlít a rekurzív mélységi keresésre, azonban ahelyett, 
hogy az algoritmus egy utat a végtelenségig folytatna az aktuális pálya mentén, figyeli 
az akmális csomóponthoz az elődeitől vezető eddigi legjobb alternatív út f-értékét. Ha 
az aktuális csomópont ezt az értéket túlhaladja, a rekurzió az alternatív útra lép vissza. 
Ahogy a rekurzió visszalép, az RLEK minden csomópont f-énékét a pálya mentén a 
gyerekeinek legjobb f-értékével helyettesíti. Ily módon az RLEK emlékszik a legjobb 
levélértékre az elfelejtett alfában, és eldöntheti, vajon érdemes-e ezt a fát valamikor 
később újra kifejteni. A 4.6. ábra azt mutatja, hogy hogyan éri el Bukarestet az RLEK. 

Az RLEK valamivel hatékonyabb, mint az IMA". azonban még mindig túlságosan 
szenved a csomópontok túlzott újbóli generálása miatt. A 4.6. ábrán látható példában az 
RLEK először a Rimnicu Vilceán átmenő utat követi, majd , meggondolja magát" és 
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function REKURZÍV-LEGIOBBAT-ELŐSZÖR-KERESÉS(probléma) returns egy megoldás vagy kudarc 
RLEK(probléma, CSOMÓPONTOT-LÉTREHOZ(KIINDULÓ-ÁLLAPOT probléma], 00) 


function RLEK(probléma, csomópont, f. korlát) returns egy megoldás, vagy kudarc, 

és egy új f-költség korlát 

if CÉL-TESZTÍproblémal( ÁLLAPOT csomópont] ) then return csomópont 

követők — KIFEJTÍcsomópont, probléma) 

if követők egy üres lista then return kudarc, 00 

for each s in követők do 
(51 — max(gis) - h(s), flcsomóponiD 

repeat 
legjobb — a legkisebb f-értékű csomópont a köverők közül 
if fltegjobbl 5 f-korlát then return kudarc, fllegjobb] 
alternatíva — a második legkisebb fétékű csomópont a követők közül 
eredmény, fllegjobb) — RLEKprobléma, legjobb, min(f. korlát, alternatíva) 
if megoldás sc kudarc then return megoldás 











4.5. ábra. A rekurzív legjobbat-először keresés algoritmusa 


Fogarassal kísérletezik, majd újra meggondolja magát. Ezek a meggondolások azért 
történnek meg, mert amikor az aktuális legjobb utat tovább fejtjük, nagy az esély arra, 
hogy az f-érték nőni fog — h általában kevésbé optimista a célhoz közeli csomópontok 
esetén. Amikor ez megtörténik, különösképpen nagy keresési terekben, a második leg- 
jobb út a legjobb úttá válhat, és a keresésnek vissza kell lépnie, hogy ezt az utat tudja 
követni. Minden meggondolás megfelel az IMA" egy-egy iterációjának és az elfelejtett 
csomópontok számos újbóli kifejtését teszi szükségessé, hogy a keresés képes legyen 
a legjobb utat visszaállítani, és azt egy csomóponttal meghosszabbítani. 

Az A"-hoz hasonlóan az RLEK is optimális algoritmus, feltéve, hogy a A(n) heurisz- 
tikus függvény elfogadható. Tárkomplexitása O(bd), az időkomplexitását azonban 
nehezebb meghatározni. Ez függ a heurisztika pontosságától és attól is, mennyire gyak- 
ran változik a csomópontok kifejtése közben a legjobb út. Mind az IMA", mind az 
RLEK elvileg ki vannak téve a gráfokban való kereséssel kapcsolatos exponenciális 
komplexitásnövekedésnek (lásd 3.5. alfejezet), tekintettel arra, hogy az ismétlődő álla- 
Potok jelenlétét csak az aktuális úton képesek ellenőrizni. Előfordulhat így, hogy ugyan- 
azt az állapotot többször is kifejtik. 

Az IMA"-nak és az RLEK-nek az a baja, hogy túl kevés memóriát használ. Az egyes 
iterációk között az IMA" egyetlen számot, az aktuális f-költség korlátot tárolja el. Az RLEK 
több információt tárol el a memóriában, azonban csak 0(bd) memóriát használ. Még ha 
több memória is állna a rendelkezésére. az RLEK-nek nincs módja ezt kihasználni. 

Ésszerűnek tűnik tehát az összes, rendelkezésre álló memóriát használni. Az erre ké- 
pes két algoritmus az MA" (memóriakorlátozott A?) és az EMA? (egyszerűsített 
MA"). Itt az EMA"-t írjuk le, ami — mitagadás — az egyszerűbb. Az EMA" az A" 
módjára halad a legjobb levelet kifejtve, amíg a memória be nem telik. Ezen a ponton 
a keresési fához új csomópontot hozzáadni nem képes, hacsak egy régit nem töröl ki. 
Az EMA" mindig a legrosszabb — a legmagasabb f-értékű - csomópontot hagyja ki. 
Majd, mint az RLEK, az elfelejtett csomópont értékét a szülőjéhez továbbítja. Ily módon 
egy elfelejtett részfa elődje tudja a részfa legjobb útjának az értékét. Ezzel az információ- 
val az EMA" csak akkor fejti ki újra a fát, ha kimutatta, hogy minden más út rosszabb- 


146 4. INFORMÁLT KERESÉSI ÉS FELFEDEZÉSI MÓDSZEREK 


(a) Arad, Nagyszeben 
és Rimnicu Vilcea kifejtése után 






(b) A Nagyszebeníg való visszalépés 
és Fogaras kifejtése után 





(c) A Rimnicu Vilceára való vissza- 
kapcsolás és Pitesti kifejtése után 


4.6. ábra. Az RLEK lépései, miközben a legrövidebb utat keresi Bukarest felé. A mindenkori rekurzív hí- 
vás f-korlát értéke a mindenkori aktuális csomópont felett látható. (a) A Rimnicu Vilceán át vezető utat az 
algoritmus addig követi, amíg az aktuális legjobb levél (Pitegti) értéke nem lesz rosszabb. mint a legjobb 
alternatív út értéke (Fogaras). (b) A rekurzió visszalép és az elfelejtett alfa legjobb levélértékét (417) 
Rimnicu Vilceánál feljegyezzük. Majd Fogaras kifejtése következik 450-nel, mint a legjobb levélértékkel 
(c) A rekurzió visszalép. Az elfelejtett alfa legjobb levélértékét (450) Fogarasnál jegyezzük fel. Követke- 
zik Rimnicu Vilcea kifejtése. Ezúttal, mivel a legjobb alternatív út (Temesváron keresztül) 447-be kerül, 
a kifejtés folytatódik Bukarest felé. 


nak tűnik, mint az elfelejtett út. Más szóval, ha az n csomópont minden utódját elfelejtjük, 
nem tudjuk, hogy n-ből merrefelé lehetne menni, tudni fogjuk azonban, hogy mennyire 
érdemes egyáltalán bárhová is menni az n-ből kiindulva. 

A teljes algoritmus túlságosan bonyolult, hogy itt írjunk róla," azonban egy finom 
vonását érdemes megemlíteni. Azt mondtuk, hogy az EMA" a legjobb levelet fejti ki és 
a legrosszabb levelet felejti el. Mi van akkor, ha minden levélnek ugyanaz az f-értéke? 


5 Az algoritmus vázlatos leírása a könyv első kiadásában megtalálható. 
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Az algoritmus ekkor ugyanazt a csomópontot kifejtésre is, és elhagyásra is kiválaszthatná. 
Az EMA" ezt a problémát úgy oldja meg, hogy a kifejtésre a legújabb csomópontot vá- 
lasztja, és a legrégebbi csomópontot törli. Ez a kettő ugyanaz a csomópont csak akkor 
lehet, ha csak egy levél van. Ebben az esetben az aktuális keresési fa egyetlen útból áll 
a gyökértől a levélig, ami kitölti a teljes memóriát. Ha a levél nem egy célcsomópont, 
akkor még ha a célhoz vezető optimális úton fekszik is, ez a cél az adott memóriával 
nem érhető el. Következésképpen a csomópontot ugyanúgy el lehet dobni, mintha nem 
is lenne követője. 

Az EMAt teljes, ha van egyáltalán elérhető megoldás — azaz ha D, a legsekélyebb 
célcsomópont mélysége kevesebb, mint a memória nagysága (csomópontokban kifejez- 
ve). Optimális, ha van elérhető optimális megoldás, másképpen az algoritmus a legjobb 
elérhető megoldással tér vissza. Gyakorlatilag az EMA"-t messze a legjobb általánosan 
használatos algoritmusnak lehet tekinteni az optimális megoldások megkeresésére, kü- 
lönösképpen ha az állapottér egy gráf, a lépésköltség nem egyenletes, és a csomópont- 
kifejtés drága a nyitott és zárt listák karbantartásának pótlólagos overheadjéhez képest. 

Nagyon nehéz problémák esetén azonban az EMA" sokszor kénytelen folyamatosan 
oda-vissza kapcsolgatni a lehetséges megoldási utak között, amelyekből csak kevés fér 
be a memóriába (hasonló ez a diszkalapú memória lapozó rendszer vergődési (thrashing) 
problémájára). Az ugyanazon csomópontok ismételt újrakifejtéséhez szükséges extra idő 
azt jelenti, hogy azok a problémák, amelyeket a végtelen memóriájú A" gyakorlatilag 
meg tudna oldani, az EMA" számára kezelhetetlenek. Ez azt jelenti, hogy memóriakorlát ga 
a problémát a számítási idő szempontjából kezelhetetlenné teheti. Bár a memória és az idő 
közötti kompromisszum magyarázatára nincs elmélet, úgy tűnik, hogy ettől a problémá- 
tól megmenekülni nem lehet. Egyetlen kiút elvetni az optimalitás követelményét. 


Tanuljunk, hogy jobban keressünk! 


Az eddigiekben néhány rögzített stratégiát mutattunk be — szélességi, mohó legjobbat-elő- 
ször stb. keresés —, amelyeket számítógépes szakemberek terveztek. Meg tudná-e tanulni 
egy ágens, hogy jobban keressen? A válasz igen, és a módszer alapját egy fontos fogalom, 
a metaszintű állapottér (metalevel state space) adja. A metaszintű állapottér minden ál- 
lapota az objektumszintű állapottérbeli (object-level state space) — amilyen például 
Románia - keresőprogram egy belső (számítási) állapotának felel meg. Az A" algoritmus 
belső állapota például az aktuális keresési fa. A metaszintű állapottér minden cselekvése 
egy számítási lépés, amely a belső állapotot változtatja meg. Az A" esetén például minden 
számítási lépés kifejt egy levelet, és a követőit a fához adja hozzá. A 4.3. ábra, amely az 
egyre növekvő keresési fák sorozatát mutatja, értelmezhető lehetne úgy, hogy a metaszintű 
állapottérben egy utat mutat, ahol az út minden állapota egy objektumszintű keresési fa. 
A 4.3. ábrán az út öt lépésből áll, Fogaras kifejtését is beleszámítva, ami nem volt vala- 
mi hasznos. Nehezebb problémák esetén sok ilyen téves lépésre lehet számítani, és a 
metaszintű tanulási algoritmus (metalevel learning) ilyen tapasztalatokból tanulhat, 
hogy elkerülje a haszontalan részfák kifejtését. Az ilyen tanuláshoz alkalmas módszereket 
a 21. fejezetben tárgyaljuk. A tanulás célja a problémamegoldás totális költségének (total 
cost) a minimalizálása, kompromisszumot kötve a számítási kiadások és az útköltség között. 
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4.2. HEURISZTIKUS FÜGGVÉNYEK 


Ebben a részben a 8-as kirakójátékhoz keresünk heurisztikus függvényeket, hogy rávi- 
lágítsunk a heurisztikus függvények általános természetére. 

A 8-as kirakójáték a legrégebbi heurisztikus keresési feladatok egyike. Mint azt a 3.2. 
alfejezetben láttuk, a játék lényege, hogy a számozott lapkákat vízszintesen és függőle- 
gesen az üres helyre tolva a kiindulóállásból a célállásba jussunk (lásd 4.7. ábra). 

Egy átlagos megoldás véletlen módon generált 8-as kirakójáték példányok esetén kb. 
22 lépésből áll. Az elágazási tényező nagyjából 3 (amikor az üres lapka középen van, 
akkor négy, amikor a sarokban van, akkor kettő, és amikor valamelyik szélső középső 
pozícióban van, akkor pedig három mozgatás lehetséges). Ebből adódóan egy 22 mély- 
ségig menő kimerítő keresés közelítőleg 322 a 3.1 x 109 állapotot vizsgálna meg. 
Az ismétlődő állapotok nyilvántartásával ezt a számot 170 000-ed részére le lehet 
csökkenteni, mert csak 91/2 — 181 440 különböző elérhető elrendezés létezik (lásd 3.4. 
feladat). Ez egy kezelhető szám, azonban ugyanez a szám a 15-ös kirakójáték esetén már 
durván 1093, így a következő teendő egy jó heurisztika megkeresése. Amennyiben a 
legrövidebb megoldásokat akarjuk megtalálni A" bevetésével, olyan heurisztikus függ- 
vényre van szükségünk, ami soha sem becsüli túl a célállapot eléréséhez szükséges lé- 
pések számát. Az ilyen heurisztikák keresésének a 15-ös kirakójáték esetén nagy a 
múltja. Íme két lehetséges függvény: 


s hja rossz helyen lévő lapkák száma. A 4.7. ábrán a 8 lapkából egyik sincs a helyén, 
így a kiinduló állapotban Ay — 8 lenne. h, elfogadható heurisztikus függvény, mivel 
nyilvánvaló, hogy minden rossz helyen lévő lapkát legalább egyszer mozgatni kell. 
ha - a lapkáknak a saját célhelyeiktől mért távolságaik összege. Mivel a lapkákat 
nem lehet átlók mentén mozgatni, az általunk kiszámított távolság a vízszintes és 
függőleges távolságok összege lesz. Ezt néha háztömb- (city block distance) vagy 
Manhattan-távolságnak (Manhattan distance) is szokás nevezni. h; szintén elfo- 
gadható heurisztikus függvény, mivel minden egyes mozgatással egy lapkát csak 
egy lépéssel lehet közelebb vinni a célhoz. A kiinduló állapotban az 1-8 lapkákra 
számított Manhattan-távolság: 


ho-3413242424343-42—18 


Ahogy reméltük, egyik sem becsüli túl a megoldás igazi költségét, ami 26. 












































Kiinduló állapot 


4.7. ábra. A 8-as kirakójáték egy tipikus feladata. A megoldás 26 lépés hosszú. 
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A heurisztikus függvény pontosságának hatása 
a megoldás hatékonyságára 


A heurisztikus függvény minősítésének egyik lehetséges módja a b" effektív elágazási 
tényező (effective branching factor) megadása. Amennyiben az A" algoritmus által 
kifejtett összes csomópont száma egy adott problémára N, és a megoldás mélysége d, 
akkor b? annak a d mélységű kiegyensúlyozott fának az elágazási tényezőjével egyezik 
meg, amely N -- 1 csomópontot tartalmazna. Ebből adódóan: 


NAT-LADTAGBYY 4... 4 (b)é 


Például ha az A" algoritmus egy 5 mélységben fekvő megoldást 52 csomópont kifejté- 
sével talál meg, akkor az effektív elágazási tényező 1,92. Az effektív elágazási ténye- 
ző a problémaesetek függvényében változhat, megfelelően nehéz problémák esetén 
azonban általában nagyjából állandó. Így a b" kisszámú problémahalmazon végzett 
kísérleti mérése jó fogódzót adhat a heurisztikus függvény általánosságban vett hasz- 
nálhatóságáról. Egy jól megtervezett heurisztikus függvény effektív elágazási tényezője 
1 körüli érték, ami lehetővé teszi felettébb nagy problémák megoldását is. 

A hi és a h, heurisztikus függvények teszteléséhez véletlenszerűen generáltunk 1200 
problémapéldányt, 2-24 mélységű megoldással (100-100 példányt minden páros szám 
esetére), és megoldottuk azokat a Ay és a hi heurisztikus függvényeket alkalmazva az 
A? fakereső algoritmussal, illetve a nem informált iteratívan mélyülő keresési algorit- 
mussal is. A 4.8. ábra minden egyes stratégiára megadja az átlagosan kifejtett csomó- 
pontok számát és az effektív elágazási tényezőt. Az eredmények azt mutatják, hogy ha 
jobb, mint /a, és hogy a nem informált keresés mindkettőnél sokkal rosszabb. A 14 
hosszúságú megoldások esetén az A" ho-vel 30 000-szer hatékonyabb, mint a nem 
informált iteratívan mélyülő keresés. 




















Keresési költség Effektív elágazási tényező 

d IMK AY(hp [ AMhJ [IMK [/Ath) [ At(r) 
2 10 6 6 [245 [ 179 1.79 
4 112 13 12 [287 Í 148 145 
6 680 20 18 [273 ( 134 1.30 
8 6384 39 25 [2.50 ( 1.33 1.24 
100 47127 93 39 [279 ] 138 1.22 
12 [/ 364404 27 73 h278 [ 142 1.24 
l4[ - 539] 413 4 - 144 1.23 
l6[- 1301] 21t [/- 1.45 1.25 
18 - 3056] 363 [/- 1.46 1.26 
2] - 7276) 676[ - 147 1.27 
2] - 18094 ) 1219 [/- 148 1.28 
al - 39135 ) 1641 [/- 1.48 1.26 




















4.8. ábra. A keresési költség és az effektív elágazási tényező összehasonlítása ITERATÍVAN-MÉLYÜLŐ- 
KERESÉS és A" esetén A, és A, használatával. Az adatokat különböző hosszúságú megoldásokra a 8-as 
kírakójáték 100 egyedét megoldva átlagolva kaptuk. 
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Feltehetjük magunknak a kérdést, hogy vajon a ha mindig jobb-e, mint a hj? A vá- 
lasz: igen. A két heurisztikus függvény definíciójából jól látszik, hogy minden n csomó- 
pontra ho(n) 2 hi(m). Azt mondjuk, hogy Aa dominálja /-et. A domináció közvetlenül 
átvihető a hatékonyságra: a h2-t használó A" algoritmus kevesebb csomópontot fog 
kifejteni, mint a /A-et használó (talán csak az f(n) — C tulajdonságú néhány csomó- 
pontot kivéve). Ezt az alábbi egyszerű gondolatmenettel mutathatjuk meg. Idézzük fel 
a 142. oldalon tett észrevételünket, miszerint minden csomópont kifejtésre kerül, 
amelyre f(n) c C". Ezzel egyenértékű az az állítás, mely szerint minden csomópont 
kifejtésre kerül, amelyre h(r) c C"- g(m). Mivel azonban ha minden csomópontra leg- 
alább akkora, mint Ah, így minden olyan csomópontot, amit kifejt a /2-t alkalmazó 
A? algoritmus, kifejti a A-et alkalmazó A? algoritmus is, de A alkalmazása más cso- 
mópontok kifejtését is okozhatja. Ebből adódóan mindig jobb nagyobb értékeket adó 
heurisztikus függvényeket alkalmazni, amíg nem becsüljük túl a valódi költséget. és a 
heurisztika számítási ideje nem túlságosan nagy. 






Elfogadható heurisztikus függvények kitalálása 


Láttuk, hogy mind Ah, (a nem a helyükön lévő lapkák száma), mind pedig Az (Manhat- 
tan-távolság) egész jó heurisztikus függvények a 8-as kirakójáték problémájához, és 
hogy ha jobbnak bizonyult. De hogyan is állt elő a h2? Egy számítógép számára vajon 
lehetséges-e mechanikusan megalkotni ilyen heurisztikus függvényeket? 

A hi és ha a 8-as kirakójátékban a fennmaradó út hosszát becsülik, azonban a játék 
egyszerűsített változatánál a tökéletesen pontos úthossz értékét adják meg. Ha a játék 
szabályait úgy módosítanánk, hogy egy lapka bárhová áthelyezhető legyen, nemcsak a 
szomszédos mezőkre, akkor hp pontosan megadná a legrövidebb megoldáshoz vezető 
lépések számát. Hasonlóan, ha egy lapkát bármelyik szomszédos mezőre átmozgathat- 
nánk, még akkor is, ha az adott mezőn már van egy másik lapka, akkor ha megadná a 
legrövidebb megoldás pontos lépésszámát. Az olyan problémát, amelyben az operáto- 
rokra kevesebb megkötést teszünk, mint az eredeti problémában, relaxált problémának 
(relaxed problem) nevezzük. A relaxáltr probléma optimális megoldásának költsége egy 
elfogadható heurisztika az eredeti problémára. A heurisztika elfogadható, mert az erede- 
ti probléma optimális megoldása definíciószerűen megoldása a relaxált problémának is, 
és így legalább olyan költséges, mint a relaxált probléma optimális megoldása. Mivel 
a számított heurisztika a relaxált problémára egy pontos költség, teljesítenie kell a há- 
romszög egyenlőtlenséget, és ebből kifolyólag konzisztens (lásd 140. oldal). 

Amennyiben a probléma megfogalmazása formális nyelven adott, akkor a relaxált 
problémákat automatikusan is elő lehet állítani." Például ha a 8-as kirakójáték operáto- 
rait az alábbi módon írjuk le: 


Egy lapka az A mezőről a B mezőre mozgatható, 
ha A és B szomszédosak, és a B mező üres 


5 A 8. ésa IL. fejezetben erre a feladatra alkalmas formális nyelveket írunk le. Manipulálható formális le- 
írásokkal a relaxált problémák konstruálása automatizálható. Egyelőre természetes nyelvet használunk. 
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egy vagy több feltétel törlésével három relaxált problémát hozhatunk létre: 


(a) Egy lapka az A mezőről a B mezőre mozgatható, ha A és B szomszédosak. 
(b) Egy lapka az A mezőről a B mezőre mozgatható, ha a B mező üres. 
(c) Egy lapka az A mezőről a B mezőre mozgatható. 


Az (a)-ból a ha (Manhattan-távolság) vezethető le. A magyarázat az, hogy ha helyes 
eredményt adna, ha minden lapkát sorra elmozgatnánk a saját célhelyére. A (b)-ből 
származtatott heurisztikával a 4.9. feladatban foglalkozunk. A (c)-ből a Ay (a nem a he- 
Iyükön lévő lapkák száma) vezethető le, mert ez lenne a helyes eredmény, ha a lapká- 
kat a célpozíciójukba egy lépésben el lehetne mozgatni. Vegyük észre, hogy lényeges, 
hogy e módszer által generált relaxált problémákat lényegében keresés nélkül meg le- 
het oldani, mert a relaxált szabályok a probléma 8 független részproblémává történő 
dekompozícióját teszik lehetővé. Ha a relaxált problémát nehéz megoldani, akkor a 
kapcsolatos heurisztikus értékek számítása drágának fog bizonyulni.7 

Az ABSOLVER nevű program a , relaxált probléma" módszer és más egyéb módszer 
alkalmazásával (Prieditis, 1993), képes a probléma definíciójából automatikusan heu- 
risztikus függvényeket generálni. Az ABSOLVER egy, az eddigieknél jobb heurisztikus 
függvényt hozott létre a 8-as kirakójáték megoldására, és ez a program találta meg az 
első használható heurisztikus függvényt a híres Rubik-kocka kirakásához. 

Az új heurisztikus függvények előállításának egyik problémája, hogy felettébb nehéz 
felismerni a , nyilvánvalóan legjobb" heurisztikus függvényt. Ha egy problémához 
adottak a hi, ..., h,, elfogadható heurisztikus függvények, és egyik sem dominálja a töb- 
bit, melyiket kell választanunk? Mint az majd kiderül, nem kell választanunk. Az alábbi 
formulával a lehető legjobbat kaphatjuk meg: 


h(n) — max(hj(n), ..., h,(n)) 


Az így megkonstruált összetett heurisztikus függvény mindig azt a függvényt használ- 
ja, amelyik az adott csomópontra a legpontosabb. Mivel az alkotóelemként felhasznált 
heurisztikus függvények mind elfogadhatók, ezért A is elfogadható. Ugyancsak könnyű 
bizonyítani, hogy A konzisztens. Továbbá A dominálja az összes, benne alkotóelemként 
felhasznált heurisztikus függvényt. 

Elfogadható heurisztikus függvényeket származtathatunk az adott probléma rész- 
problémájának (subproblem) megoldási költségéből is. A 4.9. ábra például a 4.7. áb- 
rán látható 8-as kirakójáték egy részproblémáját mutatja. A részprobléma lényege az I, 
2, 3 és 4 lapkák helyükre való mozgatása. Világos, hogy e részprobléma optimális meg- 
oldásának költsége a teljes probléma megoldásának költségét alulról korlátozza. Bizo- 
nyos esetekben ez a függvény a Manhattan-távolságnál sokkal pontosabb. 

A mintaadatbázisok (pattern databases) hátterében húzódó ötlet az, hogy tároljuk 
el az egyes részproblémaesetekhez tartozó pontos megoldási költségeket — ebben az 
esetben a négy lapka és az üres hely minden konfigurációjához (jegyezzük meg, hogy 
a másik négy lapka helye a részprobléma megoldása szempontjából közömbös, mozgá- 
saik azonban a költségbe bele fognak számítani). A probléma teljes állapotához tartozó 


7 Vegyük észre, hogy a tökéletes heurisztikát könnyűszerrel megkaphatnánk. ha megengednénk h-nak a 
teljes szélességi keresés lefuttatását , stikában". A heurisztikus függvény pontossága és számítási ideje között 
így kompromisszumot kell kötni. 


152 4. INFORMÁLT KERESÉSI ÉS FELFEDEZÉSI MÓDSZEREK 






































Kiinduló állapot Célállapot 


4.9. ábra. A 4.7. ábrán látható 8-as kirakójáték eset egy részproblémája. A feladat az, hogy 1, 2, 3 és 4 
lapkát a helyes pozíciókba juttassuk el, nem törődve azzal, hogy a többi lapkával mi fog történni. 


elfogadható hag heurisztikus függvényt ezek után keresés közben úgy számítjuk ki, 
hogy a megfelelő részprobléma-konfigurációt az adatbázisból kikeressük. Maga az adat- 
bázis úgy lett megtervezve, hogy a célállapottól visszafelé keresve minden új minta költ- 
ségét feljegyeztük. Ennek a keresésnek a költsége a sok egymás után jövő problémaeset- 
re kivetítve amortizálódik. 

Az 1-2-3-4 lapka megválasztása nyilván tetszőleges, az adatbázist az 5-6-7-8 és 
a 2-4-6-8 stb. lapkákra is meg tudnánk konstruálni. Minden adatbázis egy elfogad- 
ható heurisztikát szolgáltat, és ahogy korábban elmagyaráztuk, ezen heurisztikákat 
kombinálni lehet, maximális értékükkel számolva. Egy ilyen típusú kombinált heu- 
risztika a Manhattan-távolságnál sokkal pontosabb. A 15-ös kírakójáték véletlen- 
szerűen generált egyedeire a kifejtett csomópontok számát egy 1000-es tényezővel 
lehet csökkenteni. 

EI lehetne tűnődni azon, hogy az 1-2-3-4 és az 5-6-7-8 adatbázisokból kinyert heurisz- 
tikus függvényeket nem lehetne-e összeadni, mivel úgy tűnik, a két részproblémában 
nincs fedés. A válasz nemleges, mert egy adott állapotban az 1-2-3-4 és az 5-6-7-8 rész- 
problémák megoldásai majdnem biztosan osztoznak közös lépéseken — igen valószínűt- 
len, hogy az 1-2-3-4 lapkákat a helyükre el lehet mozdítani, anélkül hogy az 5-6-7-8- 
hoz ne nyúlnánk hozzá, és fordírva. És mi lenne, ha ezeket a lépéseket nem is számol- 
nák be? Azaz nem az 1-2-3-4 részprobléma teljes költségével számolnánk, hanem csak 
az 1-2-3-4 lapka lépéseit vennénk figyelembe. Könnyű ilyenkor rájönni, hogy a két költ- 
ség összege még mindig a teljes probléma megoldási költségének egy alsó korlátja. 
Ez a diszjunkt mintaadatbázis (disjoint pattern database) hátterében húzódó ötlet. 
Az ilyen adatbázisok használatával lehetségessé válik a 15-ös kirakójátékot milliszekun- 
dumok alatt megoldani, a Manhattan-távolsághoz képest a generált csomópontok száma 
egy 10 000-es tényezővel kisebb. A 24-es kirakójáték esetén kb. egymilliós gyorsítást 
lehet elérni. 

A diszjunkt mintaadatbázisok jól működnek a csúszólapka-játékok esetén, mert a 
problémát úgy lehet felbontani, hogy egy-egy lépés csak egy részproblémára van hatás- 
sal, hiszen egyszerre csak egy lapkát mozgatunk. A Rubik-kocka problémára ilyen bon- 
tást elvégezni nem lehet, mert minden mozgás 8, 9 vagy 26 kockát érint. Nem tudjuk 
egyelőre, hogy az ilyen problémák számára a diszjunkt mintaadatbázisokat hogyan 
lehetne definiálni. 
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A heurisztikus függvény tanulása tapasztalatból 


A h(n) heurisztikus függvénytől elvárjuk, hogy az n csomópontbeli állapottól kezdve 
becsülje a megoldás költségét. Hogyan lenne képes egy ágens egy ilyen függvény meg- 
alkotására? Egy megoldást az előbbi részben adtunk meg — ami nevezetesen egy olyan 
relaxált problémának a kitalálása, amihez egy optimális megoldást könnyű találni. Egy 
másik megoldás a tapasztalatból való tanulás. A , tapasztalaton" itt azt értjük, hogy na- 
gyon sok 8-as kirakójátékot kell megoldani. A 8-as játék minden optimális megoldása 
egy példát jelent, amiből A(z) tanulható. Minden példa egy, a megoldási úton elhelyez- 
kedő állapotból és az onnan számított valós megoldási költségből áll. Ilyen példák 
alapján induktív tanulási algoritmus (inductive learning) segítségével egy olyan 
h(n) függvényt konstruálhatunk. amely (szerencsével) képes megjósolni a megoldás 
költségét a keresés során felbukkanó más állapotok esetén is. Ennek módszertanát, 
legyenek ezek neurális hálók, döntési fák vagy más módszerek, a 18. fejezet mutatja be 
(a 21. fejezetben leírt megerősítéses tanulás szintén alkalmazható). 

Az induktív tanulási módszerek akkor működnek a legjobban, ha nem az állapot 
nyers leírását, hanem inkább az állapot kiértékeléséhez releváns jellemzőket (feature) 
kapják bemenetként. A . nem a helyén lévő lapkák száma" jellemző segítség lehet, ha 
az aktuális állapotnak a céltól vett távolságát szeretnénk megjósolni. Hívjuk ezt a jel- 
lemzőt x(n)-nek. Vehetnénk a 8-as kirakójáték 100 véletlenszerűen generált konfigu- 
rációját, és gyűjthetnénk statisztikákat a megoldás aktuális költségéről. Esetleg azt 
találnánk, hogy ha xj(/1) értéke 5, akkor a megoldás átlagos költsége 14 és így tovább. 
Ilyen adatok birtokában x(1) értékéből jósolni lehetne A(71) értékét. Persze több jellem- 
zőt is lehetne használni. Egy másik jellemző, x(n) lehetne például , azon szomszédos 
lapkapárok száma, melyek a célállapotban is szomszédosak". Hogyan lehetne xi(n)-et 
és x2(n)-et összekombinálni hí(n) jóslása érdekében? Egy szokásos ötlet a lineáris kom- 
bináció használata: 


hín) — cyxy(m) A €2x2(n) 
A ci és cz konstansokat módosítani lehet, hogy a megoldási költség aktuális adataira 


legjobban illeszkedjenek. Feltételezhetően cj-nek pozitívnak, c2-nek pedig negatívnak 
kellene lennie. 
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ÉS OPTIMALIZÁCIÓS PROBLÉMÁK 


Az eddig látott keresési algoritmusokat arra tervezték, hogy a keresési tereket sziszte- 
matikusan tárják fel. A szisztematikusságot úgy érik el, hogy egy vagy több utat tarta- 
nak a memóriában, és azt is feljegyzik, hogy minden pontban az út mentén melyik al- 
ternatívát vizsgálták már meg, és melyiket nem. Amikor megtalálják a célt, a célhoz ve- 
zető út egyben a probléma megoldását is jelenti. 

Számos problémában azonban a célhoz vezető út érdektelen. A 8-királynő problémá- 
ban például (lásd 104105. oldal) a királynők végleges konfigurációja számít, és nem 
az a sorrend, ahogy az újabb királynőket felhelyezzük. A problémák ezen osztályába 
olyan fontos problémák tartoznak, mint a VLSI-tervezés, a gyári gépelrendezés, a gyár- 
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tási műveletek ütemezése, az automatikus programozás, a hírközlési hálózatok optíma- 
lizálása, a gépkocsiútvonai-tervezés és a portfóliórmenedzsment. 

Ha a célhoz vezető út nem számít, más algoritmusokra is gondolhatunk, amelyek az 
utakkal egyáltalán nem foglalkoznak. A lokális keresési algoritmusok (local search) 
csak egy aktuális állapotot (current state) vesznek figyelembe (a többszörös utak he- 
lyett) és általában csak ennek az állapotnak a szomszédjaira lépnek tovább. A keresés 
által követett utat tipikusan nem is tárolják el. Bár a lokális keresési algoritmusok nem 
szisztematikusak, két kulcsfontosságú előnyük van: (1) igen kevés — általában konstans 
mennyiségű — memóriát használnak, és (2) sokszor nagy vagy végtelen (folytonos) ke- 
resési térben elfogadható megoldást produkálnak ott, ahol a szisztematikus algoritmusok 
alkalmatlanok lennének. 

A cél megfogalmazásán túl, a lokális keresési algoritmusok a tisztán optimalizációs 
problémák (optimization problems) megoldásában is hasznosak, ahol a cél a legjobb 
állapot megtalálása egy célfüggvény (objective function) értelmében. Számos optima- 
lizációs probléma nem felel meg a 3. fejezetben bevezetett , standard" keresési modell- 
nek. Így például a természet előállít egy célfüggvényt — a szaporodási fitnesst — amit úgy 
tűnik, a darwini evolúció igyekszik optimalizálni, e probléma esetén nem beszélhetünk 
azonban sem , céltesztről", sem , útköltségről". 

A lokális keresés megértéséhez igen hasznosnak találjuk az állapottérfelszínt (state 
space landscape) (mint amilyen a 4.10. ábrán látszik). A felszínnek van , pontja" (amit 
az állapot definiál) és , magassága" (amit a heurisztikus vagy a célfüggvény értéke ha- 
tároz meg). Ha a magasság a költséggel arányos, akkor a cél a legalacsonyabban fekvő 
völgyet — a globális minimumot — megtalálni. Ha a magasság a célfüggvénynek felel 
meg, akkor a cél a legmagasabb csúcs - a globális maximum - megtalálása (az egyik- 
ről a másikra előjel váltásával könnyen áttérhetünk). A lokális keresés ezt a felületet 
vizsgálja. Egy teljes lokális keresés mindig talál megoldást, ha az egyáltalán létezik. 
Egy optimális algoritmus mindig megtalálja a globális minimumot vagy maximumot. 


Celfüggvény 
mene Cilobális maximum 






Lokális maximum 
Heat 88 :z ő 
Lapos" lokális maximum 


Állapottér 


Aktuális 
állapot 


4.10. ábra. Egy egydimenziós állapottérfelszín, ahol a magasság a célfüggvénynek felel meg. A cél a 
globális maximum megtalálása. A hegymászó keresés az aktuális állapotot módosítja a javulás irányá- 
ban. ahogy ezt a nyíl is mutatja. A különböző topografikus jellemzőkkel a szövegben foglalkozunk. 
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Hegymászó keresés 


A hegymászó keresési algoritmust (hill-ciimbing) a 4.11. ábra mutatja. A keresés 
egyszerűen csak egy ciklus, ami mindig javuló értékek felé — azaz felfelé — lép. Az al- 
goritmus megáll, amikor felér a csúcsra, ahol nincsenek már magasabb értékű szom- 
szédjai. Az algoritmus nem tart nyilván keresési fát, ezért a csomópontot leíró adatszer- 
kezetnek csak az állapotot és a célfüggvény értékét kell nyilvántartania. A hegymászó 
keresés nem néz előre az aktuális állapotot közvetlenül követő szomszédokon túl. Egy 
kicsit arra hasonlít, mintha a Mount Everest csúcsát szeretnénk megtalálni sűrű ködben 
és emlékezetkihagyásban szenvedve. 





function HEGYMÁSZÁSÍprobléma) returns egy lokális maximumot jelentő állapot 
inputs: probléma. egy probléma 
local variables: aktuális, egy csomópont 
szomszéd, egy csomópont 


akmális — CSOMÓPONTOT-LÉTREHOZ(KIINDULÓ-ÁLLAPOT [probléma]) 

loop do 
szomszéd — az aktuális legnagyobb értékű követő csomópontja 
if ÉRTÉKIszomszéd) £ ÉRTÉKlaktuális] then return ÁLLAPOT[aktuális] 
aktuális — szomszéd 








4.11. ábra. A hegymászó keresési algoritmus (a legmeredekebb emelkedő (steepest ascent) változat) 
a lokális keresés alapvető módszere. Minden lépésben az aktuális csomópontot a legjobb szomszédjával 
cseréli le, ami ebben a változatban a legmagasabb ÉRTÉK-ű szomszédot jelenti. Ha azonban egy A 
heurisztikus költségbecslést alkalmazunk. ez akkor a legalacsonyabb /-jú szomszéd lenne. 


A hegymászó keresés illusztrálására a 104. oldalon bevezetett 8-királynő problémát 
(8-gueens problem) fogjuk használni. A lokális keresési algoritmusok tipikusan a teljes 
állapot leírással (complete-state formulation) élnek, ahol minden állapotban a táblán 
8 királynő helyezkedik el, oszloponként egy. Az állapotátmenet-függvény minden olyan 
lehetséges állapotot visszaad, amit úgy kapunk, hogy egy királynőt ugyanabban az osz- 
lopban egy másik mezőre mozgatunk (így minden állapotnak 8 x 7 — 56 követője van). 
A h heurisztikus függvény a közvetlenül vagy közvetett módon egymást támadó király- 
nőpárok száma. E függvény globális minimuma 0. ami csak a tökéletes megoldásban 
érhető el. A 4.12. (a) ábra egy A — 17 értékű állapotot mutat. Az ábra az összes követő- 
nek az értékét is mutatja, ahol a legjobb követőé A — 12. Ha a legjobból több van. a hegy- 
mászó algoritmusok tipikusan véletlen módon sorsolnak belőlük egyet. 

A hegymászó keresést néha mohó lokális keresésnek (greedy local search) is hív- 
ják, mert egy jó követő állapotot megragad, anélkül hogy megfontolná, merre lenne 
érdemes továbbmenni. Bár a mohóság a hét főbűn egyike, a mohó algoritmusok sok- 
szor igen jól teljesítenek. A hegymászás gyakran igen gyorsan halad a megoldás felé, 
mert egy rossz állapoton általában nagyon könnyű javítani. Így például a 4.12. (a) ábrán 
látható állapotból indulva öt lépés elegendő, hogy elérjük a 4.12. (b) ábrán látható álla- 
potot, melynek költsége A — I, és amely igen közel van egy megoldáshoz. Sajnos a 
hegymászás gyakran megakad az alábbi problémák miatt: 
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4.12. ábra. (a) A 8-királynő probléma A — 17 heurisztikus költségbecslésű állapota, ahol minden olyan 
követő állapot A értékét megadtuk, amikor a királynőt a saját oszlopában mozgatjuk. A legjobb lépése- 
ket bejelöltük. (b) Egy lokális minimum a 8-királynő térben. Az állapot A éniéke egységnyi, azonban min- 
den követőnek magasabb a költsége. 


" Lokális maximumok: egy lokális maximum egy csúcs. amely minden szomszédjá- 
nál magasabb, de a globális maximumnál alacsonyabb. A hegymászó algoritmusok, 
ha egy lokális maximum közelébe érnek, kénytelenek a csúcs felé tartani, ott azon- 
ban nincs tovább, és megakadnak. Ezt a problémát sematikusan a 4.10. ábra mutat- 
ja. Konkrétabban, a 4.12. (b) ábra állapota egy tényleges lokális maximum (azaz egy 
lokális minimum a A költségre nézve), bármely királynő bármilyen lépése csak ront 
a helyzeten. 

s  Hegygerincek (ridges): egy hegygerincet a 4.13. ábra mutat. A hegygerinc egy 
olyan lokális maximum sorozatot eredményez, ahol egy mohó algoritmusnak igen 
nehéz navigálnia. 

s  Fennsík (plateaux): a fennsík az állapottérnek egy olyan területe, ahol a kiértékelő 
függvény gyakorlatilag lapos. Lehet ez egy lapos lokális maximum, amelyből nincs to- 
vább felfelé, de lehet egy váll (shoulder), ahonnan még lehetséges az előrehaladás 
(lásd 4.10. ábra). Egy hegymászó keresés képtelen lehet arra, hogy egy fennsíkról 
megtalálja a kivezető utat. 


Az algoritmus minden esetben elér egy pontot, ahonnan már nem tud továbblépni. Egy 
véletűlen módon generált 8-királynő állapotból kiindulva a legmeredekebb emelkedő 
hegymászó algoritmus az esetek 8696-ában megakad, a problémaeseteknek csupán 
1496-át oldja meg. Az algoritmus gyorsan dolgozik, átlagosan 4 lépést tesz, amikor 
sikerrel jár, és 3 lépést, amikor megakad. Ez egyáltalán nem is olyan rossz a 85 sz 17 
millió állapotot tartalmazó állapottérben. 

A 4.11. ábra algoritmusa megáll, ha fennsíkra ér, ahol a legjobb követőnek is ugyan- 
az az értéke, mint az aktuális állapotnak. Nem lenne-e jó ötlet mozgásban maradni — 
oldallépéseket (sideways move) megengedve annak reményében, hogy a fennsík igazából 
egy váll, mint amilyent a 4.10. ábra mutat? A válasz általában igen, azonban óvatosan kell 
eljárnunk. Ha oldallépéseket mindig megengedünk, akkor ha felfelé haladás nincs, vég- 
telen hurokba kerülünk minden olyan esetben, amikor az algoritmus olyan lapos lokális 
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4.13. ábra. Annak illusztrálása, hogy a gerinc miért jelent nehézséget a hegymászó keresés számára. Az ál- 
lapotok rácshálózata (sötét körök) rá van illesztve a balról jobbra emelkedő gerincre, egy olyan Tokális 
maximum sorozatot eredményezve, ahol a maximumok nincsenek közvetlen módon egymással összekap- 
csolva. Minden egyes lokális maximumból az összes lehetséges cselekvés a lejtőn lefelé mutat. 


maximumot talál, amely nem váll. Gyakori megoldás az egymás után alkalmazott oldal- 
lépések számát korlátozni. A 8-királynő problémában például megengedünk 100 egymás 
utáni oldallépést. Ezzel a hegymászás áltai megoldott esetek arányát 1496-ról 9490-ra 
emelhetjük. A sikernek azonban ára van. Átlagosan 21 lépés hosszú minden sikerrel 
megoldott eset, és 64 lépés hosszú a kudarc. 

A hegymászó algoritmus számos változatát fejlesztették ki. A sztochasztikus hegy- 
mászó keresés (stochastic hill climbing) a felfelé mutató irányokból véletlen módon 
választ. A választás valószínűsége a felfelé mutató irány meredekségével változhat. 
Az algoritmus általában a legmeredekebb emelkedő módszernél lassabban konvergál, 
egyes állapotfelszíneken azonban képes jobb megoldást találni. Az elsőnek-választott 
hegymászó algoritmus (first-choice hill climbing) sztochasztikus hegymászó keresést 
használ, a követőket véletlen módon addig generálva, amíg az az aktuális állapotnál 
nem lesz jobb. Ez jó stratégia, ha egy állapotnak sok (például több ezer) követője van. 
Ennek vizsgálatára invitál a 4.16. feladat. 

Az eddig leírt hegymászó algoritmusok nem teljesek — sokszor kudarcot vallanak 
a cél megkeresésében. mert egy lokális maximumba beragadnak. A véletlen újraindítá- 
sú hegymászás (random-restart hill-climbing) az ismert közmondás szerint jár el: , Ha 
nem megy elsőre, csináld újra." Véletlenül generált kiinduló állapotokból? hegymászó 
keresést végez, amíg célba nem ér. Az algoritmus 1-hez tartó valószínűséggel teljes an- 
nál a trrviális oknál fogva, hogy előbb-utóbb a célállapotot kezdőállapotként is fogja ge- 
nerálni. Ha minden hegymászó keresés p valószínűséggel sikeres, a véletlen újraindítá- 
sok várható száma 1/p. A 8-királynő problémában, ha oldallépéseket nem engedünk 
meg, p sz 0.14. így a cél megtalálásához átlagosan 7 iterációra van szükség (6 kudarc és 


8 véletlen állapotot generálni egy implicit módon specifikált állapottérben azonban önrnagában is igen 
kemény probléma lehet. 
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1 siker). A várható lépésszám a sikeres iteráció költsége valamint (1 — p)/p-szerese a ku- 
darc költségének, durván 22 lépés. Ha oldallépéseket is engedünk, átlagosan 1/0.94 sz 
1,06 iterációra és (1 x 21) -- (D.06/0.94) x 64 sz 25 lépésre van szükség. A 8-királynő 
probléma számára a véletlen újraindítású hegymászó keresés valóban hatékony. Még 
hárommillió királynő mellett is ez a megközelítés egy percen belül talál megoldást." 

A hegymászás sikere nagyban függ az állapottér , felszínének" alakjától: ha azon 
csak néhány lokális maximum és fennsík található, akkor a véletlen újraindítású hegy- 
mászó algoritmus gyorsan meg fog találni egy jó megoldást. Egy valódi problémához 
egy olyan felszín tartozik, ami leginkább egy sündisznócsaládhoz hasonlít egy sima 
Padlón, ahol minden sündisznótüske csúcsát egy további miniatűr sündisznó lakja és 
így a végtelenségig. Ha a probléma NP-teljes, akkor minden bizonnyal exponenciálisan 
sok lokális maximummal rendelkezik. melyekben beragadhatunk. Ennek ellenére álta- 
lában kisszámú újraindítás után már elfogadhatóan jó megoldást lehet találni. 


Szimulált lehűtés 


A hegymászó keresés, amely soha nem indul , lefelé a lejtőn" a kisebb értékű (vagy na- 
gyobb költségű) állapotok felé, garantáltan nem teljes. mert egy lokális maximumban 
beragadhat. Ezzel ellentétben a tisztán véletlen vándorlás — azaz a követők halmazából 
egyenletesen véletlen módon sorsolt követőre való átlépés — teljes, de hihetetlenül nem 
hatékony. Értelmes dolognak tűnik a hegymászás és a véletlen vándorlás valamiféle 
ötvözése, hogy mind a teljességet, mind a hatékonyságot megtarthassuk. Egy ilyen algo- 
ritmus a szimulált lehűtés (simulated annealing). A kohászatban a lehűtés (annealing) 
a fémeket, illetve az üveget edző, keményítő folyamat, amikor azokat magas hőmérsék- 
letre felmelegítjük, majd fokozatosan lehűtjük, lehetővé téve, hogy az anyag alacsony 
energiájú kristályos állapotba kerüljön. Hogy a szimulált lehűtést megértsük, a hegymá- 
szásról térjünk át a gradiens leereszkedésre (gradient descent) (azaz a költség mini- 
malizálására), és képzeljük el, hogy az a feladatunk, hogy egy hepehupás asztalon egy 
Pingponglabdát a legmélyebb szakadékba juttassunk. Ha a labdát gurulni hagyjuk, egy 
lokális minimumba kerül. Ha a felületet megrázzuk, a labdát kiugraszthatjuk a lokális 
minimumból. A trükk az, hogy olyan erősen kell megrázni a felületet, hogy a labda a 
lokális minimumból kikei n, de mégsem annyira erősen, hogy a labda a globális mi- 
nimumból kiugorjon. A szimulált lehűtés olyan megoldás, hogy először erősen rázunk 
(azaz egy magas hőmérsékleten), majd fokozatosan csökkentjük a rázás intenzitását 
(vagyis csökkentjük a hőmérsékletet). 

A szimulált lehűtés legbelső ciklusa (lásd 4.14. ábra) nagyon hasonlít a hegymászáshoz. 
A legjobb lépés megtétele helyett azonban egy véletlen lépést tesz. Ha a lépés javítja 
a helyzetet, akkor az mindig végrehajtásra kerül. Ellenkező esetben az algoritmus a lépést 
csak valamilyen 1-nél kisebb valószínűséggel teszi meg. A valószínűség exponenciáli- 
san csökken a lépés , rosszaságával" — azzal a AE mennyiséggel, amivel a kiértékelő 





9 Luby (Luby és társai, 1993) azt bizonyította be, hogy egyes esetekben az a legjobb. ha a véletlen keresést 
egy konkrét rögzített időtartam letelte után újraindítjuk, és ez sokkal hatékonyabb lehet annál. mintha mind- 
egyik keresést a végtelenségig hagynánk folytatódni. Az oldallépések kitiltása vagy a számuk korlátozása ennek 
egy példája. 
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function SZIMULÁLT-LEHŰTÉS(probléma, lehűtési terv) returns egy megoldási állapot 
inputs: probléma, egy probléma 
lehűtési terv, egy leképzés időről , hőmérsékletre" 
local variables: aktuális, egy csomópont 
következő. egy csomópont 
T, egy hőmérséklet", ami a lefelé lépések valószínűségét szabályozza 


aktuális — CSOMÓPONTOT -LÉTREHOZ(KINDULÓ-ÁLLAPOTÍ probléma]) 
forr — 1 to oc do 
T— lehűtési tervtt) 
if T — 0 then return aktuális 
következő — az aktuális egy véletlenszerűen kiválasztott követő csomópontja 
AE — ÉnrÉkÍkövetkezől - ÉRTÉK [aktuális] 
if AE 5 0 then aktuális — következő 
else aktuális — következő csak e7ET valószínűséggel 











4.4. ábra. A szimulált lehűtés keresési algoritmus. A hegymászó keresés egy olyan változata, ahol lefelé 
tartó lépések is megengedettek. A lefelé tartó lépéseket a lehűtési terv elején inkább, az idő múlásával egy- 
re kevésbé fogadjuk el. A lehűtési terv, mint az eljárás bemenete, a 7 értékeit mint időfüggvényt adja meg. 


függvény értéke romlott. A valószínűség a T , hőmérséklet" csökkenésével is csökken. 
A , rossz" lépések az indulásnál T magasabb értékeinél valószínűbbek, 7 csökkenésével 
egyre valószínűtlenebbé válnak. Be lehet bizonyítani, hogy ha a hűtési karakterisztika 
T értékeit kellően lassan csökkenti, az algoritmus 1-hez tartó valószínűséggel a globá- 
lis minimumban köt ki. 

A szimulált lehűtési algoritmust először elterjedten VLSI-elrendezési problémák 
megoldására használták a "80-as évek elején. Azóta széles körben alkalmazzák ipari 
termelés ütemezésére és egyéb nagy volumenű optimalizációs feladatokra. A 4.16. 
feladat a szimulált lehűtési algoritmus és a véletlen újraindítású hegymászó algoritmus 
teljesítményének összehasonlítását kéri az n-királynő problémán. 


Lokális nyaláb keresés 


Mindössze egyetlen csomópontot tartani a memóriában eléggé extrém reagálásnak 
tűnik a memóriakorlát problémájára. A lokális nyaláb keresés (local beam search) 
algoritmus! nem egy, hanem k állapotot követ nyomon. Az algoritmus k véletlen mó- 
don generált állapottal indul. Minden lépésben a k állapot mindegyikének összes köve- 
tőit kifejti. Ha ezek valamelyike egy cél, az algoritmus leáll. Egyébként a teljes listából 
kiválasztja a legjobb k követőt, és ezt az eljárást ismétli. 

Első látásra a k állapotú lokális nyaláb keresés nem tűnik másnak, mint a k véletlen 
újraindítás parallel futtatása a szekvenciális futtatás helyett. Valójában a két algoritmus 
igen különböző. A véletlen újraindítású algoritmusban minden keresési folyamat a töb- 
bitől függetlenül fut le. A lokális nyaláb keresési algoritmusban a k parallel keresési 
szál megosztja az információt. Például ha az egyik állapot számos jó követőt generál, 


10 , (okális nyaláb keresés a nyalábkeresés (beam search) algoritmus egy adaptációja, ari viszont egy út- 
alapú algoritmus. 


160 4. INFORMÁLT KERESÉSI ÉS FELFEDEZÉSI MÓDSZEREK 


és a többi k — I mind rosszabbat, akkor az eredmény az, mintha az. első állapot meg- 
üzenné a többinek: , (Gyertek át ide, itt zöldebb a fű!" Az algoritmus gyorsan abbahagyja 
az eredménytelen kereséseket, és az erőforrásait oda viszi. ahol a legnagyobb előre- 
haladás érzékelhető. 

A lokális nyaláb keresés a legegyszerűbb formájában a k állapot közötti változatos- 
ság hiányától szenvedhet. Az állapotok gyorsan koncentrálódhatnak a tér egy kicsi 
részében, amitől a keresés csak kevéssel lesz több, mint a hegymászó keresés egy drága 
változata. A problémát a sztochasztikus nyaláb keresés (stochastic beam search) se- 
gíti megoldani, ami analóg a sztochasztikus hegymászó kereséssel. A k legjobb követő 
megválasztása helyett az algoritmus a k követőt véletlen módon választja ki, ahol egy 
adott követő kiválasztásának valószínűsége az állapot értékének növekvő függvénye. 
A sztochasztikus nyalábkeresés egy kicsit hasonlít a természetes kiválasztódásra, ahol 
egy , állapot" (szervezet) , követői" (utódjai) a következő generációt az állapot , értéke" 
(fitness) alapján népesítik be. 


Genetikus algoritmusok 


A genetikus algoritmus, GA (genetic algorithm) a sztochasztikus nyaláb keresés egy 
olyan variánsa, ahol a követő állapotokat nem egy állapot módosításával, hanem két 
szülő állapot összekombinálásával állítjuk elő. A természetes kiválasztódás analógiája 
itt is ugyanaz, mint a sztochasztikus nyaláb keresés esetén, azzal a különbséggel, hogy 
most az utódlétrehozásnak a szexuális és nem az aszexuális mechanizmusáról van szó. 

A nyalábkereséshez hasonlóan, a GA is k véletlen módon generált állapottal indul, 
aminek populáció (population) a neve. Minden állapotot vagy egyedet (individual) 
egy véges ábécé fölött értelmezett füzér képvisel - leggyakrabban egy 0-ból és 
1-ekből álló füzér. A 8-királynő állapotnak például a 8 királynő pozícióját kell specifi- 
kálnia, mindegyik egy 8 négyzetet tartalmazó oszlopban, így 8 x 10g28 — 24 bitre van 
szükség. Az állapotot 8 számjeggyel is lehetne jellemezni, melyek mindegyike az 1 — $ 
tartományból való (később látni fogjuk, hogy a két kódolás viselkedése eltérő). 
A 4.15. (a) ábra egy olyan populációt mutat be, mely négy, a 8-királynő állapotait rep- 
rezentáló 8 számjegyes füzérből áll. 


[24748552]. 24 31 eztet vöztssssz 4 [327482 
szszzra 24748552 [24752411F f[24752411 
24415124] 20 27" [327521 32752124 32£b52124 
[32543213] ni u testet S 244151111—[244154177 


(a) (b) to) (d) (e) 
Kezdeti populáció  Fitness-függvény Kiválasztás Keresztezés Mutáció 









































4.15. ábra. A genetikus algoritmus. Az (a)-beli kezdeti populációt (b)-ben fitness-függvény alapján rang- 
soroljuk, aminek eredményét a (c)-ben látható reprodukáló párok adják. A létrehozott utódok a (d)-ben 
láthatók, melyekre még hat a mutáció (e). 
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Az állapotok következő generációjának az előállítása a 4.15. (a)-(e) ábrán követhe- 
tő. A (b)-ben minden állapotot a kiértékelő függvény vagy (GA-terminológiában) a 
fitness-függvény (fitness function) alapján rangsoroljuk. Egy fitness-függvénynek 
a jobb állapotokra magasabb értékeket kell visszaadnia, így a 8-királynő problémában 
fitness-függvényként a nemtámadó királynőpárok számát használjuk. Ennek értéke egy 
megoldás esetén 28. A négy állapot értéke 24, 23, 20 és 11. A genetikus algoritmus e 
konkrét változatában a szaporodásra való kiválasztás valószínűsége a fitness-értékkel 
egyenesen arányos. A százalékos mennyiségeket a fitness-értékek mellett adjuk meg. 

A (c)-ben két párt véletlenszerűen választunk ki reprodukcióra, a (b)-beli valószí- 
nűségeknek megfelelően. Figyeljük meg, hogy egy egyedet kétszer, egy másikat 
viszont egyszer sem választottunk ki.!! Minden keresztezendő párnál egy keresztezési 
(crossover) pontot választunk a füzérbeli pozíciók közül. A 4.15. ábrán a keresztező- 
dési pontok az első ; Párnál a harmadik számjegy után, a második párnál az ötödik szám- 
jegy után vannak.! 
































4.16. ábra. A 4.15. (c) ábrán látható első két szülőnek és a 4.15. (d) ábrán látható két utódnak megfelelő 
8-királynő állapotok. Az árnyalt oszlopok a kereszteződés során elvesznek. a nem árnyalt oszlopok meg- 
maradnak. 


A (d)-ben az utódok generálását látjuk, a szülő füzéreket a keresztezési pontoknál ke- 
resztezve. Az első pár első gyereke például az első szülőtől az első három számjegyét 
kapja és a másik szülőtől a többit. A második gyerek pedig az első három számjegyét 
a második szülőtől kapja és az első szülőtől a többit. Az ennél a reprodukciós lépésnél 
szereplő 8-királynő állapotokat a 4.16. ábra mutatja. A példa azt a tényt szemlélteti, 
hogy ha a két szülő állapot igen különböző, a keresztezés eredménye mindkét szülőtől igen 
távol eshet. Sokszor előfordul, hogy a keresési folyamat elején a populáció eléggé változa- 
tos, és a keresztezés (a szimulált lehűttéshez hasonlóan) nagy léptekkel halad előre, majd 
később, ha az egyedek többsége már igen hasonlít egymásra, kisebb lépések jönnek. 

Végül az (e)-ben a füzér minden elemét valamilyen kis független valószínűséggel 
mutációnak (mutation) vetjük alá. Az első, a harmadik és az ötödik utódban egy-egy 





" Ennek a kiválasztási szabálynak számos változata van. Kimutatható, hogy a selejtezés (culling) mód- 
szere, ahol egy küszöb alá eső minden egyedet eldobunk, a véletlen változatnál gyorsabban konvergál (Baum 
és társai, 1995). 

Itt számít a kódolás, Ha a 8 szárnjegyes kódolás helyett a 24 bites kódolást használjuk, a kereszteződési 
Pontnak 2/3-ad esélye van. hogy egy számjegy belsejébe essen, ami ennek a számjegynek lényegében tetszőleges 
mutációját eredményezi. 
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function GENETIKUS-ALGORITMUS(populáció, FITNESS-Fv) returns egy egyed 
inputs: populáció, az egyedek halmaza 
FITNESS-Fv, egy egyed fitness-értékét mérő függvény 
repeat 
új populáció — üres halmaz 
loop for i from 1 to MERET(popudáció) do 
x — VÉLETLEN-KIVÁLASZTÁS(populáció, FITNESS-Fv) 
y €— VÉLETLEN-KIVÁLASZTÁS(populáció, EITNESS-Fv) 
utód — REPRODUKCIÓ (x, y) 
if (kis véletlen valószínűség) then ttód — MUTÁCIÓ(utód) 
utód hozzáadása az új populáció-hoz 
populáció — új populáció 
until valamelyik egyednek kellően magas a fitness-értéke, vagy már lejárt az idő 
return a populáció legjobb egyede, a FITNESS-Fv-nek megfelelően 





function REPRODUKCIÓ(x, y) returns egy egyed 
ínputs: x, y a szülőegyedek 


n — HosszC9) 
c — lés n közötti véletlen szám 
return HOZZÁFŰZ(RÉSZFÜZÉR(x, I, c), RÉSZFÜZÉR(, c -H 1, n)) 











4.17. ábra, Egy genetikus algoritmus. Ez az algoritmus ugyanaz. mint amelyet a 4.15. ábrán mutattunk, 
egy kivétellel. Ebben a jobban elterjedt változatban a két szülő reprodukciója nem két, hanem csak egy 
utódot hoz létre. 


számjegyet mutáltunk. A 8-királynő problémában ez annak felel meg, hogy egy király- 
nőt véletlen módon kiválasztunk. és egy. az oszlopban szintén véletlen módon kiválasz- 
tott mezőre áthelyezünk. Az ezeket a lépéseket implementáló algoritmust a 4.17. ábra 
mutatja. 

A sztochasztikus nyaláb kereséshez hasonlóan a genetikus algoritmus is kombinál- 
ja a hegymászó tendenciát, a véletlen feltárást és a parallel keresési szálak közötti in- 
formációcserét. A genetikus algoritmus elsődleges előnye, ha ilyen egyáltalán létezik, 
a keresztezéstől származik. Matematikailag azonban kimutatható, hogy ha kezdetben 
a genetikus kód pozícióit véletlen sorrendben permutáljuk, a keresztezés semmilyen 
előnyt nem jelent. Intuitíve, az előny a keresztezés azon képességéből jön, hogy a ke- 
resztezés képes hasznos funkciókat teljesítő nagy betűblokkok kombinálására, melyek 
egymástól függetlenül alakultak ki, emelve ezzel a keresésnél a granuláltság szintjét. 
Az első három királynőt például a 2, 4 és 6 pozícióba helyezve (ahol nem tárnadják 
egymást), egy hasznos blokk alakul ki, amit más blokkokkal kombinálva egy meg- 
oldás nyerhető. 

Ennek működését a genetikus algoritmusok elmélete a séma (schema) fogalommal 
magyarázza. A séma egy olyan részfüzér, amelyben bizonyos pozíciók nem specifikál- 
tak. Így például a 246" séma az összes olyan 8-királynő állapotot leírja, ahol az 
első három királynő a 2., 4. és 6. pozícióban van. A sémára illeszkedő füzérek, mint pél- 
dául a 24613578 füzér, a séma példányai (instances). Kimutatható, hogy ha egy séma 
példányainak átlagos fitness-értéke az átlag felett van, akkor idővel a populációban 
a sémához tartozó példányok száma nőni fog. Világos. hogy ez a hatás elenyésző lesz, 
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ha a szomszédos biteknek semmi közük egymáshoz, mert kevés olyan tömör blokk lesz, 
ami konzisztens módon előnyt fog jelenteni. A genetikus algoritmus a legjobban akkor 
működik, ha a sémák a megoldás értelmes komponenseinek felelnek meg. Ha például 
a füzér egy antenna reprezentációja, akkor a sémák képviselhetik az antenna egyes 
komponenseit, például a reflektorokat és a deflektorokat. Egy jó komponensnek nagy 
valószínűséggel különböző konstrukciók sokaságában is jónak kell lennie. Ez azt su- 
gallja, hogy a genetikus algoritmusok sikeres alkalmazása a reprezentáció gondos kiala- 
kítását igényli. 

A gyakorlatban a genetikus algoritmusoknak nagy hatása volt az olyan optimalizá- 
ciós problémákra, mint például az áramkör elrendezéstervezés és a gyártósor-ütemezés. 
Jelenleg nem világos, hogy a genetikus algoritmusok vonzereje a hatékonyságuk vagy 
az evolúció elméletében rejlő esztétikus eredetük eredménye. Sok munka van még hát- 
ra, hogy azokat a körülményeket azonosítsuk, amikor a genetikus algoritmusok igazán 
jól teljesítenek. 
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A 2. fejezetben bemutattuk a diszkrét és a folytonos környezet közötti különbséget, ar- 
ra is rámutatva, hogy a valósvilág-beli környezetek többsége folytonos. Az eddig leírt 
algoritmusok közül azonban egyik sem képes a folytonos állapottereket kezelni. Az ál- 
lapotátmenet-függvény az esetek többségében végtelen számú állapottal térne vissza! 
Ez a részfejezet egy nagyon rövid bevezetőt ad nébány olyan lokális keresési techniká- 
hoz, melyek folytonos térben keresik az optimális megoldást. A téma irodalma óriási. 
Sok alaptechnika már a 17. században napvilágot látott, Newton és Leibniz kalkulusának 
kifejlődését! követően. E technikákhoz a könyvben több helyen fogunk folyamodni, be- 
leértve a tanulásról, a látásról és a robotikáról szóló fejezeteket. Röviden, mindenhol, 
ahol a valós világgal foglalkozunk. 


Evolúció és keresés 


Az evolúció elméletét Charles Darwin az On the Origin of Species by Means of Narural 
Selection c. művében (Darwin, 1859) dolgozta ki. A központi gondolat igen egyszerű: a rep- 
rodukcióban (mutációként ismert) eltérések fordulnak elő, és azokat a következő generációk 
nagyjából a reprodukciós fitnessre gyakorolt hatásuk arányában megtartják. 

A darwini elméletet annak ismerete nélkül dolgozták ki, hogy a szervezetek tulajdonságai ho- 
gyan öröklődnek és módosulnak. E folyamatokat irányító valószínűségi törvényeket első ízben 
Gregor Mendel szerzetes azonosította (Mendel, 1866), aki borsóval kísérletezett, saját szavaival 
mesterséges megtermékenyítést alkalmazva. Sokkat később Watson és Crick feltárták a DNS- 
molekula szerkezetét és ábécéjét - AGTC (adenin, guanin, timin, citozin) — (Watson és Crick, 
1953). A standard modellben a betűszekvenciában változás pontmutáció és , keresztezés" révén 
áll be (ahol az utód DNS-e a szülői DNS-ek hosszú részleteinek kombinálásával jön létre). 

A lokális keresési algoritmus analógiájáról írtunk már. A sztochasztikus nyaláb keresés és 
az evolúció közötti alapvető különbség a szexuális reprodukció használata, ahol az utódokat 


13 A többváltozós kalkulus és a vektoraritmetika ismerete hasznos ennek a részfejezetnek az olvasásához. 
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több egyedből hozzuk létre, és nem csak egyből. Az evolúció tényleges mechanizmusai azonban 
sokkal gazdagabbak, mint amit a genetikus algoritmus lehetővé tenne. A mutációhoz például az 
átfordítás, a duplikálás, a DNS nagy szegmenseinek a mozgatása is hozzátartozik. Egyes víru- 
sok a DNS-t az egyik szervezetből veszik és egy másik szervezetbe beillesztik. Vannak átvihető 
gének is, amelyek nem tesznek mást, csak egy génállományon belül többezerszer lemásolják 
magukat. Olyan gének is vannak, amelyek a potenciális reprodukciós parereknél ezeket a 
géneket nem tartalmazó sejteket megmérgezik, növelve így a sokszorozódás esélyét. A leg- 
fontosabb tény, hogy maguk a gének tartalmazzák annak a mechanizmusnak a kódját. amely 
által a génállomány reprodukálódik, és egy szervezetté alakul át. A genetikus algoritmusok- 
ban ezek a mechanizmusok különálló programok részei, vagyis a manipulált füzérekben nem 
jelennek meg. 

A darwini evolúció igencsak kis hatékonyságú mechanizmusnak tűnhet, hiszen vakon létre- 
hozott kb. 105 szervezetet, anélkül hogy a keresési heurisztikáin egy csöppet is javított volna. 
Darwin előtt 50 évvel a különben neves francia természettudós Jean Lamarck egy olyan evo- 
lúció elméletet javasolt (Lamarck, 1809), ahol egy szervezet az élete során, adaptációja révén 
megszerzett tulajdonságokat is képes az utódoknak átadni. Az ilyen mechanizmus hatékony 
lenne, de úgy tűnik, a természetben nem fordul elő. Sokkal később James Baldwin látszólag 
hasonló elmélettel álit elő (Baldwin, 1896), hogy a szervezet élete alatt megtanult viselkedés 
növelhetné az evolúció sebességét. Lamarck elméletével ellentétben a Baldwin-elmélet a dar- 
wini evolúcióval teljesen konzisztens, hiszen alapja egy szelekciós nyomás, amely olyan egye- 
dekre hat, amelyek lokális optimumokat találtak a genetikus felépítésük által engedélyezett vi- 
selkedések között. A korszerű számítógépes szimulációk alátámasztják a , Baldwin-effektus" 
valós voltát, feltéve, hogy a , közönséges" evolúció olyan szervezeteket képes kialakítani, ame- 
lyeknél a belső hatékonysági mérték a saját tényleges fitness-értékükkel valahogy korrelál. 





Kezdjük egy egyszerű példával. Tegyük fel, hogy valahol Romániában három új 
repülőteret szeretnénk létesíteni úgy, hogy a városoknak (lásd 3.2. ábra) a hozzájuk 
legközelebb eső repülőtérhez való távolságösszegük legyen minimális. Az állapotteret 
ekkor a repülőterek (xi, y1), (x2, y2) és (xz. y3) koordinátái definiálják. Ez egy hatdimen- 
ziós tér, azt is mondhatjuk, hogy az állapotokat hat változó (variable) definiálja (általá- 
nosságban az állapotokat a változók n-dimenziós x vektora definiálja). Ebben a térben 
való mozgás a térképen a repülőterek áthelyezésének felel meg. Az f(x, yi. X2. Y2, X3. y3) 
célfüggvényt, ha a legközelebbi városok már megvannak, bármely állapot esetére 
viszonylag könnyű kiszámítani, általánosságban azonban igen nehéz ezt leírni. 

A folytonosság problémái egyszerűen elkerülhetők, ha az egyes állapotok szomszéd- 
ságát diszkretizáljuk. Egyszerre például csak egy repülőteret, csak x vagy y irányban egy 
rögzített ő lépéssel lehet áthelyezni. Ez 6 változó mellett, minden állapotban 12 köve- 
tőt eredményez. Ehhez az előbb megismert bármelyik lokális keresési algoritmust alkal- 
mazhatjuk. A sztochasztikus hegymászó keresést és a szimulált lehűtést közvetlenül, a 
tér diszkretizálása nélkül is alkalmazhatjuk. Ezek az algoritmusok a követőket véletlen 
módon választják ki, amelyek megvalósítása ő hosszúságú véletlen vektorok generálá- 
sával lehetséges. 

Sok módszer található, melyek megkísérlik a felszín gradiensét (gradient) felhasz- 
nálni a maximum megtalálásához. A célfüggvény gradiense egy Vf vektor, amely a leg- 
meredekebb emelkedő nagyságát és irányát adja meg. Problémánk esetén: 


vr-(06 2 AA A 
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Egyes esetekben a maximumot a Vf — 0 egyenlet megoldásával találhatjuk meg 
(ezt megtehetnénk például akkor, ha csak egy repülőteret helyeznénk el; a megoldás az 
összes város koordinátáinak számtani közepe lesz). Sok esetben azonban ezt az egyen- 
letet zárt alakban nem lehet megoldani. Három repülőtér esetén például a gradiens ki- 
fejezése attól függ, hogy az adott állapotban mely városok esnek legközelebb az egyes 
repülőterekhez. Ez azt jelenti, hogy a gradienst lokálisan, és nem globálisan tudjuk szá- 
mitani. Ennek ellenére még mindig folyamodhatunk a legmeredekebb emelkedő hegy- 
mászáshoz a pillanatnyi állapotot az 


X 6 X-taVf(x) 


képlettel frissítve, ahol a. egy kis konstans. Más esetekben nem biztos, hogy a célfügg- 
vény differenciálható formában áll a rendelkezésünkre — például a repülőterek helyeit 
egy konkrét esetben esetleg egy nagyméretű gazdasági szimulációs szoftvercsomag 
futtatásával határozhatjuk meg. Az ilyen esetekben az ún. empirikus gradiens 
(empirical gradient) meghatározásához folyamodhatunk, minden koordináta mentén 
egy kis pozitív és negatív változáshoz kiszámítva a választ. Az empirikus gradiens 
keresés ugyanaz, mint a legmeredekebb emelkedő hegymászás az állapottér diszkreti- 
zált változatában. 

Az , a egy kis konstans" kifejezés mögött az a-t beállító módszerek óriási választé- 
ka rejlik. Az alapprobléma az, hogyha a túl kicsi, túlságosan sok lépésre van szükség. 
Ha a túl nagy, a keresés könnyűszerre! túllő a maximumon. A vonalkeresés (line 
search) módszere e problémát úgy kísérli megoldani, hogy a pillanatnyi gradiens 
irányát — általában ax ismételt megduplázásával - meghosszabbítja, amíg fnem kezd új- 
ra csökkeni. Az a pont, ahol ez megtörténik, lesz az új aktuális állapot. 

Sok probléma esetén a legjobb algoritmus a jó öreg Newton-Raphson-módszer 
(Newton, 1671; Raphson, 1690). Ez a gyökhelykeresés, azaz a g(x) — 0 alakú egyenle- 
tek megoldásának általános módszere. Működésének alapja az x gyök új becslésének 
számítása a Newton-formula szerint: 


x—x-gh)/g) 


.f maximumának vagy minimumának megkereséséhez olyan x-et kell megkeresni, ami- 
re a gradiens nulla (azaz Vf(x) — 0). A Newton-formula g(x)-e így V/f(x) lesz, és 
a frissítési egyenlete az alábbi mátrixos formában 


xX—x-H7GOV/(x) 


írható fel, ahol H;(x) a második deriváltak mátrixa (Hesse-mátrix), melynek H;; ele- 
melt a0f/őx; jÖxjmásodik deriváltak adják meg. Mivel a második deriváltak mátrixának 
17 eleme van, a Newton-Raphson-módszer sokdimenziós terekben drága lesz, ami szá- 
mos közelítő módszer kifejlesztéséhez vezetett. 

A lokális keresési módszerek számára a lokális maximumok, a gerincek és a fennsí- 
kok folytonos terekben ugyanúgy gondot jelentenek, mint diszkrét terekben. A véletlen 
újraindítás és a szimulált lehűtés alkalmazható (itt is), és gyakran segít. A sokdimenziós 
folytonos terek azonban terebélyes helyek, ahol könnyű elveszni. 

Az utolsó téma, amivel érdemes futó ismeretséget kötni a korlátozott optimalizálás 
(constrained optimization). Egy optimalizálási probléma korlátozott, ha a megoldás- 
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nak minden változójának értékeire nézve valamilyen kemény korlátozást kelt teljesí- 
tenie. A repülőteres problémánkban korlátozhatjuk például a belyszíneket, hogy a 
repülőterek Románián belül és szárazföldön (nem tavak közepén) helyezkedjenek el. 
A korlátozott optimalizálás nehézségei a korlátozások és a célfüggvény természetén 
múlnak. A legismertebb kategóriát a lineáris programozási (linear programming) 
problémák jelentik, ahol a korlátozások lineáris egyenlőtlenségek, amelyek egy kon- 
vex régiót képeznek, és ahol a célfüggvény szintén lineáris. A lineáris programozási 
problémákat változó számban polinomiális időben meg lehet oldani. Olyan problémá- 
kat ís tanulmányoztak, ahol más típusú korlátozások és célfüggvények fordulnak elő. 
Ilyen problémák például a kvadratikus programozási feladat, a másodrendű kónikus 
programozási feladat stb. 





4.5. ONLINE KERESŐ ÁGENSEK ÉS ISMERETLEN 
KÖRNYEZETEK 


Eddig olyan ágensekre összpontosítottunk, amelyek offline keresési (offline search) 
algoritmusokat használnak. Egy teljes megoldást számítanak ki mielőtt a valós világba 
beteszik a lábukat (lásd 3.1. ábra), majd a megoldást az érzékelések megvizsgálása 
nélkül végrehajtják. Ezzel ellentétben az online kereső (online search)! ágensek mű- 
ködésében a számítás és a végrehajtás átlapolódik (interleaving): először végrehajta- 
nak egy cselekvést, majd megfigyelik a környezetüket és kiszámítják a következő cse- 
lekvést. Az online keresés jó ötlet a dinamikus és a szemidinamikus környezetekben — 
olyan környezetekben, ahol büntetik a semmittevést és a túlságosan hosszú számításokat. 
Az online keresés még jobb ötlet sztochasztikus környezetekben. Általánosságban egy 
offline keresésnek egy exponenciálisan nagy, minden lehetséges történést figyelembe ve- 
vő eshetőségi tervvel kellene előállnia, míg az online keresés csak az aktuálisan meg- 
történteket veszi figyelembe. Például ajánlatos, ha egy sakkozó ágens előbb megteszi 
az első lépést és csak ezután számítja ki a játszma teljes lefolyását. 

Az online keresés szükségszerű ötlet a felfedezési problémák (exploration problems) 
esetén, ahol az állapotok és a cselekvések ismeretlenek az ágens számára. Egy ilyen 
tudatlan állapotban az ágensnek a cselekvéseit kísérletekként kell használnia, hogy 
megállapíthassa, mit tegyen a következő pillanatban, így a számítás és a cselekvés 
szükségszerűen átlapolódik. 

Az online keresés kanonikus példája egy új épületben elhelyezett robot, melynek fel 
kell tárnia a környezetét, hogy felépíthesse azt a térképet. amit majd arra használ, hogy 
A-tól B-ig eljusson. A labirintusból való menekülési módszerek — az ókori hősök elen- 
gedhetetlen képessége — szintén példái az online keresésnek. A térbeli feltárás azonban 
nem az egyedüli formája a feltárásnak. Gondoljunk egy újszülöttre: sok lehetséges cse- 
lekvéssel rendelkezik, de egyiknek sem tudja a hatását, és csak néhány közvetlenül el- 
érhető állapotról van tudomása. Az, ahogy egy újszülött fokozatosan felfedezi, hogy 
hogyan működik a világ, részben egy online keresési folyamat. 


14 Az vonline" kifejezést sűrűn használják a szamítógépes tudományokban olyan folyamatok megjelölésére, 
amelyek a bemeneti adatokat azok bejövetelekor dolgozzák fel, és nem várnak addig, amíg a teljes bemeneti 
adathalmaz hozzáférhetővé válik. 
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Online keresési problémák 


Egy online keresési problémát egy tisztán csak számítást végző folyamat helyett csak 
egy olyan ágens tud megoldani, amely a cselekvéseit végrehajtja. Feltételezzük. hogy 
az ágens csak az alábbiakat tudja: 


s. CSELEKVÉSEK(S), amely az s állapotban engedélyezett cselekvések listáját adja vissza, 

. A lépésköltség c(s, a, 5") függvény — jegyezzük meg, hogy ez nem használható addig, 
amíg az ágens nem tudja, hogy s" az eredmény, és 

s  CÉL-TESZT(s5). 


Vegyük észre azt is, hogy az ágens nem képes egy állapot követőit másképpen elérni, 
mint úgy, hogy az adott állapotban az összes cselekvését kipróbálja. A 4.18. ábrán lát- 
ható labirintusproblémában az ágens nem tudja, hogy a Fel cselekvés (1.1)-ből elvezeti 
őt az (1,2)-be, valamint ennek végeztével. hogy a Le cselekvés visszaviszi őt az (1,1)-be. 
Bizonyos alkalmazásokban a tudatlanság ezen szintje mérsékelhető — egy felfedező ro- 
bot ismerheti a mozgási cselekvéseinek mechanizmusát, és csak az akadályok hollétéről 
nincs tudomása. 

Feltételezzük, hogy az ágens mindig képes felismerni azt az állapotot, amiben már járt, 
és hogy a cselekvései determinisztikusak (e két feltételezéstől a 17. fejezetben eltekin- 
tünk). Végül az ágens hozzáférhet egy A(5) elfogadható heuriszítikus függvényhez, amely 
a pillanatnyi állapot és a célállapot távolságát becsüli. A 4.18. ábrán például az ágens tud- 
hatja a célpozícióját, és képes lehet a Manhattan-távolsági heurisztika használatára. 

Az ágens célja tipikusan az, hogy elérjen egy célállapotot, és eközben minimalizálja 
a költségeket (egy másik lehetséges cél egyszerűen az egész környezet feltárása). 
A költség az ágens által megtett tényleges út teljes költsége. Szokásos ezt a költséget az- 
zal az útköltséggel összehasonlítani, amit az ágens követne, ha az egész keresési teret 
előre ismerné — azaz az aktuális legrövidebb úttal (vagy a legrövidebb teljes feltá- 
rással). Az online algoritmusok nyelvén ezt kompetitív aránynak (competitive ratio) 
nevezzük, és azt szeretnénk, ha ez a lehető legkisebb lenne. 

Bár ez ésszerű követelménynek tűnik, könnyű belátni, hogy egyes esetekben a leg- 
jobb elérhető kompetitív arány a végtelen. Ha például bizonyos cselekvések irrevetzi- 
bilisek, az online keresés esetleg egy olyan zsákutcába kerülhet, ahonnan a célállapot 
nem elérhető. 


1 2 3 


4.18. ábra. Egy egyszerű labirintusprobléma. Az ágens §-nél kezd és C-t kell elérnie, a környezetéről 
azonban semmit sem tud. 
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4.19. ábra. (a) Két olyan állapottér. amely az online kereső ágenst egy zsákutcába viheti. (b) Egy két- 
dimenziós környezet, amely arra késztetheti az online kereső ágenst, hogy a célhoz legkevésbé hatékony 
utat kövesse. Akármit is választ az ágens, az ellenség eltorlaszolja az útját egy másik hosszú. vékony fallal 
úgy, hogy a követett út sokkal hosszabb lesz, mint a legjobb lehetséges út. 


Lehet, hogy az , esetleg" megfogalmazást nem találja kellően meggyőzőnek — végül 
is létezhetne olyan algoritmus, amely feltárás közben a zsákutcákban nem köt ki. A ki- 
jelentésünk pontosabban megfogalmazva az, hogy nincs olyan algoritmus, amely bármi- 
lyen állapottérben el tudná kerülni a zsákutcákat. Nézzük meg közelebbről a 4.19. (a) 
ábra két zsákutcás állapotterét. Egy olyan online kereső algoritmus számára, amely az § 
és az A állapotokat már meglátogatta, a két állapottér azonosnak tűnik, tehát mindket- 
tőben ugyanolyan döntéshez kell folyamodnia. Ez az ellenség érv (adversary argu- 
ment) egy példája — el tudunk képzelni egy ellenséget, amely módosítja az állapotteret, 
miközben az ágens feltárja azt, és a célokat és a zsákutcákat tetszés szerint átrendezi. 
A zsákutcák a robotfeltárás igazi nehézségei - lépcsőházak, felhajtók, szakadékok és a 
természetes terep minden fajtája irreverzíbilis cselekvésekhez vezethetnek. Hogy elő- 
tehaladhassunk, egyszerűen feltételezzük, hogy az állapottér biztonságosan feltárha- 
tó (safely explorable) - bizonyos célállapotok az összes elérhető állapotból elérhetők. 
A visszafordítható cselekvéseket tartalmazó állapottereket, mint amilyenek a labirintu- 
sok és a kirakójátékok, irányítatlan gráfoknak lehet tekinteni, és nyilván biztonságosan 
feltárhatók. 

Még a biztonságosan feltárható környezetekben sem biztosítható korlátozott kompeti- 
tív arány, ha léteznek benne korlátlan költségű utak. Ezt könnyű kimutatni irreverzíbilis 
cselekvéseket tartalmazó környezetekben, de igaz marad visszafordítható cselekvések 
esetén is, ahogy ezt a 4.19. (b) ábra mutatja. Emiatt általános, hogy az online algoritmu- 
sok hatékonyságát nem a legsekélyebben fekvő célállapot mélységével, hanem az egész 
állapottérrel jellemezzük. 
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Egy online kereső ágens minden cselekvés után érzékeli, hogy milyen állapotba került. 
Ebből az információból felépítheti környezetének térképét. Az aktuális térkép alapján 
eldönti, hogy legközelebb merre menjen. Ez az átlapolódó tervkészítés és végrehajtás 
azt jelenti, hogy az online kereső algoritmusok egészen mások, mint az előbb megis- 
mert offline algoritmusok. Az olyan offline algoritmusok, mint például az A? képesek 
egy csomópont követőit kiszámítani a tér egy részében, majd azonnal egy másik cso- 
móponttal foglalkozni a tér egy másik részében, mert a csomópontkifejtés inkább szi- 
mulált, mint valódi cselekvéseket takar. Egy online algoritmus ezzel szemben csak azt 
a csomópontot fejtheti ki, amelyben fizikailag tartózkodik. Hogy a következő csomó- 
pont kifejtése érdekében a fa keresztül-kasul való végignézését elkerüljük, célszerűbb- 
nek tűnik a csomópontokat lokális sorrendben kifejteni. Ezzel a tulajdonsággal éppen a 
mélységi keresés rendelkezik, mert (a visszalépést kivéve) a következő kifejtendő cso- 
mópont az előbb kifejtett csomópont gyereke. 

Egy online mélységi kereső ágenst a 4.20. ábra mutat. Ez az ágens a térképét egy 
eredmény[a, s] táblázatban tárolja. amely az s állapotban végrehajtott a cselekvés hatá- 
sára előálló állapotot tartalmazza. Ha az aktuális állapotban marad még ki nem használt 
cselekvés, az ágens ezzel próbálkozik. A nehézség akkor áll be, ha az ágens egy álla- 
potban már minden cselekvést kipróbált. Offline mélységi keresésnél ezt az állapotot a 
sorból egyszerűen elhagyjuk. Online keresésnél az ágensnek fizikailag kell visszalép- 
nie. A mélységi keresésnél ez azt jelenti, hogy abba az állapotba kell visszakerülnie, 
amelyből az ágens legutóbb belépett a vizsgált állapotba. Ezt egy olyan táblázat kar- 
bantartásával lehet megoldani, amely minden állapot számára azokat az ősállapotokat 





function ONLINE-MÉLYSÉGI-ÁGENS(5") returns egy cselekvés 
Ínputs: 5", egy érzékelés, amely az aktuális állapotot azonosítja 
static: eredmény, cselekvésekkel és állapotokkal indexelt táblázat, kezdetben üres 
nemfeltárt, egy táblázat, amely minden meglátogatott állapotra listázza 
a még nem próbált cselekvéseket 
nemvisszalépett, egy táblázat, amely minden meglátogatott állapotra listázza 
a még nem próbált visszalépéseket 
s, a, az előbbi állapot és cselekvés, kezdetben nulla 


áf CÉL-TESZT(5") then return stop 
át s/ egy új állapot then nemfeltárt[57] — CSELEKVÉSEK(5") 
áf s nem nulla then do 
eredményla, s) — s 
s hozzáadása a nemvisszalépettís"] elejéhez 
if nemfeltárt[5] üres then 
if nemvisszalépett[57] üres then return stop 
else a — egy olyan b cselekvés, hogy eredményib, 51 — Por(nemvisszalépets 
else a — Pop(nemfeltárt s") 
s-s 
return a 











4.20. ábra. Egy mélységi feltárást használó online kereső ágens. Az ágens csak a kétirányú keresési 
terekben alkalmazható. 
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listázza, melyekhez az ágens még nem lépett vissza. A keresés teljes, ha az ágens a visz- 
szaléphető állapotokból kifut. 

Azt javasoljuk, hogy az olvasó kövesse végig az ONLINE-MÉLYSÉGI-ÁGENS előrehala- 
dását a 4.18. ábrán mutatott labirintus esetén. Könnyű észrevenni, hogy az ágens a tér- 
ben minden csatlakozást legrosszabb esetben pontosan kétszer fog végigpásztázni. Feltá- 
rás esetében ez optimális eredmény. Egy cél megtalálása szempontjából azonban az ágens 
kompetitív aránya tetszőlegesen rossz lehet, ha egy hosszú túrára indul, holott a cél a kez- 
deti állapot közvetlen szomszédságában fekszik. Ezt a problémát az iteratívan mélyülő 
algoritmus online változata oldja meg. Egy homogén fát eredményező környezetben 
egy ilyen ágens kompetitív aránya egy kis konstans. 

Az alkalmazott visszalépési módszer miatt az ONLINE-MÉLYSEGI-ÁGENS csak olyan 
terekben működik, ahol minden cselekvés visszafordítható. Az általános állapotterekhez 
egy kicsit bonyolultabb algoritmusok léteznek, azonban ezek egyike sem garantál korlá- 
tozott kompetitív arányt. 


Online lokális keresés 


A mélységi kereséshez hasonlóan a hegymászó keresésre (hill-cJimbing search) jel- 
lemző a csomópontkifejtés lokalítása. A tény az, hogy mivel a hegymászó keresés 
a memóriában csak egy aktuális állapotot tart, ez az algoritmus már egy online keresé- 
si algoritmus! A legegyszerűbb formájában azonban nemigen használatos, mert az 
ágenst a lokális maximumokban bennrekedve hagyja, ahonnan nincs hová mennie. 
Ráadásul a véletlen újraindítást sem lehet használni, mert az ágens nem képes magát 
egy új állapotba áthelyezni. 

A véletlen újraindítások helyett, a környezet feltárására a véletlen vándorlást 
(random walk) használhatjuk. A véletlen vándorlás egyszerűen véletlen módon választ 
egy lehetséges cselekvést az aktuális állapotban. Elsőbbséget élvezhetnek az eddig még 
nem kipróbált cselekvések. Könnyű bebizonyítani, hogy a véletlen vándorlás valamikor 
megtalálja a célt, vagy feltárja a környezetet, feltéve, hogy a tér véges. "ő Másfelől a fo- 
lyamat igen lassú lehet. A 4.21. ábra egy olyan környezetet mutat, ahol a véletlen ván- 
dorlásnak exponenciálisan sok lépésre van szüksége a cél megtalálásához, mert minden 
lépésnél a visszafelé haladás kétszer olyan valószínű, mint az előrehaladás. A példa per- 
sze kitalált, azonban sok olyan valós állapottér létezik, melynek topológiája ilyenfajta 
sCsapdát" állít a véletlen vándorlás elé. 

Sokkal hatékonyabb megközelítés, ha a hegymászást nem véletlen működéssel, ha- 
nem memóriával látjuk el. Az alapötlet az, hogy a cél minden meglátogatott állapotból 
való elérési költségének egy H(5) . aktuális legjobb becslését" eltároljuk. H(s) a h(s) 
heurisztikus becslésből indul, és ahogy az ágens egyre több tapasztalatot gyűjt az álla- 
pottérben, értéke folyamatosan frissül. A 4.22. ábra egy egyszerű példát mutat egy- 
dimenziós állapottérre. Az (a)-ban úgy tűnik, az ágens egy lapos lokális minimumban, az 
árnyalt állapotban bennragadt. Ahelyeti hogy ott maradna, ahol volt, az ágensnek követnie 


15 A végtelen eset sokkal trükkösebb. A véletlen vándortás teljes egy- és kétdimenziós végtelen rácsban, 
de nem a háromdimenziósban! Ebben az utóbbi esetben annak a valószínűsége, hogy a vándorlás valamikorra 
a kiindulópontba visszatér, csak 03405 körüli. Egy általános bevezető: (Hughes, 1995). 
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aza sáÉ 


4.21. ábra. Egy környezet, amelyben a véletlen vándorlásnak exponenciálisan sok lépésre lesz szüksége, 
hogy a célt megtalálja 


kellene azt az utat, ami a szomszédos állapotok aktuális költségbecslései alapján a cél- 
hoz vezető legjobb útnak néz ki. Annak becsült költsége, hogy a célt az 5" szomszédon 
keresztül érjük el az s" elérésének költsége, valamint a cél elérésének becsült költsége 
az 57 állapotból, azaz c(s, a, s") -- HK(5"). A példában két cselekvés van, 1 -tH9és1-2 
becsült költségekkel, legcélszerűbbnek tűnik tehát jobbra menni, Most világos, hogy az 
árnyékolt állapot költségének becslésére a kettes érték túl optimista. Mivel a legjobb 
cselekvés költsége 1, és ez elvezet a céltól legalább kétlépésnyire lévő állapothoz, az 
árnyalt állapot legalább háromlépésnyire van a céltól. A H függvényt így ennek megfe- 
lelően frissíteni kell, ahogy a 4.22. (b) ábra mutatja. Ezt a folyamatot folytatva az ágens 
még kétszer mozdul el előre-hátra, a H-t frissítve és a lokális minimumot , laposítva", 
amíg jobbra nem tud elmenekülni. 

Ezt a sémát, aminek tanuló valós idejű A" (TRTA") a neve, a 4.23. ábrán látható 
ágens implementálja. Ez az ágens az ONLINE-MÉLYSÉGI-ÁGENS-hez hasonlóan az ered- 
mény táblázat felhasználásával környezetének egy térképét építi meg. Felfrissíti az 
éppen elhagyott állapot költségbecslését, és az aktuális költségbecslés szerint a ,lát- 
szólag legjobb" cselekvést választja. Fontos részlet, hogy az s állapotban még ki nem 
próbált cselekvésekről mindig azt tételezi fel, hogy a lehető legkisebb A(s) költséggel 


(a 1 (5) 1 (9) 1 (2) 1 (2) 1 (4) 1 (5) 1 
b) 1 (5) 1 (9) 1 0) 1 2) 1 (a) 1 (5) 1 
tj 1 (8) 1 (9) 1 (8) 1 0 1 (4) 1 (s) 1 





ációja egydimenziós állapottérben. Minden állapotot A(5)-sel, a cél elérésé- 
nek aktuális becslésével. és minden élt a lépéskökséggel címkéztünk. Az árnyalt állapot az ágens helyét 
jelöli meg. és a frissített értékeket minden iterációban bekarikáztuk. 
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közvetlenül a célhoz vezetnek. Ez a bizonytalanság melletti optimizmus (optimism 
under uncertainty) felbátorítja az ágenst, hogy új, feltehetően gyümölcsöző utakat 
tárjon fel. 

Egy TRTA" ágens garantáltan megtalálja a célt akármilyen véges, biztonságosan fel- 
tárható környezetben. Az A"-gal ellentétben azonban nem teljes a végtelen állapotterek- 
ben — vannak olyan esetek, amikor az ágenst reménytelenül félre lehet vezetni. Egy n 
állapotból álló környezetet legrosszabb esetben 0(n") lépésben tár fel, de sokszor jóval 
hatékonyabb ennél. A TRTA? ágens a cselekvéskiválasztási és a frissítési szabályokkal 
különböző módon definiálható online ágensek nagy családjának egy partikuláris tagja. 
Ezzel a családdal, melyet eredetileg sztochasztikus környezetekhez találtak ki, a 21. 
fejezetben foglalkozunk. 


Tanulás online keresés során 


Az online kereső ágens kezdeti tudatlansága több lehetőséget teremt a tanulásra. Elő- 
ször az ágens a környezetének , térképét" — pontosabban minden állapotban minden 
cselekvés kimenetelét - tanulja meg egyszerűen regisztrálva a tapasztalatát. (Jegyezzük 
meg, hogy a determinisztikus környezet feltételezése azt jelenti, hogy egy-egy cselek- 
vés esetén egy tapasztalás elég lesz.) Másodszor a lokálisan kereső ágensek lokális fris- 
sítési szabályok segítségével pontosabb értékbecslésekre tesznek szert minden állapot 
esetén, ahogy ez a TRTA"-nál történt. Látni fogjuk a 21. fejezetben, hogy ezek a fris- 
sítések előbb-utóbb minden állapot egzakt értékéhez fognak konvergálni, feltéve, hogy 
az ágens az állapotteret megfelelő módon tárja fel. Amikor az egzakt értékek már 


function TRTA"-ÁGENS(5") returns egy cselekvés 
input: s", egy érzékelés, amely az aktuális állapotot azonosítja 
static: eredmény, cselekvésekkel és állapotokkal indexelt táblázat, kezdetben üres 
H, költségbecslések táblázata állapotokkal indexelve 
5, a, az előbbi állapot és cselekvés, kezdetben nulla 


if CÉL-TESZT(S") then return stop 
if 5" egy új állapot (nincs H-ban) then H(51 — h(s) 
unless s nulla 

eredményla, 81 — s 

HI — min TRTA"-KÖLTSÉG (s, b, eredménytb, s), H) 

DECSELEKVÉSEK(5) 
a £— egy olyan b cselekvés a CSELEKVÉSEK(5")-ben, ami TRTA"-KöLTSÉG(s , b, eredménytb, 57), H)-tj 
minimalizálja 

ss 
return a 


function TRTA"-KÖLTSÉG(s. a. 5, H) returns egy költségbecslés 
íf 5 nem definiált then return A(s) 
else return cís, a, 57) 4 HIS 











4.23. ábra. A TRTA" ágens a cselekvéseit a környező állapotok értékei alapján választja ki, mely az ál- 
lapotokat az állapottérben mozogva folyamatosan frissíti 
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ismertek, az optimális döntések egyszerűen a legmagasabb értékű utódállapotba való 
átmenetekkel hozhatók meg — ilyenkor tehát a tiszta hegymászás az optimális stratégia. 

Ha elfogadta a javaslatunkat, hogy az ONLINE-MÉLYSÉGI-ÁGENS viselkedését kövesse 
nyomon a 4.18. ábrán bemutatott környezetben, észreveheti, hogy az ágens nem vala- 
mi lángész. Így például, miután már látta, hogy a Fel cselekvés az (1,1)-ből az (1,2)-be 
visz, még mindig fogalma sincs, hogy a Le cselekvés az (1. 19-be visz vissza, vagy hogy 
a Fel cselekvés a (2,19-ből a (2,2)-be, a (2,2)-ből a (2,3)-ba stb. visz. Általánosságban azt 
szeretnénk, ha az ágensünk megtanulná, hogy a Fel növeli az y koordinátát, hacsak egy 
fal nincs útban, a Le a koordinátát csökkenti stb. Hogy ez megtörténhessen, két dologra 
van szükség. Először az ilyen általános szabályokhoz szükségünk van egy formális és ma- 
nipulálható reprezentációra. Az információt egyelőre az állapotátmenet-függvény nevű 
fekete dobozba rejtettük. Ezzel a témával a III. rész foglalkozik. Másodszor szükségünk 
van egy algoritmusra, amely képes a megfelelő szabályokat az ágens által megtett konk- 
rét megfigyelésekből konstruálni. Ezzel pedig a 18. fejezet foglalkozik. 


4.6. ÖSSZEFOGLALÁS 


Ebben a fejezetben áttekintettük, hogyan lehet a keresési költséget heurisztikus függ- 
vények használatával csökkenteni. Megvizsgáltunk számos heurisztikus függvényt al- 
kalmazó algoritmust, és láttuk, hogy az optimalitásért a keresési költség viszonylatában 
drága árat kell fizetnünk. még akkor is, ha sikerült jó heurisztikus függvényt találnunk. 


. A legjobbat-először keresés (best-first search) egyszerűen egy olyan GRÁF- 
KERESÉS, ahol először (valamilyen mérték szerint) a legkisebb költségű, még ki nem 
fejtett csomópontokat fejtjük ki. A legjobbat-először algoritmusok tipikusan egy 
h(n) heurisztikus (heuristics) függvényt használnak, amely a cél költségét becsüli 
az n állapotból kiindulva. 

5 A mohó legjobbat-először keresés (greedy best-first search) a minimális h(n) 
értékű csomópontokat fejti ki. Nem optimális, azonban sokszor hatékony. 

. Az A? keresési algoritmus (A " search) a minimális f(n) — g(n) 4 h(n) értékű csomó- 
pontokat fejti ki. Az A" algoritmus teljes és optimális, feltéve, hogy garantálni tudjuk, 
hogy hín) elfogadható (a FA-KERESÉS számára) vagy konzisztens (a GRÁF-KERESÉS 
számára). Az A" algoritmus tárkomplexitása még mindig elfogadhatatlan. 

. A heurisztikus algoritmusok hatékonysága a heurisztikus függvény minőségétől függ. 
Jó heurisztikus függvények készíthetők néha például a probléma definíciójának re- 
laxálásával, a mintaadatbázis részproblémáihoz tartozó megoldási költségek előzetes 
kiszámításával vagy a problémaosztályon belül a tapasztalatból való tanulással. 

s Az RLEK (RBF$) és az EMA" (SMA?) robusztus, optimális keresési algorit- 
musok, amelyek korlátozott mennyiségű memóriát használnak. Ha elegendő idő áll 
rendelkezésre, olyan problémákat is megoldanak, melyeket az A" algoritmus nem 
képes megoldani, mert elfogy a memóriája. 

s A lokális keresési módszerek, mint például a hegymászó keresés (hill climbing) 
teljes állapotleírásokkal dolgoznak, de a memóriában csak csekély számú csomópon- 
tot tartanak. Több sztochasztikus algoritmust is kifejlesztettek, beleértve a szimulált 
lehűtést (simulated annealing), amely megfelelő hűtési karakterisztika esetén 
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optimális megoldással tér vissza. A folytonos térbeli problémákra számos lokális 
keresési algoritmus is használható. 

. A genetikus algoritmus (genetic algorithm) egy olyan sztochasztikus hegymászó 
keresés, ahol az állapotok nagy populációjával dolgozunk. Új állapotokat mutációval 
(mutation) és a populációbeli állapotpárokat összekombináló keresztezéssel (cross- 
over) generálunk. 

s  Felfedezési problémákról (exploration problems) akkor van szó, ha az ágensnek 
fogalma sincs környezete állapotairól és cselekvéseiről. Biztonságosan feltárható kör- 
nyezetek esetén az online kereső (online search) ágens felépítheti a környezetek tér- 
képét, és megtalálja a célt, ha az létezik. A heurisztikus becslések tapasztalat alapján 
történő frissítése hatékony módszer, az ágens lokális minimumokból való kimene- 
küléséhez. 


Irodalmi és történeti megjegyzések 


A heurisztikus információ alkalmazása a problémamegoldásban Simon és Newell egy 
korai írásában jelenik meg (Simon és Newell, 1958). A , heurisztikus keresés" frázis és 
a célhoz való távolságot becsülő heurisztikus függvény használata azonban valamivel 
későbbről származik (Newel) és Emst, 1965; Lin, 1965). Doran és Michie részletesen, 
kísérleti alapon tanulmányozták a heurisztikus keresési algoritmusok alkalmazását 
számos problémára, nagy hangsúlyt fektetve a 8-as és a 15-ös kirakójátékra (Doran 
és Michie, 1966). Habár Doran és Michie a heurisztikus keresésnél elméleti úthossz és 
nbehatolás" (az úthossz és az eddig vizsgált csomópontok számának aránya) elemzése- 
ket végzett, úgy tűnik, figyelmen kívül hagyták az aktuális úthossz nyújtotta informá- 
ciót. A heurisztikus keresésbe az aktuális úthosszt is beszámító A? algoritmust Hart, 
Nilsson és Raphael dolgozták ki (Hart és társai, 1968), néhány későbbi korrekcióval 
(Hart és társai, 1972). Az A" algoritmus optimális hatékonyságát Dechter és Pearl 
(Dechter és Pearl, 1985) mutatták ki. 

Az eredeti A" algoritmust ismertető cikk bevezette a heurisztikus függvények kon- 
Zisztenciájának feltételét. A heurisztikák monotonitási feltételét a konzisztenciafelté- 
telnek egy egyszerűbb feltétellel való kiváltására Pohi vezette be (Pohl, 1977), de Pearl 
megmutatta, hogy a két feltétel ekvivalens (Pearl, 1984). Az A?"-ot megelőző számos 
algoritmus használta a nyitott és a zárt listával ekvivalens fogalmakat. Ezek közé tarto- 
zik a szélességi. a mélységi és az egyenletes költségű keresés (Bellman, 1957; Dijkstra, 
1959). Különösképpen Bellman munkája mutatta meg az additív útköltség fontosságát 
az optimalizálási problémák egyszerűsítésében. 

Pohl elsőként tanulmányozta az A? algoritmus heurisztikahibája és időigénye közöt- 
ti összefüggést (Pohl, 1970; 1977). Annak bizonyítása, hogy az A" algoritmus lineáris 
időben fut, ha a heurisztikus függvény hibája egy állandó korlát alatt van, Pohl és 
Gaschnig cikkében található (Pohl, 1977; Gaschnig, 1979). Pearl ennek az eredmény- 
nek egy erősebb megfogalmazását adta meg, amely megengedte a hiba logaritmikus nö- 
vekedését (Pearl, 1984). A heurisztikus keresés hatékonyságát jellemző , effektív elága- 
zási tényező" mértéket Nilsson javasolta (Nilsson, 1971). 

Az A? algoritmusnak rengeteg változata létezik. Pohl javasolta a dinamikus súlyozá- 
si technikát, amelyben kiértékelő függvényként az A?-ban használatos egyszerű f(n) — 
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gín) 3 hín) helyett az aktuális úthossz és a heurisztikus függvény alábbi súlyozott össze- 
ge szerepel: f(n) - weg(n) -k wyh(n) (Pohi, 1973). Ez a módszer a keresés előrehalad- 
tával dinamikusan állítja a we és wy súlyokat. Kimutatható, hogy a Pohl-féle algoritmus 
€-elfogadható — azaz garantálja a megoldás megtalálását az optimális megoldáshoz 
képest I 4 £ tényezőn belül. Itt c az algoritmus egy bemeneti paramétere. Ugyanilyen 
tulajdonságú a AZ algoritmus (Pearl. 1984). amely a perem minden olyan csomópont- 
ját kiválaszthatja, amely a perembeli minimális f-költségű csomóponttól f-költségben 
(1 -- €)-os tényezőn belül van. A kiválasztást úgy lehet lebonyolítani, hogy ez a keresési 
költségeket minimalizálja. 

Az A" keresési algoritmus és más állapottérben kereső algoritmusok nagyban hason- 
lítanak az operációkutatás területén elterjedten alkalmazott elágazik-és-korlátoz 
(branch-and-bound) technikákhoz (Lawler és Wood, 1966). Az állapottérbeli keresés 
és az elágazik-és-korlátoz algoritmus közötti kapcsolatot részletesen vizsgálták Dana 
Nau, Laveen Kanal és Vipin Kumar (Kumar és Kanal, 1983: Nau és társai, 1984; Kumar 
és társai, 1988). Martelli és Montanari megmutatták a kapcsolatot a dinamikus prog- 
ramozás (lásd 17. fejezet) és bizonyos típusú állapottérbeli keresések között (Martelli és 
Montanari, 1978). Kumar és Kanal CDP - , összetett döntési folyamat" — néven meg- 
próbálta , egységes alapokra hozni" a heurisztikus keresést, a dinamikus programozást 
és az elágazik-és-korlátoz technikákat (Kumar és Kanal, 1988). 

Mivel az 1950-es évek végén, az 1960-as évek elején a számítógépek még csak leg- 
feljebb pár száz szónyi memóriával rendelkeztek, így a memóriakorlátozott keresés már 
a kezdeti időkben is intenzíven kutatott terület volt. Doran és Michie Graph Traverser 
programja (Doran és Michie, 1966) az egyik legkorábbi keresőprogram, a memóriakor- 
lát által megengedett mértékben legjobbat-először keresést hajt végre, majd kiválaszt 
egy operátort. Az IMA" algoritmus (Korf, 1985a, 1985b) volt az első széles körben 
alkalmazott optimális, memóriakorlátozott heurisztikus keresési algoritmus; ennek szá- 
mos változatát ki is dolgozták. Az IMA?" algoritmus hatékonyságának részletes elemzé- 
se és az algoritmus valós értékű heurisztikákkal! kapcsolatos nehézségeinek tárgyalása 
a (Patrick és társai, 1992)-ben jelent meg. 

Az RLEK (Korf, 1991, 1993) valójában egy kicsit bonyolultabb, mint a 4.5. ábrán 
bemutatott algoritmus, amely közelebb ál! a függetlenül kifejlesztett ún. iteratívan 
kifejtő (iteratíve expansion) vagy IK (IE) (Russell, 1992) algoritmushoz. Az RLEK 
felső és alsó korlátot használ. A két algoritmus viselkedése azonos elfogadható heu- 
riszitikák esetén. Az RLEK azonban a csomópontokat a legjobbat-először sorrendben 
akkor is kifejti, ha a heurisztika nem elfogadható. A legjobb alternatív út számontartá- 
sának gondolata korábban jelent meg Bratkónál (Bratko, 1986) az A" elegáns Prolog 
implementációjában és a DTA" algoritmusban (Russell és Wefald, 1991). Ez utóbbi a 
metaállapotterekkel és a metaszintű tanulással is foglalkozik. 

Az MA" algoritmus először Chakrabartinál jelent meg (Chakrabarti és társai, 1989). 
Az EMA? vagy Egyszerűsített MA" az MA? implementációs kísérleteiből született 
meg, mint az IK egy összehasonlító algoritmusa (Russell, 1992). Kaindl és Khorsand az 
EMA" felhasználásával megalkottak egy kétirányú keresési algoritmust, amely jelentő- 
sen gyorsabb, mint a korábbi algoritmusok (Kaindi és Khorsand, 1994). Korf és Zhang 
az oszd-meg-és-uralkodj megközelítést írják le (Korf és Zhang, 2000). Zhou és Hansen 
pedig bevezették a memóriakorlátozott A" gráfkeresést (Zhou és Hansen, 2002). Korf 
áttekintést ad a memóriakorlátozott keresési technikákról (Korf, 1995). 
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Held és Karp (Held és Karp, 1970) nagy hatású cikke a minimális-feszítőfa alkal- 
mazását (lásd 4.8. feladat) taglalja az utazó ügynök problémára, megmutatva, hogy a 
relaxált probléma vizsgálatával hogyan lehet elfogadható heurisztikákra jutni. 

Prieditis a Jack Mostow-val végzett korábbi kutatásokra építve (Mostow és Prieditis, 
1989) sikeresen automatizálta a probléma relaxálási folyamatát (Prieditis, 1993). A min- 
taadatbázisok használatát az elfogadható heurisztikák előállítására Gasser, valamint 
Culberson és Schaeffer kezdeményezték (Gasser, 1995; Culberson és Schaeffer, 1998). 
A diszjunkt mintaadatbázisokat Korf és Felner írják le (Korf és Felner, 2002). A heurisz- 
tikák valószínűség-alapú értelmezését Pearl és Hansson és Mayer mélyrehatóan vizs- 
gálták (Pearl, 1984; Hansson és Mayer, 1989). 

A heurisztikus keresési algoritmusok messze legátfogóbb irodalma Pearl Heuristics 
c. könyve (Pearl, 1984). Ez a könyv különösen jó áttekintést nyújt számos oldalhajtás- 
ról és az A" különféle változatairól, és azok tulajdonságainak szigorú bizonyításait ís 
tartalmazza. Kanal és Kumar elkészítették az alapvető és lényeges heurisztikus keresés- 
sel foglalkozó cikkek antológiáját (Kanal és Kumar, 1988). A keresési algoritmusokkal 
kapcsolatos új eredmények rendszeresen az Artificial Intelligence folyóiratban jelennek 
meg. 

A lokális keresési technikáknak a matematikában és a számítógépes tudományokban 
hosszú történetük van. Valóban, a Newton-Raphson-módszert (Newton, 1671; Raphson, 
1690) egy igen hatékony lokális keresési módszernek lehet tekinteni folytonos terekben, 
ahol a gradiens információ rendelkezésre áll. Az ilyen információt nem igénylő optima- 
lizáló algoritmusok klasszikus forrása Brent munkája (Brent, 1973). A nyalábkeresés, 
melyet lokális keresési algoritmusként mutattunk be, a beszédfelismerési célokra alkal- 
mazott dinamikus programozás korlátozott szélességű változataként indult a HARPY 
rendszerben (Lowerre, 1976). A megfelelő algoritmust részletesen Pearl vizsgálta (Pearl, 
1984, 5. fejezet). 

A lokális keresés témaköre a nagy kényszerkielégítési problémák, mint például az n- 
királynő (Minton és társai, 1992) és a logikai következtetés (Selman és társai, 1992) 
területén elért meglepően jó eredményeknek és a véletlenség, a többszörös egyidejű 
keresés és más javítás beépítésének köszönhetően az utóbbi években megélénkült. 
Az ilyen algoritmusok reneszánsza, melyeket Christos Papadimitriou , New Age" algorit- 
musoknak nevez, felkeltette az elméleti számítógép-tudományokkal foglalkozó kutatók 
érdeklődését ís (Koutsoupias és Papadimitriou, 1992; Aldous és Vazírani, 1994). Az ope- 
rációkutatás területén népszerűségnek örvend a hegymászó keresés egy változata, amit ta- 
bukeresési algoritmusnak (tabu search) hívnak (Glover, 1989; Glover és Laguna, 1997). 
Az emberi rövid távú memóriamodellre alapozva ez az algoritmus karbantartja az előbb 
meglátogatott k állapot tabulistáját, melyeket újra meglátogatni nem szabad. Ezáltal az 
algoritmus hatékonysága megnőtt a gráfkeresésben, és képes egyes lokális minimu- 
mokból kimenekülni. A hegymászó keresés másik hasznos javítása a STAGE algoritmus 
(Boyan és Moore, 1998). Az ötlet az, hogy használjuk a véletlen újraindítású hegymá- 
szó keresés révén nyert lokális maximumokat a tájfelszín általános alakjának felderítésé- 
re. Az algoritmus a lokális maximumokra sima felületet illeszt, és a globális maximumot 
analitikusan számítja ki. Ez lesz az új újraindítási pont. Az algoritmus a gyakorlatban 
működőképesnek bizonyult nehéz problémák esetén. Gomes (Gomes és társai, 1998) azt 
mutatta meg, hogy a futási idő eloszlása a szisztematikusan visszalépő algoritmusok ese- 
tén sokszor lassan lecsengő eloszlás (heavy-tail distribution), ami azt jelenti, hogy 
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a nagyon hosszú futási idők valószínűsége nagyobb, mint amit a normális eloszlás alap- 
ján jósolni lehetne. Ez megadja a véletlen újraindítási mechanizmus elméleti igazolását. 

A szimulált lehűtést először Kirkpatrick és szerzőtársai írták le (Kirkpatrick és társai, 
1983), akik az algoritmust közvetlenül a statisztikus fizika területén összetett rendszerek 
szimulálására használt Metropolis-algoritmustól kölcsönözték (Metropolis és társai, 
1953). A Metropolis-algoritmust állítólag Los Alamosban egy estély során találták ki. 
A szimulált lehűtés mára már különálló kutatási részterületet alkot, ahol évente több száz 
cikket publikálnak. 

Optimális megoldások keresése folytonos térben több terület alapfeladata, az opti- 
malizálás elméletet, az optimális szabályozás elméletet és a variációkalkulust (opti- 
mization theory, optimal control theory. calculus of variations) beleértve. Ezekről 
alkalmas (és gyakorlati) áttekintést Press (Press és társai, 2002) és Bishop (Bishop, 1995) 
adnak. A lineáris programozás (LP, linear programming) a számítógépek egyik első 
alkalmazása volt. A szimplex algoritmust (simplex-algorithm) (Wood és Dantzig, 1949; 
Dantzig, 1949) még mindig alkalmazzák annak ellenére, hogy a legrosszabb esetben ex- 
ponenciális komplexitású. Az LP egy gyakorlati polinomiális idejű algoritmusát Karmar- 
kar (Karmarkar, 1984) dolgozta ki. 

A genetikus algoritmusok fejlődésének fontos előfutára volt Sewall Wright munkája a 
fitness tájfelszín (fitness landscape) fogalmáról. Néhány statisztikus, Boxot (Box, 1957) 
és Friedmant (Friedman, 1959) is beleértve, az "50-es években használt már evolúciós 
technikákat optimalizálási problémákra, e megközelítés azonban csak akkor kezdett nép- 
szerűvé válni, amikor Rechenberg (Rechenberg, 1965; 1973) az evolúciós stratégiákat 
(evolution strategies) a szárnyprofilok optimalizálási problémáinak megoldásába be- 
vezette. Az 1960-as és 1970-es években John Holland (Holland, 1975) kiállt a genetikus 
algoritmusok mellett, azt tartva, hogy a genetikus algoritmusok hasznos eszköznek bizo- 
nyulnak és segítenek abban, hogy jobban megértsük a biológiai és egyéb adaptációt 
(Holland, 1995). A mesterséges élet (artificial life) mozgalom (Langton, 1995) ezt a 
gondolatot egy lépéssel tovább viszi, a genetikus algoritmusokkal létrehozott eredmé- 
nyeket nem problémamegoldások, hanem inkább szervezeteknek tekintve. Hinton és 
Nowlan (Hinton és Nowlan, 1987), valamint Ackley és Littman (Ackley és Littman, 
1991) munkája ezen a területen sokban hozzá járult, hogy a Baldwin-hatás következ- 
ményeit feltárjuk. Smith és Szathmáry (Smith és Szathmáry, 1990) munkáját mint az 
evolúció általános hátterét bemutató munkát ajánljuk. 

A legtöbb összehasonlítás a genetikus algoritmusok és más megközelítések (különös- 
képpen a hegymászó keresés) között azt találta, hogy a genetikus algoritmusok lassabban 
konvergálnak (O"Reilly és Oppacher, 1994; Mitchell és társai, 1996; Juels és Wattenberg, 
1996; Baluja, 1997). Az ilyen eredmények a GA közösségben nem nagyon népszerűek, 
azonban e közösségen belül a legutóbbi olyan kísérletek, hogy a populációalapú keresést 
a Bayes-tanulás egy formájaként értelmezzük (tásd 20. fejezet) talán segít, hogy e terület 
és a kritikusai közötti szakadék eltűnjön (Pelikan és társai, 1999). A GA hatékonyságára 
magyarázatot adhat a kvadratikus dinamikus rendszerek (guadratic dynamical sys- 
tems) elmélete (Rabani és társai, 1998) is, lásd például Lohn és társainak (ILohn és társai, 
2001) a GA antennatervezésre alkalmazott példáját és Larrafiaga (Larrafiaga és társai, 
1999) munkáját, ahol a GA-t az utazó ügynök problémára alkalmazták. 

A genetikus programozás (genetic programming) a genetikus algoritmusokkal kö- 
zeli rokonságban van. Az elsődleges különbség az, hogy a mutált és az összekombinált 
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reprezentációk nem bitfüzérek, hanem programok. A programokat kifejezésfák alakjá- 
ban reprezentáljuk. A kifejezéseket valamilyen standard nyelvből meríthetjük, mint 
például a Lispből, de lehetnek egy olyan nyelv elemei, melyet kifejezetten áramkörök, 
robotszabályozók stb. reprezentálására terveztünk. A keresztezés a részfák és nem a 
részfüzérek összeillesztését jelenti. A mutáció ezen formája garantálja, hogy az utódok 
iált kifejezések lesznek, ami nem biztos, hogy sikerülne, ha a programok ma- 
nipulációját ftizérszinten oldanánk meg. 

A genetikus programozást övező jelenlegi érdeklődést John Koza (Koza, 1992) mun- 
kája váltotta ki, a módszer azonban visszavezethető Friedbergnek (Friedberg, 1958) a 
gépi kóddal folytatott korai kísérleteibez és Fogelnek (Fogel és társai, 1996) a véges ál- 
lapotú automatákkal folytatott vizsgálataihoz. Mint a genetikus algoritmusok esetén itt 
is vita folyik a módszer hatékonyságát illetően. Koza (Koza és társai, 1999) sok olyan 
kísérletet ír le, amelyeket genetikus programozás felhasználásával az automatizált áram- 
körtervezés területén végzett. 

A genetikus algoritmusokról és a genetikus programozásról az Evolutionary Com- 
Putation és az IEEE Transactions on Evolutionary Computation folyóiratok írnak. Idevá- 
gó cikkeket még a Complex Systems, az Adaptive Behavior és az Artificial Life folyóirat- 
okban is találunk. A legfontosabb konferenciák az International Conference on Genetic 
Algorithms és a Conference on Genetic Programming, amelyek a közelmúltban Genetic 
and Evolutionary Computational Conference néven fuzionáltak. A terület jó áttekintését 
adják Melanie Mitchell és David Fogel írásai (Mitchell, 1996; Fogel, 2000). 

Az ismeretlen állapottereket feltáró algoritmusokkal évszázadok óta foglalkoztak. 
Egy labirintusban való mélységi keresés implementálható például úgy, hogy bal kezün- 
ket folyamatosan a falon tartjuk. A hurkokat elkerülhetjük, ha a keresztezéseket meg- 
jelöljük. A mélységi keresés kudarcba fullad, ha a cselekvések nem visszafordíthatók. 
Az Euler-gráfok (Eulerian graphs) (azaz olyan gráfok, ahol minden csomópontban 
ugyanannyi él megy be, mint ki) feltárásának általánosabb problémáját Hierholzer 
(Hierholzer, 1873) algoritmusa oldotta meg. A tetszőleges gráfok feltárásának első 
részletes algoritmikus vizsgálatát Deng és Papadimitriou (Deng és Papadimitriou, 1990) 
végezték, akik egy teljesen általános algoritmushoz jutattak el, azonban kimutatták, hogy 
az általános gráf feltárására nem adható korlátos kompetitív arány. Papadimitriou és 
Yannakakis (Papadimitriou és Yannakakis, 1991) azt a kérdést vizsgálták, hogy hogyan 
található meg a célhoz vezető út geometriai úttervező környezetben (ahol minden cselek- 
vés visszafordítható). Kimutatták, hogy négyzet alakú akadályok esetén kis kompetitív 
arány érhető el, az általános téglalap alakú akadályok esetén azonban korlátos arány 
nem érhető el (lásd 4.19. ábra). 

A TRTA" algoritmust, a valós idejű keresés (real-time search) vizsgálatának része- 
ként olyan környezetekben, ahol az ágensnek cselekednie kell egy rögzített idejű kere- 
sést követően (a kétjátékos játékokban egy megszokottabb helyzet) Korf (Korf, 1990) 
fejlesztette ki. A TRTA" valójában a megerősítéses tanulási algoritmus egy speciális 
esete sztochasztikus környezetekben (Barto és társai, 1995). Az optimizmus bizonyta- 
lanság melletti stratégiája — mindig a legközelebbi még nem meglátogatott állapotok 
felé tartani — olyan feltárási mintát eredményezhet, amely a nem informált esetben ke- 
vésbé hatékony, mint az egyszerű mélységi keresés (Koenig, 2000). Dasgupta (Dasgupta 
és társai, 1994) kimutatta, hogy egy kiegyensúlyozott fában a cél megkeresésére, amikor 
heurisztikus információ nincs, az online iteratívan mélyülő keresés optimálisan hatékony. 
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A TRTA! számos informált változatát is kifejlesztették, különböző módszereket alkal- 
mazva, a gráf már ismert részein belüli keresésre és frissítésre (Pemberton és Korf, 1992). 
Egyelőre még nem sikerült megérteni, hogy heurisztikus információ alkalmazása esetén 
hogyan kell a célokat optimális hatékonysággal megkeresni. 

A fejezet azért nem foglalkozott a párhuzamos keresési (parallel search) algorit- 
musokkal, mert ezek tárgyalásához a párhuzamos architektúrák terjedelmes ismerteté- 
sére lett volna szükség. A párhuzamos keresés egyre fontosabb témakörré válik mind 
az MI, mind pedig az elméleti számítógép-tudomány területén. Egy az MI idevágó iro- 
dalmába történő rövid bevezető Mahanti és Daniels cikkében (Mahanti és Daniels, 1993) 
található. 


Feladatok 


4.1. — Kövesse végig az A" működését a Lugasból Bukarestbe utazás problémájára al- 
kalmazva, légvonalban mért távolság heurisztikát alkalmazva. Azaz adja meg az 
algoritmus által megvizsgált csomópontok szekvenciáját az f-, g- és h-értékük- 
kel együtt. 


4.2. — A heurisztikus útalgoritmus (heuristic path algorithm) egy olyan legjobbat- 
először keresés, ahol a célfüggvény f(n) — (2 — w)e(n) t- wh(n). Milyen w érté- 
kekre garantálható az algoritmus optimalitása? (Feltételezheti, hogy A elfogadha- 
tó.) Milyen keresésről van szó, amikor w — 0? Amikor w — 1? És amikor w — 2? 


4.3. — Bizonyítsa be az alábbi állításokat: 
(a) A szélességi keresés az egyenletes költségű keresés egy speciális esete. 
(b) A szélességi keresés, a mélységi keresés és az egyenletes költségű keresés 
a legjobbat-először keresés speciális esetei. 
(c) Az egyenletes költségű keresés az A" keresés egy speciális esete. 


4.4. — Tervezzen meg egy olyan állapotteret, ahol az A" a GRÁF-KERESÉS felhasználá- 
igagys sával egy szuboptimális megoldással tér vissza egy elfogadható, de nem kon- 
zisztens Ah(n) függvény mellett. 


4.5. — A 138-139. oldalon láttuk, hogy a légvonalban mért távolságheurisztika a mohó 
legjobbat-először keresést félrevezeti, amikor Iasiról Fogarasra szerettünk volna 
eljutni. Az ellenkező problémára azonban, vagyis amikor Fogarasról [asira 
szeretnénk eljutni, a heurisztika tökéletes. Léteznek olyan problémák, amelyek 
esetében a heurisztika mindkét irányban félrevezet bennünket? 


4.6. Találjon ki a 8-as kirakójátékra olyan heurisztikus függvényt, ami néha túl- 
becsül, és mutassa meg. hogy egy konkrét probléma esetén ez hogyan vezethet 
szuboptimális megoldáshoz (használhat számítógépet, ha ez segít). Bizonyítsa 
be, hogy ha h soha nem becsül túl c-nél jobban, az A? algoritmus, H-t felhasz- 
nálva, olyan megoldással tér vissza, melynek költsége az optimális megoldás 
költségét legfeljebb c-vel haladja meg. 


180 


4.7. 





4.10. 


4.11. 


4.12. 
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Bizonyítsa be, hogy ha a heurisztikus függvény konzisztens, akkor elfogadható. 
Szerkesszen egy elfogadható heurisztikus függvényt, amely nem konzisztens. 


Az utazó ügynök problémát (TSP) meg lehet oldani a minimális feszítő fa (MFF) 

heurisztika alkalmazásával, ami feltételezve, hogy már egy részútvonalat megter- 

veztünk, megbecsüli az útvonal befejezésének költségét. A városok egy halma- 
zának MFF-költsége az összes várost összekötő fák minimális élköltségösszege. 

(a) Mutassa meg, hogy ez a heurisztikus függvény hogyan származtatható a 
TSP relaxált változatából! 

(b) Mutassa meg, hogy az MFF-heurisztika dominálja a légvonalban mért 
távolságheurisztikát! 

(c) Írjon egy problémagenerátort a TSP-problémára, amely olyan probléma- 
egyedeket generál, amelyben a városokat az egységnégyzeten belüli vélet- 
len módon generált pontok reprezentálják! 

(d) Keressen hatékony módszert az irodalomban az MFF megszerkesztésére, 
és használja azt egy elfogadható keresési algoritmussal a TSP-probléma 
egyedeinek a megoldására! 


A 150. oldalon a 8-as kirakójáték olyan relaxációját definiáltuk, ahol a lapka az 
A mezőről a B mezőre mozdulhat el, ha B üres. E probléma egzakt megoldása 
az ún. Gaschnig-heurisztikát (Gaschnig"s heuristics) definiálja (Gaschnig, 
1979). Magyarázza meg, hogy miért lesz a Gaschnig-heurisztika legalább olyan 
pontos, mint /1 (a rossz helyen lévő lapkák száma), és mutasson olyan eseteket, 
amikor mind hr-nél mind h2-nél pontosabb (Manhattan-távolság). Tud ajánlani 
a Gaschnig-heurisztikára egy hatékony számítási módszert? 


A 8-as kirakójátékra adtunk két egyszerű heurisztikus függvényt: a Manhattan- 
távolságot és a rossz helyen lévő lapkák számát. Az irodalomban számos heurisz- 
tikáról azt állítják, hogy azok mindkét előbbinél jobbak. Lásd például Nilsson 
(Nilsson, 1971), Mostow (Mostow és Prieditis, 1989) és Hansson (Hansson és 
társai, 1992) cikkét. Ellenőrizze ezeket az állításokat a heurisztikák implementá- 
lásával és a futási eredmények összevetésével. 


Nevezze meg azokat az algoritmusokat, amelyek az alábbi speciális esetekből 

származnak: 

(a) Lokális nyaláb keresés k — 1 mellett. 

(b) Lokális nyaláb keresés egy kezdeti állapottal és korlátlan számú vissza- 
tartott állapottal. 

(c) Szimulált lehűtés. ha 7 — 0 minden időpillanatra (és kihagyva a leállási 
tesztet). 

(d) Genetikus algoritmus N — 1 nagyságú populációval. 


Néha egy adott problémához nem létezik jó kiértékelő függvény, azonban léte- 
zik jó összehasonlítási módszer: vagyis el lehet dönteni, hogy egy csomópont 
egy másik csomópontnál jobb-e anélkül, hogy valamilyen számértéket rendel- 
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4.13. 


4.14. 


4.15. 


4.16. 


4.17. 


nénk hozzájuk. Mutassa meg, hogy ez elégséges a legjobbat-először (best-first) 
keresés végrehajtásához. Létezik-e ilyen analógia az A" esetére is? 


Hozza kapcsolatba a TRTA" időkomplexitását az algoritmus tárkomplexitásával. 


Tegyük fel, hogy egy ágens a 4.18. ábrán látható 3 x 3 labirintus környezetben 
tartózkodik. Az ágens tudja, hogy a kezdeti pozíciója az (1,1), a cél a (3.3)-n 
van, és hogy a négy Fel, Le, Balra, Jobbra cselekvésnek a szokásos hatása van, 
hacsak egy fal nincs útban. Az ágens nem tudja a belső falak helyét. Minden 
egyes állapotban az ágens a legális cselekvések halmazát képes érzékelni. Azt is 
meg tudja mondani, hogy az állapotot meglátogatta-e már korábban, vagy pedig 
egy új állapotban van. 

(a) Magyarázza meg, hogy ezt az online keresési problémát hogyan lehet 
offline keresésnek tekinteni egy olyan hiedelmi állapotérben, ahol a kezdeti 
hiedelmi állapot a környezet minden lehetséges konfigurációját tartalmaz- 
za. Milyen nagy a kezdeti hiedelmi állapot? Milyen nagy a hiedelmi álla- 
pottér? 

(b) Hányféle különböző megfigyelés lehetséges a kezdeti állapotban? 

(c) Írja le e probléma esetén az eshetőségi terv néhány első ágát. Milyen nagy 
(nagyjából) az egész terv? 

Jegyezze meg, hogy ez az eshetőségi terv az adott leírást kielégítő minden lehet- 

séges környezet számára megoldás. A keresés és a végrehajtás átlapolódása tehát 

egy ismeretlen környezetben nem szigorúan szükséges. 


Ebben a feladatban a 4.8. feladatban leírt típusú TSP-probléma megoldására 1o- 

kális keresési módszerekkel kísérletezünk. 

(a) Tervezze meg a TSP megoldására a hegymászó keresést. Az eredményeket 
az MFF-heurisztikával (4.8. feladat) dolgozó A? algoritmus optimális meg- 
oldásaival hasonlítsa össze. 

(b) Tervezzen meg a TSP megoldására egy genetikus algoritmust. Az eredmé- 
nyeket más megközelítésekkel hasonlítsa össze. Esetleg szüksége lehet a 
(Larrafiaga és társai, 1999) cikk egyes reprezentációs javaslataira. 


Generáljon sok 8-as kirakójáték- és 8-királynő feladat-példányt, és oldja meg 
ezeket (ha lehetséges) a hegymászó kereséssel (legmeredekebb emelkedő és az 
első-választás változatok), véletlen újraindítású hegymászó kereséssel és szimu- 
lált lehűtéssel. Mérje meg a megoldási költségeket, és százalékosan adja meg 
a megoldások arányát. Mindezeket ábrázolja egy grafikonon az optimális költ- 
ség függvényében. Fűzzön kommentárt az eredményekhez. 


Ebben a feladatban a hegymászó keresést a robotnavigáció kontextusában fog- 


Hint juk vizsgálni, példának használva a 3.22. ábrán látható környezetet. 


(a) Ismételten oldja meg a 3.16. feladatot a hegymászó keresés segítségével. 
Le fog-e ragadni az ágens valamikor egy lokális maximumban? Leherséges, 
hogy leragadjon az ágens konvex akadályok esetén? 

(b) Hozzon létre olyan konkáv környezetet, amiben az ágens leragad! 
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(c) Módosítsa úgy a hegymászó algoritmust, hogy az az I mélységű keresés 
helyett k mélységű keresést használjon annak eldöntésére, hogy a követke- 
ző lépésben hová menjen. Meg kell keresnie a legjobb k lépéses utat, e 
mentén egy lépést megtenni, majd az eljárást megismételni. 

(d) Létezik k-nak olyan értéke, ami mellett az új algoritmus garantáltan elkerü- 
Ji a lokális maximumokat? 

(e) Magyarázza meg, hogy ebben az esetben a TRTA" algoritmus hogyan teszi 
lehetővé az ágens számára, hogy a lokális minimumokból kimeneküljön. 


4.18.  Hasonlítsa össze az A" és a RLEK keresés hatékonyságát véletlen módon gene- 

VHFTÉ rált problémahalmazokon a 8-as kirakójáték (Manhattan-i távolsággal) és a TSP- 
(MFH-vel, lásd 4.8. feladat) problémakörben. Értelmezze az eredményeket. Mi 
történik az RLEK hatékonyságával, ha a 8-as kirakójáték problémakörben a 
heurisztika értékeihez egy kis véletlen számot adunk hozzá? 


5. KÉNYSZERKIELÉGÍTÉSI PROBLÉMÁK 


Ebben a fejezetben megmutatjuk azt, hogy ha az állapotokat nem egyszerűen kis fekete 
dobozoknak tekintjük, akkor új hatékony keresési módszerek egész sorához jutunk, va- 
lamint jobban megértjük a probléma struktúráját és komplexitását. 


A 3. és a 4. fejezetben azt az elképzelést jártuk körbe, hogy a problémákat állapottérbe- 
li kereséssel lehet megoldani. A tárgyterületre jellemző heurisztikák segítségével érté- 
kelhetjük ezeket az állapotokat és ellenőrizhetjük, hogy nem járunk-e célállapotban. 
A keresési algoritmus szempontjából azonban mindegyik állapot egy megkülönböztetés 
nélküli belső struktúrájú fekete doboz (black box). Az állapotokat egy tetszőleges adat- 
struktúra reprezentálja, amelyhez a problémára jellemző rutinokkal lehet hozzáférni: az 
állapotátmenet- és a heurisztikafüggvénnyel, valamint a célállapotteszttel. 

A fejezetben a kényszerkielégítési problémákkal (constraint satisfication prob- 
lems) foglalkozunk, amikor az állapotok és a célteszt illeszkedik egy szabályos, struk- 
turált és elég egyszerű reprezentációhoz (lásd 5.1. alfejezet). Az állapotstruktúra 
segítségével keresési algoritmusokat lehet definiálni, és nem problémaspecifikus, ha- 
nem általános célú heurisztikák használatával nagy problémák megoldása is lehetővé 
válik (lásd 5.2. és 5.3. alfejezet). Talán a legfontosabb azonban az, hogy a célteszt 
szabályos reprezentációja feltárja magának a problémának a struktúráját (lásd 5.4. 
alfejezet). Ez pedig módszereket ad a kezünkbe a probléma dekompozíciójára, és lehe- 
tővé teszi, hogy megértsük a probléma struktúrája és a megoldás nehézsége közötti 
szoros kapcsolatot. 


5.1. KÉNYSZERKIELÉGÍTÉSI PROBLÉMÁK 


A kényszerkielégítési problémák (angol rövidítéssel CSP) formális definícióját változók 
(variables), XI, X, ..., Xs és kényszerek (constraints), Ci, Co, --s Cm halmazaival 
adhatjuk meg. Minden egyes X; változó esetén adott a lehetséges értékek egy nem-üres D; 
tartománya. Minden egyes C; kényszer a változók valamely részhaimazára vonatkozik, 
és meghatározza a részhalmaz megengedett értékkombinációit. Egy problémaállapotot 
az definiál, hogy vagy néhány, vagy mindegyik változóhoz értékeket rendelünk hoz- 
zá (X; — V;, X; - Vh .). Egy hozzárendelést konzisztensnek (vagy megengedettnek) 
nevezünk, ha egyetlen kényszert sem sért meg. Teljes az a hozzárendelés, amelyben 
mindegyik változó szerepel, és egy teljes hozzárendelés a kényszerkielégítési problémá- 
nak megoldása, ha mindegyik kényszert kielégíti. Néhány kényszerkielégítési probléma 
azt is igényli, hogy a megoldás egy célfüggvényt maximalizáljon. 

Mit is jelent mindez? Tegyük fel, hogy Romániába beleunva Ausztrália térképét 
tanulmányozzuk, és a térképen az 5.1. (a) ábrán feltüntetett államokat és területeket 
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látjuk, feladatunk pedig az, hogy vörössel, zölddel és kékkel minden egyes részt színez- 
zünk ki úgy, hogy a szomszédos részeknek ne legyen azonos a színe. Ahhoz, hogy ezt 
kényszetkielégítési problémaként fogalmazhassuk meg, változókat kell bevezetnünk az 
egyes részekhez: NyA, ÉT, 0, ÚDW, V, DA és T. Mindegyik változó tartománya a (vö- 
rös, zöld, kék) halmaz. Kényszerek írják elő, hogy a szomszédos részek különböző 
színűek legyenek, például NyA és ÉT esetén a megengedhető kombinációk az alábbi pá- 
rok lehetnek: 


((vörös, zöld), (vörös, kék), (zöld, vörös), (zöld, kék), (kék, vi 





ös), (kék, zöld)) 


(A kényszert tömörebben is ki lehet fejezni a NyA z ÉT egyenlőtlenséggel, feltéve 
persze, hogy a kényszermegoldó algoritmus valamiképpen ki tudja értékelni az ilyen 
kifejezéseket.) Sok lehetséges megoldás adódik, mint például az 


(NyA — vörös, ÉT — zöld, 0 — vörös, ÚDW — zöld, V — vörös, DA — kék, T — vörös) 


(Gyakran hasznos lehet, ha felrajzoljuk a kényszerkielégítési probléma kényszergráfját 
(constraint graph), amint az az 5.1. (b) ábrán is látható. A gráf csomópontjai a prob- 
léma változóinak, élei pedig a kényszereknek felelnek meg. 

Sok előnnyel járhat, ha egy problémát kényszerkielégítési problémaként tekintünk. 
Az állapotok reprezentációja miatt a kényszerkielégítési problémák egy standard min- 
tára illeszkednek (ez a minta a hozzárendelt értékekkel rendelkező változók halmaza), 
az állapotátmenet-függvényt és a célállapottesztet pedig az összes kényszerkielégítési 
problémára érvényes általános módon meg lehet írni. Sőt létrehozhatók hatékony, álta- 
lános heurisztikák minden kiegészítő, tárgyterület-specifikus szakértelem nélkül. Végül 
pedig a kényszergráf struktúrájának segítségével lerövidíthető a megoldási folyamat, és 
ez néhány esetben exponenciálisan csökkenti a probléma komplexitását. A kényszer- 
kielégítési probléma reprezentációja a legelső (és a legegyszerűbb) a könyv menete 
során bemutatott reprezentációs sémák sorában. 


Nyugat-Ausztrália BŐ íg 


Tasmania hw 6 


(a) (b) 
5.1. ábra. (a) Ausztrália államai és területei. A térkép kiszínezése tekinthető kényszerkielégítési problé- 
mának is. A cél az, hogy minden egyes részhez olyan színt találjunk, amely nem azonos egy szomszédos 
rész színével sem. (b) A térképszínezési probléma kényszergráfként reprezentálva. 
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Könnyű észrevenni, hogy egy kényszerkielégítési problémára adható egy inkre- 
mentális megfogalmazás (incremental formulation), amely a kényszerkielégítési 
problémát szabályos keresési problémaként tekinti: 


s Kiinduló állapot (initial state): az üres hozzárendelés (), ahol egyik változónak 
sincs értéke. 

" Állapotátmenet-függvény (successor function): bármelyik hozzárendelés nélküli 
változó értéket kaphat, amennyiben ez nem ütközik a korábbi értékadásokkal. 

s Célteszt (goal test): az aktuális hozzárendelés teljes. 

s Az út költsége (path cost): egy konstans költség (például 1) mindegyik lépésre. 


Mindegyik megoldásnak egy teljes hozzárendelésnek kell lennie, tehát n változó esetén 
az n-edik mélységi szinten jelenik meg. A keresési fa pedig csak n mélységű. Emiatt 
a korlátkielégítési problémák esetén a mélységi keresési algoritmusok népszerűek (lásd 
5.2. alfejezet). Az is igaz, hogy a megoldáshoz vezető út nem lényeges. Ezért használ- 
ható a teljes állapotleírás (complete-state formulation) is, amelyben minden egyes 
állapot egy teljes változó-hozzárendelés, akár kielégíti a kényszereket, akár nem. Ebben 
a felírásban a lokális keresési eljárások is basználhatók. 

A kényszerkielégítési problémák legegyszerűbb esetében a változók diszkrétek és 
véges tartományúak. A térképszínezési problémák is ehhez az esethez tartoznak. A 3. 
fejezetben bemutatott 8-királynő problémát is felfoghatjuk véges tartományú kény- 
szerkielégítési problémaként, ahol a 01, ..., Og változók a királynők I, ..., 8 oszlopok- 
ban betöltött pozícióit jelölik, és mindegyik változó tartománya (1, 2, 3, 4, 5, 6, 7, 8]. 
Amennyiben maximum d a kényszerkielégítési probléma bármely változójához tarto- 
26 tartomány mérete, akkor a lehetséges teljes hozzárendelések száma 0(d"), azaz a 
változók számának exponenciális függvénye. A véges tartományú kényszerkielégítési 
problémák közé tartoznak a Boole-problémák is, ahol a változók értéke vagy igaz, vagy 
hamis. A Boole kényszerkielégítési problémák speciális esetként tartalmaznak néhány 
NP-teljes problémát, például a 35AT-ot (lásd 7. fejezet). Legrosszabb esetben tehát 
nem lehetséges, hogy exponenciálisnál kevesebb idő alatt meg tudunk oldani egy véges 
tartományú kényszerkielégítési problémát. A legtöbb gyakorlati alkalmazásban azon- 
ban az általános célú CSP algoritmusok megbirkóznak a 3. fejezetben bemutatott álta- 
lános célú keresési algoritmusokkal megoldhatóknál röbb nagyságrenddel nagyobb 
problémákkal is. 

A diszkrét változók lehetnek végtelen tartományúak is: például ilyen az egész szá- 
mok halmaza vagy a füzérek halmaza. Például amikor egy építkezési munka naptárát 
ütemezzük, minden feladat kezdési ideje egy változó. amelyeknek lehetséges értékei az 
aktuális dátum napjait megadó egész számok. Végtelen tartományok esetén már nem 
lehet a kényszereket a megengedett értékkombinációk felsorolásával leírni. Ehelyett 
egy kényszernyelvet (constraint language) kell használni. Például ha Munkay öt napig 
tart, és meg kell előznie Munkaz3-t, akkor kényszernyelvként az algebrai egyenlőtlenségek 
nyelvére van szükségünk, mint például KezdMunkaj 4- 5 £ KezdMunkaz. Továbbá az 
ilyen kényszereket többé már nem lehet megoldani az összes lehetséges hozzárendelés 
felsorolásával, mert végtelen sok van belőlük. leges megoldó algoritmusok (me- 
lyekre itt nem térünk ki) léteznek egész értékű változók lineáris kényszereire, azaz olyan 
kényszerekre, mint a fenti, ahol mindegyik változó csak lineáris műveletekben jelenik 
meg. Megmutatható, hogy nem létezhet algoritmus egész értékű változók általános 
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nemlineáris kényszereinek megoldására. Néhány esetben az egész értékű kényszer- 
problémák egyszerűen azzal visszavezethetők véges tartományúakra, hogy korlátoz- 
zuk az összes változó értékeit. Egy ütemezési problémában például egy felső korlátot 
szabhatunk az összes ütemezendő munka teljes hosszára. 

A folytonos tartományú kényszerkielégítési problémák elég gyakoriak a valós alkal- 
mazásokban, és az operációkutatáson belül is tanulmányozták ezeket a problémákat. Pél- 
dául a Hubble űrteleszkóp kísérleteinek ütemezése a megfigyelések nagyon pontos idő- 
zítését igényli, a megfigyelések és a manőverek kezdeti és befejezési időpontjai folytonos 
értékű változók és csillagászati, precedencia-, valamint teljesítménykényszerek sokasága 
vonatkozik rájuk. A folytonos tartományú kényszerkielégítési problémák legismertebb 
válfaja a lineáris programozási problémák csoportja, ahol a kényszerek konvex tarto- 
mányit alkotó lineáris egyenlőtlenségek. A lineáris programozási feladatokat meg lehet 
oldani a változók száma szerinti polinomiális időben. Más típusú kényszerekkel és cél- 
függvényekkel rendelkező problémákat is tanulmányoztak, például ilyennel foglalkozik a 
kvadratikus programozás, a másodrendű kónikus programozás és hasonló társaik. 

Azon túl, hogy megvizsgálhatjuk a kényszerkielégítési problémákban megjelenő vál- 
tozók típusát, hasznos lehet a kényszerfajtákat is tanulmányozni. A legegyszerűbb fajta 
az unáris kényszer (unary constraint), amely egy változó értékére tesz megkötést. 
Elképzelhető például, hogy a délausztrálok élénken tiltakoznak a zöld szín ellen. A hi- 
vatkozott változó tartományának előfeldolgozásával mindegyik unáris kényszer kiküsző- 
bölhető: ki kell venni a kényszert sértő összes értéket. A bináris kényszer (binary 
constraint) két változót köt össze. Például a DA z- ÚDW egy bináris kényszer. A csak 
bináris kényszerekkel rendelkező kényszerkielégítési problémát binárisnak nevezzük, 
amit az 5.1. (b) ábrán láthatóhoz hasonló kényszergráffal lehet reprezentálni. 

A magasabb rendű kényszerek három vagy több változóra vonatkoznak. Ennek egy 
ismerős példája a betűrejtvény (lásd 5.2. (a) ábra). A betűrejtvényben általában mind- 
egyik betű különböző számot jelöl. Ez a megkötés az 5.2. (a) ábra betűrejtvénye esetén 
például a hatváltozós MindKük F,T,U,W.R,O) kényszerrel adható meg. Egy másik meg- 
oldás lehet, ha a megkötést bináris kényszerek (mint például F c T) gyűjteményével 
adjuk meg. A rejtvény négy oszlopában az összeadáskényszerek több változót is tartal- 
mazhatnak, amelyek a következőképpen írhatók fel: 


040-R410-XI 
X0.4W4W-U-G10-X; 
KX4AT4T-OT1O-XZ 
XzzF 


ahol XI, X2 és X3 a következő oszlopba átvitt számjegyet (0 vagy 1) reprezentáló segéd- 
változók (auxiliary variables). A magasabb rendű kényszereket egy kényszerhiper- 
gráffal (constraint hyprergraph) lehet ábrázolni, amelynek egy példája az 5.2. (b) 
ábrán látható. Az éles szemű olvasónak feltűnhet, hogy a MindKül kényszer felbontha- 
tó bináris kényszerekre: F — T, F  U stb. Az 5.11. feladat éppen annak bizonyítását kéri, 
hogy elegendő segédváltozó bevezetésével mindegyik magasabb rendű véges tartományú 
kényszer átírható bináris kényszerek halmazává. Ebből kiindulva ebben a fejezetben 
csak bináris kényszerekkel foglalkozunk. 

Az eddig említett kényszerek mind abszolút kényszerek voltak: egy kényszer meg- 
szegése kizár egy megoldásjelöltet. A valós alkalmazások során azonban sok kényszer- 
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(a) 4 
5.2. ábra, (a) Egy betűrejtvény. Mindegyik betű különböző számjegyet jelöl, a rejtvény célja olyan számje- 
gyeket helyettesíteni a betűk helyére, amelyekkel a kiadódó összeg aritmetikailag helyes lesz (azzal a külön 
megkötéssel, hogy nem kezdő nullák nem megengedettek). (b) A betűrejtvény kényszerhípergráfja a MindKül 
kényszer és az oszloponkénti összeadási kényszerek feltüntetésével. A kényszereket négyzet alakú dobozok 
jelölik. Minden doboz azzal a változóval van összekötve, amelyre a doboz által jelzett kényszer vonatkozik. 


kielégítési probléma tartalmaz preferenciakényszereket, melyek jelzik, hogy mely meg- 
oldások preferáltak. Egy egyetemi órarend meghatározásakor például X professzor talán 
inkább reggel tanítana, míg Y professzor a délutáni órákat részesítené előnyben. Egy 
olyan órarend, amely szerint X professzornak délután kettőkor kellene tanítania, még 
megoldás lenne (persze csak ha X professzor éppenséggel nem a tanszékvezető), de ez 
nem lenne optimális megoldás. A preferenciakényszerek gyakran az egyedi változó-hoz- 
zárendelések költségeként ábrázolhatók: például ha X professzor egy délutáni időpontot 
kap, az két pontot ront az általános célfüggvényen, míg a reggeli óraidőpont csak egy 
pontba kerül Így megfogalmazva a preferenciákkal kiegészített kényszerkielégítési 
problémák (útvonalalapú vagy lokális) optimalizációs keresési módszerekkel megoldha- 
tók. Az ilyen kényszerkielégítési problémákkal a fejezetben többet nem foglalkozunk, de 
az irodalomjegyzékben megadunk néhány kiindulási pontként használható hivatkozást. 


5.2. A VISSZALÉPÉSES KERESÉS ALKALMAZÁSA 
KÉNYSZERKIELÉGÍTÉSI PROBLÉMÁKRA 


Az előző alfejezetben keresési problémaként fogalmaztuk meg a kényszerkielégítési 
problémákat. Ezt a megfogalmazást felhasználva a 3. és a 4. fejezetben bemutatott bár- 
mely keresési eljárással megoldhatók a kényszerkielégítési problémák. Tegyük fel, 
hogy alkalmazzuk a szélességi keresést az előző fejezetben megadott általános €CSP- 
megfogalmazásra. Hamarosan valami szörnyűség tűnik fel: a fa tetején az elágazási té- 
nyező nd, mert a d érték bármelyike hozzárendelhető az n változó bármelyikéhez. A kö- 
vetkező szinten az elágazási tényező (n — 1)d és így tovább az n szint során. Egy n! : d" 
levelű fát építünk felt, noha csupán d" lehetséges teljes hozzárendelés van! 

Látszólag racionális, valójában naiv problémamegfogalmazásunk elhanyagolta az összes 
kényszerkielégítési probléma egy döntő közös tulajdonságát: a kommutativitást (conmu- 
tativity). Egy probléma akkor kommutatív, ha a végeredmény szempontjából közömbös, 
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hogy cselekvések egy adott sorozatát milyen sorrendben alkalmazzuk. Ilyenek a kényszer- 
kielégítési problémák is, mert a változók hozzárendelése során a sorrendtől függetlenül 
ugyanazt a parciális hozzárendelést kapjuk. Ezért tehát mindegyik kényszerkietégítési prob- 
lémamegoldó a következő állapot generálásakor a keresési fa minden csomópontjában 
csak egyetlen változó lehetséges hozzárendeléseit veszi tekintetbe. Az ausztráliai térképszí- 
nezési probléma keresési fájának gyökércsomópontjában választhatunk a DA — vörös, 
a DA — zöld és a DA — kék közül, de sohasem merül fel választási lehetőségként a DA — 
vörös vagy az NyA — kék. A levelek száma ezzel a megszorítással már a remélt d". 





function VISSZALEPÉSÉS-KERESÉS(csp) returns egy megoldás vagy kudarc 
return REKURZÍV-VISSZALÉPÉSES(( ), csp) 


function. REKURZÍV-VISSZALÉPÉSES([ozzárendelések, csp) returns egy megoldás vagy kudarc 
if hozzárendelések teljes then return kozzárendelések 
var §— HOZZÁRENDELETLEN-VÁLTOZÓ-KIVÁLASZTÁSA( VÁLTOZÓK csp), hozzárendetések, csp) 
for each érték in TARTOMÁNY-ÉRTÉKEK-SORRENDEZÉSE(var, hozzárendelések, csp) do 
áf érték konzisztens a hozzárendelések-kel KÉNYSZEREK(csp) szerint then 
hozzáad (var — érték) hozzárendelések-hez 
eredmény — REKURZÍV-VISSZALÉPÉSES(hozzárendelések, csp) 
if eredmény se meghiúsulás then return eredmény 
kivesz (var — érték) hozzárendelések-ből 
return kudarc 











5.3. ábra. Egy egyszerű visszalépéses keresési algoritmus kényszerkielégítési problémákhoz. Az algo- 
ritmus a 3. fejezet rekurzív mélységi keresőjén alapul. A HOZZÁRENDELETLEN- VÁLTOZÓ-KIVÁLASZTÁSA 
És a TARTOMÁNY-ÉRTÉKEK-SORRENDEZÉSE függvények használhatók a szövegben bemutatott általános 
célú heurisztikák megvalósítására. 
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54. ábra. Részlet a keresési fából, amelyet az egyszerű visszalépéses keresés generált az 5.1. ábrán be- 
mutatott térképszínezési problémához 


A visszalépéses keresés (backtracking search) kifejezést olyan mélységi keresé- 
sekre használjuk, melyek egyszerre csak egy változóhoz rendelnek értéket, és vissza- 
lépnek, ha már nincs megengedett hozzárendelési lehetőség. Az algoritmus az 5.3. 
ábrán látható. Vegyük észre, hogy az algoritmus lényegében a 115-116. oldalon leírt 
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egyenkénti módszert használja az inkrementális következő állapot generálásra. Továb- 
bá a következő állapot generálásakor kifejti az aktuális állapotot, nem pedig egyszerűen 
másolja. A kényszerkielégítési problémák szokásos reprezentációja miatt nincs szükség 
a VISSZALÉPÉSES-KERESÉS algoritmus kiegészítésére tárgyterület-specifikus kezdeti álla- 
pottal, állapotátmenet-függvénnyel vagy célteszttel. Az 5.4. ábrán látható egy részlet az 
ausztráliai színezési problémához generált keresési fából (a változó-hozzárendelések 
sorrendje NyA, ÉT, 0), ...). 

Az egyszerű visszalépéses keresés a 3. fejezet terminológiája szerint nem informált al- 
goritmus, tehát nem is várjuk el, hogy nagy problémák esetén is hatékony legyen. Az 5.5. 
ábra első oszlopában bemutatott néhány eredmény megerősíti várakozásainkat. 














A probléma [ Visszalépéses ] BT--MRV [ Előrenéző ellenőrzés [/ FCHMRV  Min-Konfliktusok 
USA (3.1000K)  ] 62. 1000K) 2K 60 64 
n-királynő. ] (2.40000K) ] 13500K ) — (240000K) 8I7K 4K 

Zebra 3859K IK 35K 05K 2K 

Véletlen (1.) 415K 3K 26K. 2K 

Véletlen (2) 942K 27K TIK 15K 














5.5. ábra. Az egyes CSP-algoritmusok teljesítménye különböző problémák megoldásában. Az algoritmusok 
balról jobbra haladva a következők: egyszerű visszalépéses, MRV-heurisztikával bővített visszalépéses, elő- 
renéző ellenőrzés. MRV-heurisztikával kiegészített előrenéző ellenőrzés és a minimális konfliktusok lokális 
keresése. Az egyes cellákban a probléma megoldása során elvégzett konzisztencia-ellenőrzések száma 
található (öt futtatás mediánértékéből meghatározva): figyeljünk fel arra, hogy a két jobb felső cella kivé- 
telével mindegyik érték ezrekben van megadva (ezt jelzi a K. betű). Az első probléma az Amerikai Egye- 
sült Államok 50 államát tartalmazó térkép négy színnel történő színezése. A többi probléma a (Bacchus 
és van Run, 1995)-ből származik (1. táblázat). A második probléma az n-királynő megoldásához szüksé- 
ges ellenőrzések száma (n értékeire 2-től 50-ig összegezve). A harmadik az 5.13. feladatban is szereplő 
szebrarejtvény". A maradék kettő mesterséges véletlenszerűen generált problémák. (A min-konfliktusok 
algoritmus ezeken nem futott.) Az eredmények azt érzékeltetik, hogy az MRYV-heurisztikával kombinált 
előrenéző ellenőrzés mindegyik probléma esetén jobban teljesít, mint a többi visszalépéses algoritmus, de 
nem minden esetben jobb a min-konfliktusokat használó helyi keresésnél, 


A 4. fejezetben a nem informált keresési algoritmusok gyenge teljesítményét a prob- 
léma ismeretéből származó tárgyterület-specifikus heurisztika bevezetésével orvosoltuk. 
Az derül azonban ki, hogy a kényszerkielégítési problémák hatékonyan megoldhatók 
ilyen tárgyterület-specifikus tudás nélkül is. Olyan általános célú eljárások alakíthatók 
ki, amelyek az alábbi kérdéseket vizsgálják: 


1. A következő lépésben melyik változóhoz rendeljünk értéket, és milyen sorrendben 
próbálkozzunk az értékekkel? 

2. Milyen következményei vannak a jelenlegi változó-hozzárendeléseknek a még hoz- 
zárendeletlen változók számára? 

3. Ha egy út sikertelennek bizonyul (azaz egy olyan állapothoz jutunk, ahol egy válto- 
zónak nincs megengedhető értéke), a következő utak során el tudja-e kerülni a kere- 
sés ezt a hibát? 


A következő pontokban megpróbáljuk sorra megválaszolni ezeket a kérdéseket. 
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Változó- és értékrendezés 


A visszalépéses algoritmus tartalmazza az alábbi sort: 
var — HOZZÁRENDELETLEN-VÁLTOZÓ-KIVÁLASZTÁS(VÁLTOZÓK[csp], hozzárendelések, csp) 


Alapértelmezés szerint a HOZZÁRENDELETLEN-VÁLTOZÓ-KIVÁLASZTÁS egyszerűen ki- 
választja a VÁLTOZÓKÍCspl lista sorrendje szerinti következő hozzárendeletlen változót. 
A statikus változó-hozzárendelés ritkán vezet a leghatékonyabb kereséshez. Például mi- 
után kiválasztottuk az NYA — vörös és az ÉT — zöld hozzárendeléseket, csak egyetlen 
értéket rendelhetünk DA-hoz, tehát ésszerű lenne inkább a DA — kék hozzárendelést 
elvégezni, mintsem 0 számára keresni értéket. Sőt miután DA értéket kapott, kénysze- 
rítve vagyunk 0, ÚDW és V értékeinek kiválasztásakor. Ezt az intuitív ötletet (a legke- 
vesebb , megengedett" értékkel rendelkező változó kiválasztását) nevezik legkevesebb 
fennmaradó érték (minimum remaining values, MRV) heurisztikának. Nevezték már 
, legkorlátozottabb változó" vagy , meghiúsulást előre" heurisztikának is (az utóbbi névnek 
az a magyarázata, hogy azt a változót emeli ki, amelyik legvalószínűbben fog hamaro- 
san hibához vezetni, ezáltal megnyesve a keresési fát). Ha van egy X változó, amelynek 
egyetlen megengedett értéke sincs. akkor az MRV-heurisztika ki fogja választani X-et, 
és azonnal kideríti a hibát, elkerülve ezzel a többi változó közötti értelmetlen keresgé- 
lést, ami mindig kudarcra vezet, amikor X végül is kiválasztódik. Az 5.5. ábra második, 
BT--MRV címkéjű oszlopa ennek a heurisztikának a teljesítményét mutatja. Az egysze- 
rű visszalépéses keresésnél a teljesítmény a problémától függően mintegy 3...3000-szer 
jobb lehet. Vegyük észre, hogy a teljesítménymértékünk nem tartalmazza a heurisztikus 
értékek kiszámításának többletköltségét. A következő pontban bemutatunk egy módszert, 
amellyel kezelhetővé válik ez a költség. 

Az MRV-heurisztika semmit sem segít abban, hogy melyik régiót válasszuk ki első- 
ként Ausztrália kiszínezésekor, mert a kiinduláskor mindegyik régiónak három megenge- 
dett színe van. Ebben az esetben segíthet a fokszám-heurisztika (degree heuristics). Ez 
azáltal kísérli meg a későbbi választások elágazási tényezőjét csökkenteni, hogy azt a 
változót választja ki, amely a legtöbbször szerepel a hozzárendeletlen változókra vonat- 
kozó kényszerekben. Az 5.1. ábrán DA a legnagyobb fokszámú változó (fokszáma 5), 
az összes többi változó fokszáma 2 vagy 3, leszámítva 7-t, amelyé nulla. Valójában, ha 
már egyszer DA-t kiválasztottuk, a fokszám-heurisztika alkalmazása a problémát egyet- 
len hibás lépés nélkül oldja meg: mindegyik választási pontnál bármelyik konzisztens 
színt is választjuk, mindenképpen visszalépés nélkül jutunk egy megoldáshoz. A legke- 
vesebb fennmaradó érték heurisztika általában jobban irányít, de a patthelyzetek eldön- 
téséhez hasznos segítség lehet a fokszám-heurisztika. 

Miután az algoritmus már kiválasztott egy változót, el kell döntenie, hogy milyen 
sorrendben vizsgálja meg ennek értékeit. Erre néha a legkevésbé-korlátozó-érték 
(least-constraining-value) heurisztika lehet hasznos. Ez a heurisztika előnyben része- 
síti azt az értéket, amely a legkevesebb választást zárja ki a kényszergráfban a szom- 
szédos változóknál. Például tegyük fel. hogy az 5.1. ábra esetében már létrehoztuk az 
NyA — vörös és az ÉT — zöld parciális hozzárendelést, és most € számára akarunk 
értéket találni. A kék rossz választás volna, mert ez kizárja 0 szomszédjának, DA-nak 
utolsó megengedett értékét. A legkevésbé korlátozó heurisztika ezért a kékkel szemben 
a vöröset részesíti előnyben. Általában véve a heurisztika megpróbálja a későbbi változó- 
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hozzárendelések számára a lehető legnagyobb szabadságot meghagyni. Természetesen ha 
egy probléma összes megoldását meg szeretnénk találni, és nem elégszünk meg csupán 
eggyel, akkor a sorrend közömbös, hiszen úgyis minden értéknek sorra kell kerülnie. 
Ugyanez igaz akkor is, ha a problémának nincsen megoldása. 


Az információ terjesztése a kényszereken keresztül 


A keresési algoritmusunk eddig csak akkor foglalkozott egy változóra vonatkozó kény- 
szerrel, ha a változót a HOZZÁRENDELETLEN- VÁLTOZÓ-KIVÁLASZTÁS kiválasztotta. De ha 
néhány kényszert a keresés folyamán korábban vagy akár még a keresés megkezdése 
előtt megvizsgálunk, akkor drasztikusan csökkenthető a keresési tér mérete. 


Előrenéző ellenőrzés 


A kényszerek keresés közbeni jobb felhasználásának egyik módszerét előrenéző ellen- 
őrzésnek (forward checking) nevezzük. Az előrenéző ellenőrzési folyamat minden 
egyes alkalommal, amikor egy X változó értéket kap, minden, az X-hez kényszerrel 
kötött. hozzárendeletlen Y-t megvizsgál, és Y tartományából törli az X számára válasz- 
tott értékkel inkonzisztens értékeket. Az 5.6. ábra bemutatja az előrenéző ellenőrzéses 
keresés menetét a térképszínezési probléma során. Két fontos dolgot kell megemlíte- 
nünk ezzel a példával kapcsolatban. Először is vegyük észre, hogy miután elvégeztük 
az NyA — vörös és a 0 — zöld hozzárendeléseket, ÉT és DA tartományai egyetlen elem- 
re szűkültek, és azzal, hogy az NyA-ból és a 0-ból származó információt terjesztettük, 
teljesen megszüntettük az ezen változók szerinti elágazást. Az MRV-heurisztika, amely 
az előrenéző ellenőrzés nyilvánvaló partnere, automatikusan DA-t és ÉT-t választja kö- 
vetkezőnek. (Tulajdonképpen még hatékonyabb eljárássá tehetjük az előrenéző ellen- 
őrzést, ha az MRV-heurisztika munkájához szükséges információt inkrementálisan 
számítjuk.) A másik dolog, amire érdemes felfigyelni. az az, hogy a V — kék hozzá- 
rendelés után DA tartománya üres lett. Ezért az előrenéző ellenőrzés megállapítja, hogy 
a (NyA — vörös, 0 — zöld, V — kék) részleges hozzárendelés inkonzisztens a probléma 
kényszereivel, és az algoritmus azonnal visszalép. 


A kényszerek terjesztése 


Az előrenéző ellenőrzés ugyan sok inkonzisztenciát észrevesz, de nem mindet. Például 
nézzük csak az 5.6. ábra harmadik sorát. Az látható itt, hogy amikor DA vörös és 0 zöld, 
mind ÉT-nek, mind DA-nak kéknek kell lennie. De ezek szomszédosak. és nem lehet 
azonos az értékük. Az előrenéző ellenőrzés nem veszi észre ezt az inkonzisztenciát, mert 
nem néz elég messze előre. A kényszerek terjesztése (constraint propagation) általá- 
nos kifejezés jelöli azt, ha az egyik változó kényszerének a többi változót érintő követ- 
kezményeit terjesztjük: esetünkben NyA-ról 0-ra és ÉT-ről DA-ra kell terjeszteni (ahogy 
ezt már az előrenéző ellenőrzés is megtette), majd az ÉT és DA közti kényszerre, hogy 
észrevehessük az inkonzisztenciát. Ezt pedig gyorsan szeretnénk tenni: semmi értelme 
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Kezdeti tartományok 
Miután NyA — vörös[d0. ] ZKÍVZKI 
Miután O — zöld 
Miután V — kék 
5.6. ábra. A térképszínezés folyamata előrenéző ellenőrzéses keresés esetén. Az első hozzárendelés az 
NYA sz vörös, majd az előrenéző ellenőrzés törli a vörös értéket a szomszédos ÉT és DA változók tarto- 
mányaiból. A 0 — zöld hozzárendelés után a zöld is kikerül az ÉT, DA és ÚDW változók tartományai- 
ból. A V — kék-et követően a kék is törlődik a DA és ÚDW változók tartományaiból, és DA számára nem 
marad megengedett érték. 


a keresés méretét csökkenteni, ha több időt töltünk a kényszerek terjesztésével, mint 
az egyszerű kereséssel tennénk. 

Az élkonzisztencia (arc consistency) alapul szolgálhat egy gyors, az előrenéző 
ellenőrzésnél lényegesen erősebb kényszerterjesztéshez. Az , él" itt a kényszergráf irá- 
nyított éleit jelenti, amilyen például a DA-ból az ÚDW-be mutató él. Ha adott DA és 
ÚDW aktuális tartománya, akkor ez az él konzisztens, ha DA mindegyik x értékéhez 
található egy x-szel konzisztens valamilyen y érték ÚDW-ben. Az 5.6. ábra harmadik 
sorában DA és ÚDW pillanatnyi tartománya rendre a (kék), illetve a (vörös, kék). 
A DA — kék esetén található egy konzisztens hozzárendelés ÚDW-hez, nevezetesen az 
ÚDW — vörös; ezért a DA-ből ÚDW-be mutató él konzisztens. Viszont az ÚDW-ből 
a DA-ba mutató él nem konzisztens, mert az ÚDW — (kék) hozzárendelésnét a DA-hoz 
nem tudunk színt találni. Az él úgy tehető konzisztenssé, hogy az ÚDW tartományából 
töröljük a kék értéket. 

A DA-ból ÚT-be mutató él mentén is alkalmazbatjuk a keresési folyamat ugyan- 
azon fázisában az élkonzisztenciát. Az 5.6. ábra harmadik sora szerint mindkét válto- 
zó értéktartománya (kék). Ez azt eredményezi, hogy törölnünk kell a kék-et DA tar- 
tományából, amely ezzel kiürül. Az élkonzisztencia ellenőrzés tehát lehetővé teszi, 
hogy korábban észrevegyük az egyszerű előrenéző ellenőrzés által fel nem fedett 
inkonzisztenciát. 

Az élkonzisztencia-ellenőrzés alkalmazható előfeldolgozó lépésként a keresés meg- 
kezdése előtt, vagy a keresési folyamat minden egyes hozzárendelését követő terjesztési 
lépésként (az előrenéző ellenőrzéshez hasonlóan). (Az utóbbi algoritmust Élkonzisztencia 
fenntartásának is, angol rövidítéssel MAC-nak nevezik.) Mindkét esetben addig kell 
ismételve alkalmazni a folyamatot, amíg nem marad inkonzisztencia. Erre azért van 
szükség, mert amikor egy élinkonzisztenciát eltávolítandó egy énték kikerül egy válto- 
zó tartományából, az ehhez a változóhoz mutató éleknél új inkonzisztencia jöhet létre. 
Az AC-3, az élkonzisztencia teljes algoritmusa egy sort használ annak nyilvántartására, 
hogy mely élek inkonzisztenciáját kell még ellenőriznie (lásd 5.7. ábra). Minden egyes 
(X;, X;) élet sorban egyenként levesszük a tennivalók listájáról és ellenőrizzük; ha pedig 
X; tartományának bármely változóját törölni kell, akkor minden X; -be mutató (X,., X;) élet 
visszateszünk ellenőrzésre a sorba. Az élkonzisztencia-ellenőrzés komplexitása az aláb- 
biak szerint vizsgálható: egy bináris kényszerkielégítési problémában legfeljebb OG) 
él van; minden egyes (X,, X;) él csak d alkalommal kerülhet napirendre, mert X;-ben 
összesen d törölhető érték van; egy él konzisztenciájának ellenőrzése elvégezhető 0(d?) 
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( tumetion AC-3(csp) returns a CSP-t, lehetőleg redukált tartományokkal 
inputs: csp, egy bináris CSP (XI. X2, ..., X., 1 változókkal 
local variables: sor. a sorra következő élek, kiindulásként csp összes éle 


"while sor nem üres do 
(XX) — ELSŐT-KivEszísor) 
if INKONZISZTENS-ÉRTÉKEKET-KIVESZ(X;, X;) then 
for each X, in SZOMSZÉDAI[X] do 
az (X4, X) belekerül a sor-ba 





function INKONZISZTENS-ÉRTÉKEKET-KIVESZ(X;, X/) returns igaz, a.cs.a, ha kiveszünk egy értéket 
eltávolítva — hamis 
for each x in TARTOMÁNY[X/] do 
if a TARTOMÁNYÍX(] egyetlen y értéke esetén sem elégíti ki (x, y) az X; és X; közti kényszert 
then x törlése TARTOMÁNYI X/]-ből: eltávolítva — igaz 
return eltávolítva 











5.7. ábra. Az AC-3 élkonzisztencia algoritmus. Az AC-3 alkalmazását követően vagy mindegyik él 
élkonzisztens, vagy néhány változó tartománya üres, azaz a kényszerkielégítési probléma nem hozható 
élkonzisztens alakra (tehát nem oldható meg). Az , AC-3" nevet az algoritmus kitalálója (Mackworth, 
1977) vezette be, mert ezt az algoritmust mutatta be cikkében harmadikként. 


időben; tehát a legrosszabb esetben vett teljes idő O(r2d?). Ez ugyan lényegesen költ- 
ségesebb, mint az előretekintő ellenőrzés, de az extra költség általában kifizetődik. ! 

Mivel a kényszerkielégítési problémák speciális esetként tartalmazzák a 35AT-ot, 
ezért nem várhatjuk, hogy polinom idejű algoritmust találunk annak eldöntésére, hogy 
egy adott kényszerkielégítési probléma konzisztens-e. Ebből arra következtethetünk, 
hogy az élkonzisztencia nem tár fel minden lehetséges inkonzisztenciát. Például az 5.1. 
ábrán az (NyA — vörös, ÚDW — vörös) részleges hozzárendelés inkonzisztens, de az 
AC-3 nem találja meg. Definiálható a terjesztés erősebb formája is, amit k-konzisz- 
tenciának (£4-consistency) nevezünk. Egy kényszerkielégítési probléma akkor k-kon- 
zisztens, ha bármely k - 1 változóból álló halmaz és ezen változók bármely konzisztens 
hozzárendelése esetén mindig lehet a k-adik változónak konzisztens értéket találni. 
Az 1-konzisztencia például azt jelenti. hogy mindegyik individuális változó önmagá- 
ban véve is konzisztens; ezt csomópont-konzisztenciának (node consistency) is ne- 
vezik. A 2-konzisztencia ugyanaz, mint az élkonzisztencia. A 3-konzisztencia azt jelen- 
ti, hogy egymás melletti változók bármely párja mindig kiterjeszthető egy szomszédos 
változóra; ezt útvonal-konzisztenciának (path consistency) is nevezik. 

Egy gráf erősen k-konzisztens akkor, ha k-konzisztens, valamint (k — D-konzisztens, 
(k — 2)-konzisztens és így tovább le egészen az 1-konzisztenciáig. Tegyük fel most, hogy 
van egy n csomópontból álló kényszerkielégítési problémánk, és tegyük erősen 
n-konzisztenssé (azaz k-konzisztenssé k — r esetében). Ekkor visszalépés nélkül meg- 
oldhatjuk a problémát. Először egy konzisztens értéket választunk X) számára. Ezután 
garanciánk van arra, hogy tudunk X2 számára értéket választani, mert a gráf 2-kon- 
zisztens, Xz számára, mert a gráf 3-konzisztens és így tovább. Minden egyes X; változó 


1 A Mohr és Henderson (Mohr és Henderson, 1986) bemutatta AC-4 algoritmus O(rfd?) alatt fut. (Lásd 
5.10. feladat.) 
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esetén csak d értéket kell ellenőriznünk a tartományból, hogy egy XI ,..., X;.1-gyel 
konzisztens értéket találjunk. Garanciánk van tehát arra, hogy O(d) időben megoldást 
találunk. Persze semmit sem adnak ingyen: az n-konzisztenciát biztosító bármely algo- 
ritmus legrosszabb esetben n-ben exponenciális lesz. 

Az n-konzisztencia és az élkonzisztencia között egy széles köztes mező húzódik: 
az erősebb konzisztencia-ellenőrzések futtatása tovább fog tartani, de több eredménnyel jár 
az elágazási tényező csökkentésében és az inkonzisztens részleges hozzárendelések felde- 
rítésében. Ki lehet számolni a legkisebb olyan k értéket, melyre a k-konzisztencia ellenőr- 
zésének futtatása visszalépés nélküli problémamegoldást tesz lehetővé (lásd 5.4. alfejezet), 
de ez gyakran nem célszerű. A legmegfelelőbb konzisztencia-ellenőrzési szint kiválasztá- 
sa valójában leginkább empirikus tudomány. 


Speciális kényszerek kezelése 


A kényszerek bizonyos típusai gyakran fordulnak elő a valós problémákban és speciá- 
lis célú algoritmusokkal jóval hatékonyabban kezelhetők, mint az eddig leírt általános 
célú módszerekkel. Például a MindKül kényszer azt állítja, hogy a benne szereplő ösz- 
szes változóknak mind különböző értéket kel! felvennie (ahogy a betűrejtvényes példá- 
ban láttuk). A MindKül kényszer inkonzisztencia-ellenőrzésére egy egyszerű módszer 
az, hogy ha m változó szerepel a kényszerben, és ha ezeknek együttesen nr különböző 
értéke lehet, akkor m 5 n esetén a kényszert nem lehet kielégíteni. 

Ez a következő egyszerű algoritmushoz vezet: először vegyünk ki a kényszerből 
minden változót, amelynek egyelemű tartománya van, és vegyük ki ezeknek a vál- 
tozóknak az értékeit a megmaradó változók tartományaiból. Ismételjük ezt a lépést 
mindaddig, amíg van ilyen változónk. Ha bármely ponton egy üres tartomány jön létre, 
vagy több változónk marad, mint értékünk a tartományban, akkor egy inkonzisztenciát 
derítettünk fel. 

Ezt a módszert használhatjuk arra, hogy az 5.1. ábra (NyA — vörös, ÚDW — vörös) 
részleges hozzárendelésében észrevegyük az inkonzisztenciát. Figyeljünk fel arra, hogy 
a DA, az ÚT és a 0 változók lényegében egy MindKül kényszerrel vannak összekötve, 
mert mindegyik párnak különböző színűnek kell lennie. Miután alkalmaztuk az AC-3-at 
a részleges hozzárendelésre, az egyes változók tartománya a (zöld, kék) tartományra 
szűkült le. Azaz három változónk van és csupán két színünk, tehát megszegtük a Mind- 
Kül kényszert. Tehát a magasabb szintű kényszerekre alkalmazott egyszerű konzisztencia- 
ellenőrzések néha hatékonyabbak, mintha az ekvivalens bináris kényszerek halmazára 
vizsgáltuk volna az élkonzisztenciát. 

A legfontosabb magasabb rendű kényszer talán az erőforráskényszer (resource 
constraint), amit néha legfeljebb kényszernek is neveznek. Jelölje például PA) , ..., PAg 
rendre négy feladathoz hozzárendelt személyzet számát. Azt a kényszert, miszerint ösz- 
szesen nem lehet 10-nél több embernek feladatot adni, így írhatjuk fel: legfeljebb( 10, 
PA), PA2, PAz, PA). Az inkonzisztenciát egyszerűen ki lehet mutatni az aktuális tarto- 
mányok minimális értékeinek összegzésével: ha például mindegyik változó tartománya 
a (3,4,5, 6], akkor a legfeljebb kényszert nem lehet kielégíteni. A konzisztenciát az- 
által is érvényesíthetjük, hogy töröljük bármely tartomány maximális értékét, amely 
nem konzisztens az összes többi tartomány minimális értékével. Így ha példánkban 
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mindegyik változónak (2, 3, 4, 5, 6) a tartománya, akkor az 5 és a 6 értékeket mind- 
egyik tartományból törölni lehet. 

A nagy erőforrás-korlátozott egész értékű problémáknál — ilyenek például az embe- 
rek ezreit és járművek százait mozgató logisztikai problémák - általában nem tehető 
meg az, hogy mindegyik változó tartományát egy nagy egészhalmazzal ábrázoljuk, majd 
ezt a halmazt a konzisztencia-ellenőrző módszerek segítségével fokozatosan csökkent- 
jük. Ehelyett a tartományokat az alsó és a felső határaikkal ábrázoljuk, és határterjesztés 
segítségével kezeljük. Tegyük fel például, hogy két repülőjárat van, a 271-es és a 272-es, 
amelyekre a repülőgépek kapacitása rendre 165 és 385. A repülőjárat utasszámának 
kezdeti tartománya tehát 


Járat271 € (0, 165] és Járar272 € [0, 385) 


Tegyük fel most, hogy van egy külön korlát, miszerint a két járatnak együtt 420 embert 
kell szállítania. Járat271 -t- Járat272 € (420. 420]. A határkényszereket terjesztve a tar- 
tományokat a következőkre csökkentjük: 


Járan271 € [35, 165] és Járat272 € [225, 385] 


Akkor nevezünk egy kényszerkielégítési problémát határkonzisztensnek, ha minden X 
változóra ennek a változónak mind az alsó, mind a felső határértékére található minden 
Y változóhoz olyan érték, amely kielégíti az X és Y közti kényszereket. Ezt a fajta kény- 
szerterjesztést (bound propagation) széles körben használják a gyakorlati kényszer- 
kielégítési problémák során. 


Intelligens visszalépés: visszanézni 


Az 5.3. ábra VISSZALÉPÉSES-KERESÉS algoritmusa egy elég egyszerű intézkedést alkalmaz 
akkor, amikor egy keresési ág meghiúsul: visszalép az előző változóra, és megpróbál 
számára egy másik értéket találni. Ezt időrendi visszalépésnek (chronological back- 
tracking) nevezik, mert a legutolsó döntési pontot keresi fel újra. Ebben az alrészben 
látni fogjuk, hogy adódik erre sokkal jobb módszer is. 

Nézzük meg, mi történik, amikor az egyszerű visszalépéses algoritmust az 5.1. ábrán 
látható problémára alkalmazzuk rögzített változósorrenddel (0, ÚDW, V, T, DA, NyA, 
ÚT). Tegyük fel, hogy már létrehoztuk a (0 — vörös, ÚDW - zöld, V — kék, T — vörös) 
hozzárendelést. Amikor a következő változóval, DA-val próbálkozunk, azt látjuk, hogy 
mindegyik érték sérti a kényszert. Visszalépünk 7-re, és egy új színt keresünk Tasmania 
számára. Ez nyilvánvalóan butaság: Tasmania átszínezése nem oldja meg a Dél-Auszt- 
ráliával kapcsolatos problérnát. 

A visszalépéses megközelítés intelligens alkalmazása lenne, ha ahhoz a változóhalmaz- 
hoz mennénk vissza, amely a meghiúsulást okozta. Ezt a halmazt konfliktushakmaznak 
(conflict set) nevezik; esetünkben a DA-hoz tartozó konfliktushalmaz a (0, ÚDW, V). 
Általános esetben egy X változó konflikushalmaza a korábban értéket kapott változók 
egy halmaza, melyeket X-hez kényszerek kötnek. A visszaugrás (backjumping) a konf- 
liktushalmaz-beli legutolsó változóhoz lép vissza; esetünkben a visszaugrás átugorná 
Tasmaniát, és V számára próbálna új értéket keresni. Ezt egyszerű implementálni a 
VISSZALÉPÉSES-KERESÉS olyan módosításával, hogy az összegyűjtse a konfliktushalmazt, 
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miközben hozzárendelhető értékeket keres. Ha nem talál ilyen értéket. akkor a konflik- 
tushalmaz legutolsó elemét kell visszaadnia (a meghiúsulás jelzésével együtt). 

Az éles szemű olvasónak feltűnhetett, hogy az előrenéző ellenőrzés a konfliktushal- 
mazt minden külön munka nélkül előállíthatja: mindig amikor az előrenéző ellenőrzés 
X egy hozzárendelésén alapulva Y tartományából kitöröl egy elemet, X-et hozzá kell ad- 
nia Y konfliktushalmazához. Ezenkívül még minden esetben, amikor az utolsó értéket 
törli Y tartományából, az Y konfliktushalmazában szereplő változókat hozzá kell adnia X 
konfliktushalmazához. Ezek után mihelyt Y-hoz jutunk. már azonnal ismerni fogjuk, 
hogy hova lépjünk vissza, ha erre szükség van. 

A sasszemű olvasónak valami furcsaság is feltűnhetett: a visszaugrás akkor követke- 
zik be, amikor egy tartomány minden értéke konfliktusban van az aktuális hozzárende- 
lésekkel, de az előrenéző ellenőrzés felismeri ezt az eseményt, és megakadályozza, hogy 
valaha is ilyen csomóponthoz jussunk! Valóban, meg lehet mutatni, hogy a visszaug- 
rás által levágott minden ágat az előrenéző ellenőrzés is levágja. Tehát az egyszerű 
visszaugrás redundáns az előrenéző ellenőrzés során, vagy pontosabban szólva, egy 
olyan keresésnél, amely erősebb konzisztencia-ellenőrzést, például MAC-ot használ. 

Az előző bekezdés megfigyelése ellenére a visszaugrás mögötti ötlet továbbra is 
használható marad: lépjünk vissza a hiba helyére. A visszaugrás akkor veszi észre a ku- 
darcot, amikor egy változó értéktartománya üressé válik, de sok esetben egy ág már 
sokkal korábban levágásra lett ítélve. Tekintsük ismét az (NyA — vörös, ÚDW — vörös) 
részleges hozzárendelést (amelyik. korábbi megjegyzéseink értelmében, inkonzisztens). 
Tegyük fel, hogy a T — vörös-t próbáljuk, majd az ÚT, 0, V, DA-kra alkalmazzunk hoz- 
zárendeléseket. Tudjuk, hogy az utóbbi négy változó esetén semmilyen hozzárendelés 
sem lesz jó, így végül ÚT próbálgatásánál kifogyunk az értékekből. A kérdés most az, 
hogy hova lépjünk vissza? A visszaugrás nem fog működni, mert ÚT-nek igenis van az 
előző hozzárendelésekkel konzisztens értéke: ÚT esetén nincsen teljes konfliktushalmaz 
a megelőző változók között, amely felelős lenne a kudarcért. Tudjuk azonban, hogy a 
négy változó, ÚT, 0, V, és DA együttvéve a megelőző változók egy halmaza miatt hiú- 
sul meg, és ezek azok a változók. amelyek közvetlenül konfliktusban állnak a kérdéses 
néggyel. Ennek alapján ÚT konfliktushalmazának egy mélyebb megértéséhez jutottunk: 
a konfliktushalmaz a megelőző változók azon halmaza, ami bármely következő változó- 
val együtt felelős ÚT konzisztens megoldásának kudarcáért. Esetünkben ez a halmaz az 
NyA és az ÚDW, tehát az algorítmusnak ÚDW-hez kell visszalépnie átugorva Tasmaniát. 
A konfliktushalmaz ilyen definíciójára támaszkodó visszaugrási algoritmust nevezzük 
konfliktusvezérelt visszaugrásnak (conffict-directed backjumping). 

Magyarázatot kell most adnunk arra, hogy miként lehet kiszámítani ezeket az újfajta 
konfliktushalmazokat. A módszer valójában nagyon egyszerű. Egy keresési ág ,.ter- 
minálási" kudarca mindig azért következik be. mert egy változó tartománya kiürül, ennek 
a változónak pedig egy szokásos konfliktushalmaza van. Példánkban DA hiúsul meg, és 
konfliktushalmaza (mondjuk) az (NyA, ÚT, 0). Visszaugrunk 0-ra, és € beépíti saját 
közvetlen konfliktushalmazába (ami az (ÚT, ÚDW)) DA konfliktushalmazát (leszámít- 
va persze 0-t magát), és így előáll az (NyA, ÚT, ÚDW) konfliktushalmaz. Azaz 0-tól 
számítva tovább már nincsen megoldás feltételezve (NyA, ÚT, ÚDW) korábbi hozzá- 
rendeléseit. Tehát visszalépünk Ú7-re, amelyik a legutóbbi ezek közül. ÚT felveszi 
(Nya, ÚT, ÚDW) - fÚTJ-t a saját közvetlen konfliktushalmazába, (NyA )-ba, és előáll 
az (NyA, ÚDW) konfliktushalmaz (ahogy az előző bekezdésben állítottuk). Foglaljuk 
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össze az eddig mondottakat: jelölje X; az aktuális változót és conffX) a saját konfliktus- 
halmazát. Ha X; minden lehetséges értéke meghiúsul, ugorjunk vissza a confX)-beli 
legutolsó X; értékre és legyen 


confiX;) — confiX;) U confiIX;) — (XI 


A konfliktusvezérelt visszaugrás a keresési fa megfelelő helyére visz vissza, de nem 
akadályozza meg, hogy ugyanazt a hibát elkövessük a fa egy másik ágán. A kényszer- 
tanulás (constraint learning) a konfliktusból kiemelt új kényszer megtanulásával mó- 
dosítja a kényszerkielégítési problémát. 


5.3. LOKÁLIS KERESÉS KÉNYSZERKIELÉGÍTÉSI 
PROBLÉMÁKNÁL 


A lokális keresési algoritmusok (lásd 4.3. alfejezet) nagyon hatékonynak bizonyulnak 
sok kényszerkielégítési probléma megoldásában: a kiinduló állapot minden változóhoz 
értéket rendel, és az állapotátmenet-függvény működése során általában egyszerre csak 
egy változó értékét módosítja. A 8-királynő problémában például a kezdeti állapot lehet 
a 8 királynő véletlenszerű elhelyezése a 8 oszlopban, az állapotátmenet-függvény pedig 
kiemel egy királynőt, és megpróbálja a saját oszlopán belül máshova helyezni. Egy má- 
sik lehetőség lehetne, ha úgy indulnánk, hogy a 8 királynő mindegyikét egy külön osz- 
lopba a nyolc sor permutációjával helyezzük el, és az a következő állapotokat pedig két 
királynő sorának felcserélésével generálnánk.? Tulajdonképpen már láttunk egy példát 
lokális keresés alkalmazására egy CSP-probléma megoldásánál; ilyen volt ahegymászás 
alkalmazása a 8-királynő probléma megoldására (lásd 155. oldal). Egy másik alkalmazás 
a WALKSAT (lásd 278. oldal) a kielégíthetőségi probléma megoldására, mely szintén egy 
speciális esete a kényszerkielégítési problémáknak. 

Amikor egy változónak új értéket választunk, a legnyilvánvalóbban kínálkozó heu- 
risztika annak az értéknek kiválasztása, amelyik a legkevesebb konfliktust eredményezi 
más változókkal. Ezt nevezik min-konfliktusok (min-conflicts) heurisztikának. Az algo- 
ritmus az 5.8. ábrán látható, a 8-királynő problémára történő alkalmazását az 5.9. ábrán 
mutatjuk be, a kiértékelés eredménye pedig az 5.5. ábrán szerepel. 

A min-konfliktusok heurisztika meglepően hatékony sok kényszerkielégítési prob- 
léma megoldásában, különösen amikor adott egy viszonylag jó kezdeti állapot. Telje- 
sítményét az 5.5. ábra utolsó oszlopa mutatja. Meglepő módon az n-királynő probléma 
esetén a min-konfliktusok algoritmus futási ideje a kezdeti elhelyezéseket nem számít- 
va nagyjából független a probléma méretétől. Akár a millió-királynő problémát is meg- 
oldja átlagosan ötven lépésben (a kezdeti értékadást követően). Ez a figyelemre méltó 
megfigyelés a kilencvenes években komoly kutatómunkához vezetett a lokális keresés, 
valamint a könnyű és nehéz problémák megkülönböztetése terén (ezzel a 7. fejezetben 
még foglalkozunk). Durván szólva az n-királynő azért könnyű a lokális keresés szá- 
mára, mert a megoldások az állapottérben sűrűn helyezkednek el. A min-konfliktusok 


2 lokális keresés a célfüggvény bevezetésével könnyen kiterjeszthető egy kényszerkielégítési problémává. 
Ebben az esetben a hegymászásra és a szimulált lehűtésre használt összes technika alkalmazható a célfüggvény 
optimalizálására. 
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function MIN-KONFLIKTUSOK(csp, max. lépések) returns egy megoldás vagy kudarc 
inputs: csp, egy kényszerkielégítési probléma 
max, lépések, a lépések megengedett száma, mielőtt feladnánk 


aktuális — csp egy kezdeti teljes hozzárendelése 
for i — 1 egészen max lépések-ig do 
if aktuális egy megoldása csp-nek then return aktuális 
vált — egy véletlenszerűen kiválasztott, konfliktusban lévő változó VÁLTOZÓK cspj-ből 
érték — azon v értéke vált-nak. amely minimalizálja KONFLIKTUSOK(vált, v, aktuális, csp)-t 
aktuátis-ban állítsa vált-ot érték-re 
return kudarc 











5.8. ábra A MIN-KONFLIKTUSOK algoritmus kényszerkielégítési problémák megoldására lokális kereséssel. 
A kezdeti állapotot véletlenszerűen választjuk ki, vagy egy mohó hozzárendelési folyamat segítségével, 
amely minden egyes sorra kerülő változónak egy minimális-konfliktus értéket választ. A KONFLIKTUSOK 
függvény megszámolja az adott érték által megsértett kényszerek számát (adottnak tekintve az aktvális 
hozzárendelések fennmaradó részét). 


algoritmus nehéz problémák esetén is működik. Alkalmazták például a Hubble-űrtávcső 
megfigyeléseinek ütemezésére, és az egy hétre tervezett megfigyelések ütemezésének 
elkészítéséhez szükséges három hetet (!) körülbelül tíz percre rövidítene le. 

A lokális keresés másik előnye az, hogy alkalmazható online elrendezésben is, ami- 
kor a probléma változik. Ez különösen fontos az ütemezési problémákban. Egy légitár- 
saság heti ütemezése járatok ezreit és emberekhez rendelt feladatok tízezreit tartalmaz- 
hatja, de egy rossz időjárás az egyik repülőtéren lehetetlenné teheti az ütemezést. Ezt a 
lehető legkevesebb változtatással szeretnénk helyrehozni, amit a jelenlegi ütemezésből 
kiinduló lokális keresési algoritmussal végezhetünk el könnyen. Egy visszalépéses kere- 
sés a kényszerek egy új halmazával általában jóval több időbe telik, és olyan megoldást 
ís találhat, amely jelentősen különbözik az aktuálistól. 
























































5.9. ábra Egy kétlépéses megoldás a 8-királynő problémára a MIN-KONFUIKTUSOK felhasználásával. 
Mindegyik fázisban egy királynőnek keresünk új oszlopot. A konfliktusok számát (esetünkben a támadó 
pozícióban lévő királynők számát) mindegyik négyzetben feltüntettük. Az algoritmus a királynőket a 
MIN-KONELIKTUSOK négyzetre viszi, véletlenszerűen törve fel ezzel a kötéseket. 
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Ebben az alfejezetben azt vizsgáljuk meg, miként lehet a probléma struktúráját, ahogy 
azt a kényszergráf megmutatja, felhasználni a megoldások gyors keresésére. Az itt tár- 
gyalt megközelítések java része nagyon általános és a kényszerkielégítési problémá- 
kon kívül más eseteknél is alkalmazható, például a valószínűségi következtetésnél, 
Végül is a részproblémákká történő dekompozíció az egyetlen mód, mellyel remélhet- 
jük, hogy megbirkózhatunk a valósvilág-beli problémákkal. Ismét ránézve az 5.1. (b) 
ábrára, miközben a probléma struktúráját keressük, egy tény ötlik a szemünkbe ki: 
Tasmania nincs összeköttetésben a nagy szárazfölddel.? Napnál világosabb, hogy Tas- 
mania színezése és a szárazföld színezése független részproblémák (independent 
subproblems): a szárazföld színezésének bármely megoldása és Tasmania színezésé- 
nek bármely megoldása kombinálva egyben a teljes térkép színezésének is megoldása 
lesz. A függetlenségről könnyű megbizonyosodni a kényszergráf összefüggő kompo- 
nenseit (connected components) vizsgálva. Mindegyik komponens egy CSP, rész- 
problémának felel meg. Ha az S; hozzárendelés egy megoldás a CSP; részproblémára, 
akkor az U; S; hozzárendelés megoldása lesz az U; CSP;-nek. Miért fontos ez? Gon- 
doljunk bele a következőbe: tegyük fel, hogy minden egyes CSP;,-nek c változója van 
az n-ből, ahol c konstans. Ekkor n/c részproblémánk van, amelyek mindegyike legfel- 
jebb d" komplexitású. Tehát a teljes komplexitás O(d"n/c). ami lineáris n-ben, míg 
dekompozíció nélkül 0(d"), ami exponenciális n-ben. Tegyük ezt még konkrétabbá: 
egy n — 80-nal jellemzett Boole CSP-t négy részproblémává osztva (c — 20) a meg- 
oldás futási idejét a legrosszabb esetben is az univerzum élethosszáról a másodperc 
törtrészére rövidítjük le. 

A teljesen független részproblémák ínyencfalatok, de ritkák. A legtöbb esetben 
a kényszerkielégítési problémák részproblémái kapcsolatban vannak egymással. 
A legegyszerűbb eset az, amikor a kényszergráf egy fát alkot: bármely két változót 
legfeljebb egy út köt össze. Az 5.10. (a) ábra egy sematikus példát mutat erre.? Meg 
fogjuk mutatni, hogy bármely fasrruktúrájú kényszerkielégítési probléma megoldha- 
tó a változók száma szerinti lineáris időben. Az algoritmusnak a következő lépései 
vannak: 


. Válasszuk ki bármelyik változót a fa gyökércsomópontjául, és rendezzük a többi 
változót a gyökértől a levelekig úgy, hogy mindegyik csomópontot a sorrendezés- 
ben megelőzzön a szülője (lásd 5.10. (b) ábra). Címkézzük ezeket a változókat sor- 
ban XI, ..., X,rnel. Most, a gyökércsomópontot leszámítva, mindegyik változónak 
pontosan egy szülője van. 

2. Alkalmazzuk az élkonzisztenciát (X,, X-re, ahol X; szülője X-nek (j pedig fusson 

visszafelé n-től 2-ig), és szükség esetén vegyünk ki értékeket a TARTOMÁNYI X/]-ből. 

3. Adjunk X-nek bármilyen, X; hozzárendelt értékével konzisztens értéket ahol X; szü- 

lője X-nek, és j 1-től n-ig halad. 


3 Egy nagyon gondos térképész vagy egy tasmaniai patrióta ellenvethetné, hogy Tasmaniát nem lehet ugyan- 
olyan színnel színezni. mint a legközelebbi szárazföldi szomszédját. nehogy úgy tűnjön. mintha annak az állam- 
nak a része lenne. 

Sajnos nagyon kevés olyan területe van a világnak (talán Celebesz ilyen), amelynek faszerkezetű térképe 
van. (Celebesz egy közelítőleg csillagstniktúrájú sziget Közép-Indonéziában — A ford.) 
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0-0 


(a) ME) (b) 


5.10. ábra. (a) Egy faszerkezetű kényszerkielégítési probléma kényszergráfja. (b) Az A csomópont gyö- 
kérnek tekintésével konzisztens változók egy lineáris rendezése. 


Két dolog érdemes említésre. Egyrészt a 2. lépés után a kényszerkielégítési probléma 
irány szerint élkonzisztens, tehát a 3. lépés hozzárendeléseiben nincsen szükség vissza- 
lépésre (lásd a k-konzisztencia tárgyalását a 193. oldalon). Másrészt, miután a 2. lépésben 
fordított sorrendben alkalmaztuk az élkonzisztencia-ellenőrzéseket, elértük az algorit- 
mussal, hogy a törölt értékek ne veszélyeztessék a már feldolgozott élek konzisztenciáját. 
A teljes algoritmus OWd?) időben fut. 

Most, hogy fákra már van egy hatékony algoritmusunk, megvizsgálhatjuk, miként lehet 
az általánosabb kényszergráfokat valahogyan fákra visszavezetni. Alapvetően két mód van 
erre: az egyik a csomópontok eltávolításán, a másik a csomópontok összevonásán alapul. 

Az első megközelítés úgy jár el, hogy néhány változónak értéket ad, a maradékok 
pedig fát fognak alkotni. Vegyük ismét az 5.11. (a) ábrán látható kényszergráfot az 
Ausztrália-példához. Ha törölni tudnánk Dél-Ausztráliát, akkor a gráf fává válhatna 
(ahogy az ábra (b) részén látható). Szerencsére meg tudjuk tenni ezt (a gráfban, nem a 
kontinensen) azzal, hogy DA értékét rögzítjük, és a többi változó tartományából töröl- 
jük azokat az értéket, melyek inkonzisztensek a DA számára választottal. 

Most tehát hogy mind DA-t, mind a rá vonatkozó kényszereket eltávolítottuk, a kény- 
szerkielégítési probléma bármely megoldása konzisztens lesz a DA számára választott 
értékkel. (Ez bináris kényszerkielégítési problémák esetén működik; a helyzet jóval 
bonyolultabb magasabb rendű kényszerek esetén.) Tehát a keletkező fa a fenti aigorit- 
mussal megoldható, és így az egész problémát is megoldottuk. Általános esetben persze 
(nem úgy, mint a térképszínezésnél) a DA számára választott érték lehet rossz is. és 
ekkor egyesével végig kell próbálgatni őket. Az általános algoritmus az alábbi: 


1. Válasszunk ki egy S részhalmazt a VÁLTOZÓK[csp]-ből úgy, hogy a kényszergráf S 
eltávolítása után fa legyen. 5-et ciklikusság-vágóhalmaznak (cycle cutset) nevezzük. 

2. S minden egyes változójának minden egyes, az 5-re vonatkozó összes kényszert 
kielégítő lehetséges hozzárendelésére: 


(a) vegyük ki a fennmaradó változók tartományaiból az S számára választott hozzá- 
rendeléssel inkonzisztens értékeket, és 

(b) ha a fennmaradó kényszerkielégítési problémának van megoldása, akkor adjuk 
vissza ezt az $ hozzárendelésével együtt. 


Ha a ciklikusság-vágóbalmaz mérete c, akkor a teljes futási idő O(d". (n — cd) lesz. 
Ha a gráf , közel fa", akkor c kicsi lesz, a megtakarítás pedig tetemes a gondolkodás nél- 
küli visszalépéses megoldáshoz képest. A legrosszabb esetben azonban c akár (m — 2) 
méretű is lehet. A fegkisebb ciklikusság-vágóhalmaz megtalálása NP-nehéz probléma, 
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(a) (b) 
5.11. ábra. (a) Az 5.1. ábrán szereplő eredeti kényszergráf. (b) A kényszergráf DA eltávolítását követően. 


de sok hatékony algoritmust ismerünk erre a feladatra. AZ Általános algoritmikus meg- 
közelítés a vágóhalmaz-kondicionálás (cutset conditioning); még találkozni fogunk 
ezzel a 14. fejezetben. ahol a valószínűségekről történő következtetésekhez használjuk. 

A második megközelítés a kényszergráf több, egymással kapcsolatban lévő rész- 
problémából álló fadekompozíció (tree decomposition) előállításán alapul. Mindegyik 
részproblémát függetlenül oldjuk meg, és a keletkező megoldásokat összekapcsoljuk. 
A legtöbb , oszd meg és uralkodj" típusú megközelítéshez hasonlóan ez is akkor műkö- 
dik, ha egyik részprobléma sem túl nagy. Egy fadekompozíciónak az alábbi követel- 
ményeket kell kielégítenie: 


s Az eredeti probléma mindegyik változója szerepeljen a részproblémák legalább 
egyikében. 

, Ha bármely két változót az eredeti problémában egy kényszer köt össze, akkor 
a részproblémák legalább egyikében együtt is elő kell fordulniuk (és természetesen 
a kényszernek ís). 

" Ha egy változó a fa két részproblémájában is előfordul, akkor a változónak az ezeket 
a részproblémákat összekötő út minden részproblémájában is elő kell fordulnia. 


Az első két kikötés biztosítja, hogy az összes változó és kényszer előforduljon a 
dekompozícióban. A harmadik kikötés eléggé technikai ízűnek tűnik, de egyszerűen 
csak arról szól, hogy bármely adott változónak ugyanazzal az értékkel kell rendelkez- 
nie az összes részproblémában, ahol előfordul — a részproblémákat a fában összekötő 
élek kényszerítik ezt ki. Például DA az 5.12. ábra mindegyik összekötött részproblémá- 
jában előfordul. Az olvasó az 5.11. ábra alapján igazolhatja, hogy van értelme ennek a 
dekompozíciónak. 

Külön-külön megoldhatjuk az egyes részproblémákat, és ha bármelyiknek is nincs 
megoldása, akkor az egész problémának nincs. Ha az összes részproblémát meg tudjuk 
oldani, akkor a következők szerint megpróbálhatunk összeállítani egy globális megol- 
dást. Először is tekintsünk minden egyes változót egy , megaváltozónak", amelynek 
tartománya a részprobléma összes megoldásának halmaza. Például az 5.12. ábra bal 
szélső részproblémája az a térképszínezési probléma, amelynek három változója és — 
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5.12. ábra Az 5.11. ábra (a) részén szereplő kényszergráf egy fa dekompozíciója 


ezek szerint — hat megoldása van (ezek egyike az (NyA — vörös, DA -— kék, ÚT — zöld). 
Ezután a részproblémákat összekötő kényszereket meg tudjuk oldani a fákra adott fent 
bemutatott hatékony algoritmussal. A részproblémák közti kényszerek egyszerűen 
csak azért vannak, hogy a részproblémák megoldásai megegyezzenek az osztott válto- 
zókban. Például, ha adott az (NyA — vörös, DA — kék, ÚT — zöld) megoldás az első 
részproblémára, akkor a következő részprobléma egyetlen konzisztens megoldása a 
(DA - kék, ÚT — zöld, 0 — vörös) lehet. 

Egy adott kényszergráfnak több dekompozíciója is lehetséges; a dekompozíció kivá- 
lasztásakor az a cél, hogy a részproblémák a lehető legkisebbek legyenek. Egy gráf fa- 
dekompozíciójának faszélessége (tree width) eggyel kisebb, mint a legnagyobb rész- 
probléma mérete; magának a gráfnak a faszélessége pedig definíció szerint a legkisebb 
faszélesség az összes fadekompozíciója között. Ha egy gráfnak w a faszélessége, és 
adott a megfelelő fadekompozíció, akkor a problémát meg lehet oldani O(na"t) idő- 
ben. Tehát egy felülről korlátos faszélességű kényszergráffal rendelkező kényszer- 
kielégítési probléma polinomiális időben megoldható. Sajnálatos módon egy minimális 
faszélességű fadekompozíció megtalálása NP-nehéz probléma, de vannak olyan heu- 
risztikus módszerek, amelyek jól működnek a gyakorlatban. 


5.5. ÖSSZEFOGLALÁS 


s A kényszerkielégítési problémák (CSP-k) változókból állnak, melyekre kényszerek 
vonatkoznak. Nagyon sok fontos valósvilág-beli probléma írható le kényszerkielé- 
gítési problémaként. A kényszerkielégítési problémák struktúrája egy kényszergráffal 
reprezentálható. 

, A visszalépéses keresés (backtracking search), a mélységi keresés egyik formája, a 
kényszerkielégítési problémák megoldásának gyakran alkalmazott eszköze. 
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s A legkevesebb fennmaradó érték (least-remaining value) heurisztika és a fok- 
szám- (degree-) heurisztika tárgyterület-független módszerek annak eldöntésére, 
hogy a visszalépéses keresés során melyik változót válasszuk ki következőnek. 
A legkevésbé korlátozó érték (least-constraining value) heurisztika segítségül 
szolgálhat a változóértékek sorrendezésében. 

e A visszalépéses algoritmus nagyban csökkenteni tudja a probléma elágazási ténye- 
zőjét a létrehozott részleges hozzárendelések következményeinek terjesztésével. 
Erre a legegyszerűbb módszer az előrenéző ellenőrzés (forward checking). Az él- 
konzisztencia (arc consistency) kikényszerítés egy jóval nagyobb teljesítőképes- 
ségű technika. de tovább is tart a futása. 

s Visszalépésre akkor kerül sor. amikor egy változóhoz már nem találunk hozzárendel- 
hető értéket. A konfliktusvezérelt visszaugrás (conflict-directed backjumping) 
közvetlenül a probléma okához ugrik vissza. A min-konfliktusok (min-conflicts) 
heurisztikát használó lokális keresést komoly sikerrel alkalmazták a kényszerkielé- 
gítési problémákra. 

s A kényszerkielégítési probléma komplexitása szorosan kötődik a saját kényszer- 
gráfjának struktúrájához. A fastruktúrájú problémák megoldhatók lineáris időben. 
A vágóhalmaz-kondicionálás (cutset conditioning) az eredeti kényszerkielégítési 
problémát fastruktúrájúvá alakíthatja. és nagyon hatékonynak bizonyul, ha sikerül kis 
vágóhalmazt találnunk. A fadekompozíció (tree decomposítion) technikák a kény- 
szerkielégítési problémát részproblémák fájává alakíthatják. és hatékonyak. ha a kény- 
szergráf faszélessége (tree width) kicsi. 





Irodalmi és történeti megjegyzések 


A kényszerkielégítéssel kapcsolatos legkorábbi munka a numerikus kényszerekhez 
kötődik. Az egész értékű egyenlőségi kényszereket Brahmagupta indiai matematikus 
tanulmányozta a 7. században. Ezeket gyakran diofantoszi egyenleteknek is nevezik 
Diofantosz görög matematikus (kb. 200-284) nyomán, aki valójában a pozitív racioná- 
lis számok esetét vizsgálta. A lineáris egyenlőségek változókiküszöböléssel történő 
megoldásának szisztematikus módszereit Gauss tanulmányozta (Gauss, 1829), a lineáris 
egyenlőtlenség alakú kényszerek megoldása Fourier-ig vezethető vissza (Fourier, 1827). 

A véges tartományú kényszerkielégítési problémáknak hosszú történetük van. A gráf- 
színezés például (amelynek a térképszínezés csak egy speciális esete) a matematika régi 
problémáinak egyike. Biggs és társai (Biggs és társai. 1986) szerint a négyszín-sejtést 
(minden síkbeli gráf kiszínezhető legfeljebb négy színnel) először Francis Guthrie. de 
Morgan egyik tanítványa fogalmazta meg 1852-ben. A feladat ellenállt a megoldási 
kísérleteknek — annak ellenére, hogy néhányan publikációkban az ellenkezőjét állítot- 
ták -, mígnem Appel és Haken (Appel és Haken, 1977) előállt egy számítógépre is 
támaszkodó bizonyítással. 

A kényszerkielégítési problémák egyes osztályai gyakran felmerültek a számítógép-tu- 
domány történetében. Az egyik legkorábbi nagy hatású példa a SKETCHPAD rendszer volt 
(Sutherland, 1963), amely geometriai kényszereket oldott meg diagramokban, és a modern 
rajzolóprogramok és CAD-programok előfutárának tekinthető. A kényszerkielégítési 
problémák általános problémaosztályként történő azonosítása Ugo Montanari (Montanari, 
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1974) nevéhez fűződik. A magasabb rendű kényszerkielégítési problémák visszavezetése 
segédváltozók felvételével tisztán bináris esetre (lásd 5.11. feladat) eredetileg a 19. száza- 
di Jogikushoz, Charles Sanders Peirce-hez fűződik. A CSP-irodalomba Dechter (Dechter, 
1990b) vezette be, majd Bacchus és Van Beek (Bacchus és van Beek, 1998) dolgozták ki. 
A megoldásokra vonatkozó preferenciákkal kiegészített kényszerkielégítési problémákat 
széles körben tanulmányozza az optimalizáció irodalma; lásd (Bistarelli és társai, 1997)-et 
a CSP-keretrendszer preferenciákat is megengedő általánosításáról. A vödör-eliminációs 
algoritmus (Dechter, 1999) szintén alkalmazható az optimalizációs problémákra. 

A kényszerkielégítési problémák visszalépéses keresése Bitnertől és Reingoldtól (Bitner 
és Reingold, 1975) származik, noha ők az alapalgorítmust a 19. századig követik vissza. 
Bitner és Reingold az MRV. -heurisztikát is bevezették (ők ezt leginkább-korlátozott-érték he- 
urisztikának nevezték). Az MRV-heurisztika utáni eldöntetlen helyzetek megoldására Brelaz 
(Brelaz, 1979) a fokszám-heurisztikát alkalmazta. Az így létrejövő algoritmus, minden egy- 
szerűsége ellenére, máig a leghatékonyabb tetszőleges gráfok k-színezésére. A legkevésbé- 
korlátozó-érték heurisztikát Haralick és Elliot javasolták (Haralick és Elliot, 1980). 

A kényszerterjesztési módszereket Waltz (Waltz, 1975) sikere tette népszerűvé, 
amelyet a számítógépes látásnál felmerülő poliéder-élcímkézési problémán ért el. 
Waltz megmutatta, hogy sok probléma esetén a kényszerterjesztés teljesen kiküszöböli 
a visszalépést. Montanari (Montanari, 1974) bevezette a kényszerhálózat és az útvo- 
nalkonzisztencia-terjesztés fogalmát. Alan Mackworth (Mackworth, 1977) javasolta 
az AC-3 algoritmust az élkonzisztencia betartatására, csakúgy. mint annak általános 
lehetőségét, hogy valamilyen fokú konziszentencia-ellenőrzést építsünk be a vissza- 
lépéses algorítmusba. Az AC-4, egy jóval hatékonyabb algoritmus, melyet Mohr és 
Henderson fejlesztettek ki (Mohr és Henderson, 1984). Nem sokkal Mackworth cik- 
kének megjelenése után a kutatók elkezdtek kísérletezni a konzisztencia-ellenőrzések 
költsége és a kereséslevágásban jelentkező előny csereviszonyának feltérképezésével. 
Haralick és Elliot (Haralick és Elliot, 1980) a McGregor által leírt (McGregor, 1979) 
minimális előrenéző ellenőrzés mellett álltak ki, míg Gaschnig (Gaschnig, 1979) minden 
egyes változó-hozzárendelés után élkonzisztencia-ellenőrzéseket javasolt (ezt az algorit- 
must nevezte később Sabin és Freuder (Sabin és Freuder, 1994) MAC-nak). Az utóbbi 
cikk valamennyire meggyőző bizonyítékot hoz fel amellett, hogy nehezebb problé- 
máknál kifizetődik a teljes élkonzisztencia-ellenőrzés. Freuder (Freuder 1978. 1982) 
megvizsgálta a k-konzisztenciát és ennek kapcsolatát a kényszerkielégítési problémák 
megoldásának komplexitásával. Apt (Apt, 1999) egy általános algoritmikus keretrend- 
szert mutat be a konzisztenciaterjesztési algoritmusok vizsgálatára. 

A magasabb rendű kényszerek kezelésének külön módszerei elsősorban a kényszer- 
logikai-programozás (constraint logic programming) keretein belül alakultak ki. 
Marriott és Stuckey (Marriott és Stuckey, 1998) nagyszerű összefoglalást nyújt erről a 
kutatási területről. A MindKül kényszert Regin (Regin, 1994) tanulmányozta. AZ alsó 
és felső határokból álló kényszereket Van Hentenryek és társai vezették be a kényszer- 
logikai programozásba (Van Hentenryck és társai, 1998). 

Az alapvető visszaugró módszer John Gaschnigtől (Gaschnig, 1977; 1979) származik. 
Kondrak és van Beek (Kondrak és Van Beek, 1997) megmutatták, hogy ezt az algoritmust 
lényegében magában foglalja az előrenéző ellenőrzés. A konfliktusvezérelt visszaugrást 
Prosser (Prosser, 1993) alakította ki. AZ intelligens visszalépés legáltalánosabb és legerő- 
sebb formáját tulajdonképpen már nagyon korán kifejlesztette Stallman és Sussman 
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(Stallman és Sussman, 1977). Technikájuk, a függőségvezérelt visszalépés (dependen- 
cy-directed backtracking) az igazság-karbantartó rendszerek (truth maintenance 
systems) kifejlesztéséhez vezetett (Doyle, 1979), amelyekkel a 10.8. alfejezetben foglal- 
kozunk. A két terület közti kapcsolatot De Kieer (De Kleer, 1989) vizsgálta. 

Stallman és Sussman munkája a kényszerfeljegyzés (constraint recording) elkép- 
zelését is bevezette: a keresés által elért részleges eredményeket elmentjük és a keresés 
során később felhasználjuk. Ezt az elképzelést a visszalépéses keresésbe formális mó- 
don Dechter (Dechter, 1990a) vezette be. A visszajegyzés (backmarking) (Gaschnig, 
1979) egy különlegesen egyszerű módszer, amelyben a konzisztens és inkonzisztens 
páronkénti hozzárendeléseket elmentjük. hogy elkerüljük a kényszerek későbbi újrael- 
lenőrzését. A visszajegyzés ötvözhető a konfliktusvezérelt visszaugrással: Kondrak és 
"Van Beek (Kondrak és Van Beek, 1997) bemutatnak egy hibrid algoritmust, amely bi- 
zonyíthatóan tartalmazza mindkét külön módszert. A dinamikus visszalépés (dynamic 
backtracking (Ginsberg, 1993) megőrzi a változók későbbi részhalmazaiból származó 
sikeres parciális hozzárendeléseket, amikor egy olyan korábbi választási pontra ugrik 
vissza, amely a későbbi sikert nem teszi érvénytelenné. 

A kényszerkielégítési problémák lokális keresését Kirkpatrick és társai (Kirkpatrick 
És társai, 1983) szimulált lehűtésről (simulated annealing) (lásd 4. fejezet) szóló mun- 
kája tette népszerűvé, és ezt széles körben alkalmazták az ütemezési problémáknál. 
A min-konfliktusok heurisztikát először Gu (Gu, 1989) javasolta, és tőle függetlenül 
Minton és társai (Minton és társai, 1992) is kifejlesztették. Sosic és Gu (Sosic és Gu, 
1994) megmutatta, hogyan lehet ennek a heurisztikának az alkalmazásával a 3000 000- 
királynő problémát kevesebb, mint egy perc alatt megoldani. A bámulatos siker, amit a 
min-konfliktusokat használó lokális keresés ért el az n-királynő problémában, a , könnyű" 
és a , nehéz" problémák természetének és elterjedtségének újraértékeléséhez vezetett. 
Peter Cheesman és társai (Cheesman és társai, 1991) feltérképezték a véletlenszerűen 
generált kényszerkielégítési problémák nehézségét, és azt találták, hogy majdnem min- 
den ilyen probléma vagy triviálisan könnyű, vagy megoldhatatlan. Csak akkor találunk 
. nehéz" probléma példányokat, ha a problémagenerátor paramétereit egy bizonyos 
szűk tartományba állítjuk be, melyen belül a problémák közelítőleg fele megoldható. 
Ezzel a jelenséggel a 7. fejezetben foglalkozunk részletesebben. 

A kényszerkielégítési problémák struktúrájának és nehézségének kapcsolatával fog- 
lalkozó kutatást Freuder (Freuder, 1985) indította el, aki megmutatta, hogy az élkon- 
zisztens fák esetében a keresés visszalépések nélkül fut le. Egy hasonló eredmény az 
aciklikus hipergráfokra való kiterjesztésével együtt jött létre az adatbázisokkal foglal- 
kozó kutatói közösségben (Beeri és társai, 1983). Ezen cikkek publikálása óta komoly 
haladás történt a kényszergráf struktúrája és a kényszerkielégítési probléma megoldási 
komplexitásának kapcsolatát illetően. A faszélesség fogalmát a gráfelmélettel foglalko- 
26 Robertson és Seymour (Robertson és Seymour, 1986) vezették be. Freuder munkás- 
ságára építve Dechter és Pearl (Dechter és Pearl, 1987, 1989) ugyanezt a fogalmat — amit 
ők indukált szélességnek (induced width) hívtak — alkaimazták a kényszerkielégítési 
problémákra és kifejlesztették az 5.4. alfejezetben felvázolt fadekompozíciót. Az adat- 
bázis-elméletre és erre az eredményre alapozva Gottlob és társai (Gottlob és társai, 
1999a, 1999b) kialakították a kényszerkielégítési probléma hipergráfként történő felfo- 
gásán alapuló hiperfaszélesség (hypertree width) fogalmat. Annak megmutatásán túl, 
hogy minden w szélességű hiperfa-CSP megoldható O(w"tlogn) időben, azt ís bebizo- 
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nyították, hogy a hiperfaszélesség az összes korábbi , szélesség"-mértéket magában 
foglalja (abban az értelemben, hogy bizonyos estekben a hiperfaszélesség korlátozott, 
bizonyos esetekben pedig nem). 

Sok jó áttekintés létezik a CSP-technikákhoz, például Kumar (Kumar, 1992), Dechter és 
Frost (Dechter és Frost, 1999) és Bartak (Bartak, 2001); továbbá a Dechter-től (Dechter, 
1992) és Mackworthtől (Mackworth, 1992) származó enciklopédiacikkek. Pearson és 
Jeavons (Pearson és Jeavons, 1997) a könnyen kezelhető CSP-osztályokat veszik szám- 
ba, beleértve mind a strukturális dekompozíciós módszereket, mind a maguknak a tarto- 
mányoknak vagy a kényszereknek a tulajdonságaira támaszkodó módszereket. Kondrak 
és Van Beek (Kondrak és Van Beek, 1997) a visszalépéses keresési algoritmusok anali- 
tikus áttekintését adják, Bacchus és Van Run (Bacchus és Van Run, 1998) pedig empi- 
rikusabb képet festenek. Tsang (Tsang, 1993), valamint Marriott és Stuckey (Marriott és 
Stuckey, 1998) szövegei jóval mélyebbre hatolnak a témában, mint azt a fejezet korlátai 
számunkra lehetővé tették. Sok érdekes alkalmazást mutat be a Freuder és Mackworth 
szerkesztésében megjelent gyűjtemény (Freuder és Mackworth, 1994). Kényszerkielégi- 
téssel foglalkozó cikkek rendszeresen jelennek meg az Artificial Intelligence-ben és egy 
specialistáknak szóló újságban, a Constraintsben. A legfőbb konferenciakiadvány az 
International Conference on Principles and Practice of Constraint Programming, amit 
gyakran CP-nek hívnak. 


Feladatok 

5.1. — Fogalmazza meg a saját szavaival a kényszerkielégítési problémák, a kénysze- 
rek, a visszalépéses keresés, az élkonzisztencia, a visszaugrás és a min-konflik- 
tusok definícióját. 

5.2. — Hány megoldása van az 5.1. ábra térképszínezési problémájának? 

5.3. Magyarázza el, miért jó heurisztika a leginkább korlátozott változót és a leg- 


kevésbé korlátozott értéket választani a kényszerkielégítési probléma megoldá- 
sának keresése közben. 





5.4. — Tekintsük a keresztrejtvények készítésének (nem megoldásának) problémáját: 
szavakat kell illeszteni egy négyszögletes rácsba. A rács, amely része a problé- 
ma specifikációjának. megadja, hogy mely négyzetek legyenek üresek és melyek 
sötétek. Tegyük fel, hogy adott a szavak egy listája (például egy szótár), és az 
a feladat, hogy az üres négyzeteket a lista tetszőleges részhalmazát használva 
kitöltsük. Fogalmazza meg pontosan ezt a problémát kétféle módon: 

(a) Mint általános keresési problémát. Válasszon egy megfelelő keresési algo- 
ritmust, és specifikálja a heurisztikus függvényt (amennyiben elképzelése 
szerint szüksége van rá). A fehér kockákba egyszerre egy betűt vagy egész 
szavakat érdemes-e beírni? 


5 Ginsberg és társai (Ginsberg és társai, 1990) több módszert tárgyalnak keresztrejtvények készítésére. 
Litman és társai pedig a nehezebb problémát, megoldásukat veszik célba (Littman és társai, 1999). 
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5.5. 


5.6. 


Bet; 


5.8. 


5.9. 


5.10. 


5.11. 


(b) Mint kényszerkielégítési problémát. A változók betűk vagy szavak legyenek? 
Melyik megfogalmazást tartja jobbnak? Miért? 


Adjon precíz megfogalmazást az alábbiakra mint kényszerkielégítési problémákra: 

(a) Négyszögletes kirakó: találjon nemátfedő helyeket egy nagy négyszögben 
kisebb négyszögek számára. 

(b) Órarend-ütemezés: adott számú professzor és terem van, valamint rögzí- 
tett az órarendi órák listája is a lehetséges időablakokkal együtt. Mindegyik 
professzorhoz adott az általa tartott órák halmaza. 


Oldja meg az 5.2. ábra betűrejtvényét kézzel, visszalépéses kereséssel, előrenéző el- 
lenőrzéssel, valamint az MRV-., illetve a legkevésbé korlátozó érték heurisztikával. 


Az 5.5. ábra a különböző algoritmusokat az n-királynő problémán teszteli. Pró- 
bálja meg ugyanezt egy véletlenszerűen generált térképszínezési problémával 
is: osszon el az egységsíkon véletlenszerűen " pontot, válasszon ki véletlensze- 
rűen egy X pontot, kösse X-et a legközelebbi olyan F ponthoz, amelyikkel X még 
nincs összekötve, és a vonal semelyik más vonalat nem metsz; ismételje a fenti 
lépést mindaddig, amíg újabb összeköttetés már nem lehetséges. Számítsa ki a 
teljesítménytáblázatot a legnagyobb n-re, amire csak tudja (mind d — 3-at mind, 
d — 4-et használva). Fűzzön magyarázatokat a kapott eredményhez. 


Az AC-3 algoritmus felhasználásával mutassa meg, hogy az élkonzisztencia 
alkalmas arra, hogy kimutassa az 5.1. ábra (NyA — vörös, V — kék) parciális 
hozzárendelésének inkonzisztenciáját. 


Mi a fastruktúrájú kényszerkielégítési problémán futtatott AC-3 legrosszabb 
esetbeli komplexitása? 


Az AC-3 visszarak a sorba minden (X4, X;) élet, amikor X; tartományából bár- 
mely értéket töröltek, akkor ís, ha X, minden értéke konzisztens X; több fenn- 
maradó értékével. Tegyük fel, hogy minden egyes (X4, X;) élhez nyilvántartjuk a 
fennmaradó X; értékek számát, amelyek az X, minden egyes értékével konzisz- 
tensek. Magyarázza el, hogyan lehet hatékonyan frissíteni ezeket az értékeket, és 
hogyan lehet ennek segítségével az élkonzisztenciát O(r?d?) lépésben elérni. 


Mutassa meg, hogy egy temáris kényszer, mint például az .,A -- B — C" egy se- 
gédváltozó bevezetésével három bináris kényszerré alakítható. Feltételezheti, 
hogy a tartományok végesek. (Segítség: gondoljon egy olyan új változóra, amely- 
nek értékei más értékekből álló párok, és gondoljon olyan kényszerekre, mint 
.X az első eleme az Y pámak".) Ezután mutassa meg, hogyan lehet hasonlóan 
kezelni a háromnál több változót tartalmazó kényszereket. Végül mutassa meg, 
miként lehet kiküszöbölni az unáris kényszereket a változók tartományának meg- 
változtatásával. Ez teljessé teszi annak bizonyítását, hogy bármely CSP átalakít- 
ható olyan problémákká, melyek csak bináris kényszereket tartalmazhatnak. 
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5.12. Tegyük fel, hogy ismerjük egy gráfról, hogy van egy legfeljebb k csomópontot 


lan 


tartalmazó ciklikusság-vágóhalmaza. Írjon le n változós CSP-k esetén egy egy- 
szerű algoritmust a minimális ciklikusság-vágóhalmaz megkeresésére, ahol a 
futási idő maximuma O(r). Végezzen irodalomkutatást olyan vágóhalmaz-ke- 
resési eljárások után, amelyek a vágóhalmaz méretében közelítőleg polinomiális 
időben találnak közelítőleg minimális ciklikusság-vágóbalmazt. Praktikussá 
teszi az ilyen módszerek létezése a ciklikusság-vágóhalmaz módszereket? 


5.13. Tekintsük a következő logikai rejtvényt: Öt különböző színű házban öt külön- 


böző nemzetiségű személy él, és mindegyikük más márkájú cigarettát, más italt 
és más háziállatot szeret. Az alábbi tények alapján a megválaszolandó kérdés 
a következő: , Hol lakik a zebra, és melyik házban isznak vizet?" 

Az angol a vörös házban lakik. 

A spanyolnak kutyája van. 

A norvég balról az első házban lakik. 

A Kools cigarettát a sárga házban szívják. 

A Chesterfieldset szívó ember a rókás ház mellett lakik. 

A norvég a kék ház mellett lakik. 

A Winstont szívó ember kígyókat tart. 

A Lucky Strike-ot szívó narancslevet iszik. 

Az ukrán teát iszik. 

A japán Parliamentset szív. 

A Koolsot abban a házban szívják, amely mellett lovat tartanak. 

Kávét a zöld házban isznak. 

A zöld ház közvetlenül jobbra (Ön felől nézve) van az elefántcsontszínű háztól. 

Tejet a középső házban isznak. 
Vizsgálja meg a probléma különböző CSP-reprezentációit. Milyen okokból ré- 
szesítené előnyben az egyiket a másikkal szemben? 


6. KERESÉS —— 
ELLENSÉGES KÖRNYEZETBEN 


Ebben a fejezetben azokat a problémákat vizsgáljuk meg, amelyek akkor merülnek fel, 
amikor egy ágens előre tervez ellenséges ágenseket tartalmazó világban. 


6.1. KÉTSZEMÉLYES JÁTÉKOK! 


A 2. fejezetben többágenses környezeteket (multiagent environments) vezettünk be, 
ahol minden ágensnek számolnia kell más ágensek cselekvéseivel és azzal is, hogy 
azok hogyan befolyásolják a jólétét. Más ágensek nem megjósolható viselkedése szá- 
mos lehetséges eshetőséget (contingencies) visz be az ágens problémamegoldásába, 
ahogy ezzel a 3. fejezetben foglalkoztunk. A 2. fejezetben bevezettük a több ágensből 
álló kooperatív (cooperative) és verseny- (competitive) környezeteket is. A verseny- 
környezetek, ahol az ágensek céljai konfliktusban vannak, elvezetnek az ellenségek 
melletti kereséshez (adversarial search) — amit sokszor kétszemélyes játékoknak 
(games) nevezünk. 

A matematikai játékelmélet (game theory) a gazdaságtan egyik ága, mely a több- 
ágenses környezeteket játéknak tekinti, feltéve, hogy egy-egy ágens hatása másokra 
, Szígnifikáns", függetlenül attól, hogy az ágensek kooperatívak vagy versengők.2 Az MI- 
ben a , játékok" általában igen specializáltak — amit a játékelméleti szakemberek deter- 
minisztikus, váltott lépésű, kétszemélyes, zérusösszegű teljes információjú játékoknak 
(zero-sum games of perfect information) neveznek. A mi nyelvezetünkben ez azt 
jelenti, hogy két ágens helyezkedik el egy determinisztikus és teljesen megfigyelhető 
környezetben, a cselekvéseik váltják egymást, és a játék végén a hasznosságértékeik 
mindig azonosak és ellentétes előjelűek. A sakkban például, ha az egyik játékos győz 
(4-1), akkor a másik szükségszerűen veszít (—1). Éppen a hasznosságértékekben tapasz- 
talt ellentéttől lesz a helyzet ellenséges. Ebben a fejezetben röviden foglalkozunk a több- 
játékos játékokkal, a nem zérusösszegű játékokkal és a sztochasztikus játékokkal, de 
a tényleges játékelmélettel csak a 17. fejezetben fogunk foglalkozni. 

A játékok a civi ió kezdete óta — néha már ijesztő mértékben — foglalkoztatják az 
emberek intellektuális képességeit. A játékok absztrakt természetük miatt vonzó terüle- 
tet jelentenek az MI-kutatók számára. Egy játék állását könnyű reprezentálni. és az 
ágensek képességei általában kisszámú, jól definiált eredményre vezető cselekvésre kor- 






1 Annak ellenére, hogy az angol .game" szó magyar szó szerinti fordítása játék". úgy éreztük. hogy az ilyen 
fordítás magyarul összemossa a , game" és a ,10y" közötti különbséget. A , kétszemélyes játékok" szóhaszná- 
tat alkalmas kompromisszum, annak ellenére, hogy az ebben a fejezetben tárgyalt módszerek olyan , kétszemé- 
lyes játékokra" is kiterjeszthetők, ahol több játékos van. (A ford.) 

2 A nagyon sok ágensből álló környezeteket jobb gazdaságoknak (economies) és nem játékoknak nézni. 
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látozódnak. Az olyan fizikai játékoknak, mint a krikett vagy a jégkorong, sokkal bonyo- 
lultabb a leírása. Sokkal több lehetséges cselekvéssel rendelkeznek, és a cselekvések le- 
gális voltát éppenséggel nem túl precíz szabályok határozzák meg. A robotfutballt kivé- 
ve e fizikai játékok az MI-közösségben sok érdeklődést nem keltettek. 

A kétszemélyes játékok az egyik legrégebbi, az MI által vizsgált területet jelentik. 
1950-ben, alighogy a számítógépek programozhatóvá váltak, Konrad Zuse (az első prog- 
ramozható számítógép és az első programozási nyelv megalkotója), Claude Shannon (az 
információelmélet atyja), Norbert Wiener (a korszerű szabályozáselmélet megteremtője) 
és Alan Turing elkezdtek sakkprogramokkal foglalkozni. Azóta a játékok színvonala s0- 
kat fejlődött, addig a szintig, hogy a gépek túlszárnyalták az embert dámajátékban és 
Othellóban, megverték (bár nem minden alkalommal) ostáblában és sakkban az emberi 
bajnokokat, és versenyképesek más játékokban is. Kivétel a gó, ahol a számítógép csak 
amatőr szinten játszik. 

A 3. fejezetben tanulmányozott játékproblémákkal ellentétben a kétszemélyes játé- 
kok azért érdekesek, mert nagyon nehéz őket megoldani. A sakknál például az átlagos 
elágazási tényező 35, és egy játék során gyakran előfordul, hogy mindkét fél 50-50 lé- 
pést is megtesz, vagyis a keresési fának 3599, illetve 105 csomópontja van (bár a ke- 
resési gráfnak ebből , csak" 109 különböző csomópontja lesz). A játékok, éppúgy, mint 
a valós világ, azt a képességet igénylik, hogy valamilyen döntést hozzunk, akkor is, ha 
az optimális döntés kiszámítása kivitelezhetetlen. A játékok nagyon komolyan büntetik 
a rossz hatékonyságot. Míg az A" algoritmus azon implementációja, ami csak fele olyan 
hatékony, egyszerűen csak kétszer annyi ideig fut, hogy megkapja az eredményt, addig 
egy olyan sakkprogramot, amely feleolyan hatékonyan gazdálkodik az idejével, feltéve, 
hogy minden más szempontból egy másik implementációval azonos, valószínűleg a föld- 
be döngölnének. A játékelméleti kutatás ezért számos érdekes ötlethez vezetett, hogy a 
rendelkezésre álló időt hogyan használjuk a lehető legjobb módon. 

A probléma tárgyalását az elméletileg lehetséges legjobb lépés definíciójával és en- 
nek egy keresőalgoritmusával kezdjük. Ezek után olyan technikákat nézünk meg, ame- 
lyek korlátozott idő alatt is alkalmasak egy jó lépés megválasztására. A nyesés vagy 
metszés (pruning) lehetővé teszi számunkra, hogy figyelmen kívül hagyjuk a keresési 
fa azon részeit, amelyek nincsenek befolyással a végső választásra. A heurisztikus 
kiértékelő függvények (evaluation functions) lehetővé teszik, hogy kimerítő keresés 
nélkül meg tudjuk becsülni egy adott állapot valódi hasznosságát. A 6.5. alfejezet 
olyan kétszemélyes játékokat tárgyal, amelyekben a véletlen is megjelenik, mint példá- 
ul az ostábla.? Foglalkozunk a briddzsel is, amely tartalmazza a hiányos információ 
(imperfect information) elemeit, hiszen egy-egy játékos számára az összes kártya nem 
ismert. Megnézzük végül, hogy a jelenlegi legfejlettebb játékprogramok hogyan győzik 
le az erős emberi ellenfeleket, és milyenek a jövőbeli trendek. 





3 Az ostábla (backgammon) Magyarországon nem annyira elterjedt. bár számos vidéken ismert. A lényege, 
hogy egy speciális táblán, felváltva lépve, a bábukat az ellenfél térfelére juttassuk. Fő érdekessége, ami a ne- 
hézségek forrása is egyben, hogy a legális lépések mindenkori választéka véletlenszerűen - egy kockadobásnak 
megfelelően — alakul. (A ford.) 
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6.2. OPTIMÁLIS DÖNTÉSEK KÉTSZEMÉLYES 
JÁTÉKOKBAN 


A kétszemélyes játékokkal fogunk foglalkozni, ahol a két játékost — a hamarosan nyil- 
vánvalóvá váló okból - MAX-nak és MIN-nek fogjuk hívni. Max lép először, majd a já- 
tékosok felváltva lépnek, amíg a játék véget nem ér. A játék végén a győztes játékos pon- 
tokat kap (vagy néha a vesztes kap büntetőpontokat). A játékot formálisan egyfajta kere- 
sési problémaként lehet definiálni az alábbi komponensekkel: 


s A kiinduló állapot (initial state), ami magában foglalja a táblaállást, valamint azt, 

hogy ki fog lépni. 

" Egy állapotátmenet-függvény (successor function), amely (lépés, állapot) párok 

listájával tér vissza, megadva a legális lépéseket és az azokból következő állapotokat. 

s Egy végteszt (terminal test), ami meghatározza, hogy a játéknak mikor van vége. 

Azok az állapotok, ahol a játék befejeződött, a végállapotok (terminal states). 

. Egy hasznosságfüggvény (utility function, amit nyereségfüggvénynek — payoff 
function — is neveznek) a játék végeredményéhez egy számértéket rendel. A sakkban 
a végeredmény győzelem, vereség vagy döntetlen lehet, amit a --1, -1 és 0 értékek- 

. kel ábrázolhatunk. Néhány játék ennél több végeredményre vezethet. Például az os- 
táblában a nyereség -t-192 és -192 között változhat. Ebben a fejezetben főleg a zérus- 
összegű játékokka! foglalkozunk. bár a nem zérusösszegű játékokat is megemlítjük. 
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Hasznosság 


6.1. ábra. A 3 x 3-as amőbajáték (részleges) keresési fája. A legfelső csomópont a kiinduló állapot. MAX 
lép először, egy x-et téve valamelyik üres négyzetbe. A keresési fa egy részét mutatjuk, MIN (0) és MAX 
váltakozó, egymást követő lépéseit megadva, amíg el nem érjük a végállapotokat, melyekhez a játék sza- 
bályai szerint lehet hasznossági értékeket hozzárendelni. 
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A kezdeti állapot és mindkét fél legális lépései a játék játékfáját (game tree) definiál- 
ják. A 6.1. ábra a 3 x 3-as amőbajáték keresési fájának egy részét mutatja. Kezdeti ál- 
lapotban MAXx-nak kilenc lehetséges lépése van. A játék során MAX és MIN felváltva tesz- 
nek x-et illetve 0-t, míg egy végállapotnak megfelelő levélcsomópontba el nem jutnak, 
ahol az egyik játékosnak egy sorban, egy oszlopban vagy az egy átló mentén három 
0-ja vagy X-e lesz, vagy minden négyzet ki lesz töltve. Az egyes levélcsomópontok alatt 
található számok a végcsomópontnak a MAX szempontjából mért hasznosságát jelölik. 
A nagy értékekről feltételezzük, hogy jók MAX számára és rosszak MIN számára (ami- 
ből a játékosok neve is ered). MAX feladata. hogy a játékfát (és főleg a végállapotok 
hasznosságát) a legjobb lépés meghatározására használja fel. 


Optimális stratégiák 


Egy normális keresési problémánál, az optimális megoldás nem lenne más, mint a cél- 
állapothoz vezető lépések szekvenciája — azaz egy olyan végállapothoz vezető lépés- 
szekvencia, amely a győzelmet jelenti. Egy játékban azonban MIN-nek is van beleszó- 
lása a dologba. Ezért MAX-nak egy olyan stratégiát (strategy) kell találnia, amely 
meghatározza MAX lépését a kezdeti állapotban, majd a MIN lehetséges válaszaiból 
keletkező állapotokban, majd ismét MAX lépéseit a MIN erre vonatkozó lehetséges vá- 
laszaiból keletkező állapotokban és így tovább. Nagyjából azt lehet mondani, hogy egy 
optimális stratégia olyan kimenetelekhez vezet, amelyek legalább olyan jók, mintha 
bármilyen más stratégiával egy tévedhetetlen opponens ellen játszanánk. Először meg- 
mutatjuk, hogyan kell megkeresni az optimális stratégiát, bár ennek kiszámítására MAX- 
nak általában nem lesz elegendő ideje az amőbánál bonyolultabb játékokban. 

Még egy olyan egyszerű játék, mint az amőba is túl bonyolult ahhoz, hogy megmu- 
tassuk a teljes keresési fát, ezért áttérünk a 6.2. ábrán látható abszolút triviális játékra. 
MAX lehetséges lépéseit a-gyel, a2-vel és az-mal címkéztük meg. Az aj-re MIN lehet- 
séges válaszait a b,, ba, bz stb. jelölik. Ez a konkrét játék MAX és MIN egy-egy lépése 


MAX 


MIN 








3 12 8 2 4 6 14 5 2 


6.2. ábra. Egy lépésváltásos játékfa. A A csomópontok MAX lépéseit, míg a W csomópontok MIN lépése- 
ít jelölik. A végcsomópontok a hasznossági függvénnyel számított hasznossági értékeket MAX szemsző- 
géből mutatják, míg a többi csomópontnál a minimax értékét jelöltük be. MAX legjobb lépése a gyökér- 
ben aj, mert ez vezet a legmagasabb minimax értékű követőhöz. MIN legjobb válasza bj, mert ez vezet a 
minimális minimax értékű követőhöz. 
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után véget ér. (A játékok nyelvén azt mondjuk, hogy ez a fa egy lépés mély és két fél 
lépésből vagy lépésváltásból (ply) áll.) A végcsomópontok hasznossága ebben a já- 
tékban 2 és 14 közé esik. 

Adott játékfa mellett az optimális stratégia meghatározásához az egyes csomópontok 
minimax értékét kell megvizsgálni, amit MINIMAX-ÉRTÉK(11)-ként írunk le. Egy csomó- 
pont minimax értéke a csomópont hasznossága MAX szemszögéből, feltéve, hogy innen 
kezdve egészen a játék befejezéséig mindkét játékos optimálisan lép. Egy végállapot 
minimax értéke természetesen a saját hasznossága. Továbbá, adott minimax értékek 
mellett. MAX szeretne a maximális értékű, MIN pedig a minimális értékű állapotba jutni. 
Rendelkezünk tehát az alábbi függvénnyel: 


MINIMAX-ÉRTÉK(r) — 


HASZNOSSÁG(?) ha n egy végállapot, 
"Max , e Követőkíny MINIMAX-I ÉRTÉK(5) ha n egy MAX csomópont, 
Min; e köverőktry MINIMAX-I ÉRTÉK(5) ha n egy MIN csomópont. 


Alkalmazzuk ezeket a definíciókat a 6.2. ábrán látható játékfára. Az ábra alján lévő cél- 
állapotokat már felcímkéztük hasznossági értékükkel. Az első, B címkéjű, MIN csomó- 
pontnak három követője van 3, 12 és 8 értékkel, a B csomópont minimax értéke tehát 
3. Hasonlóan a két másik MIN csomópontnak 2 a minimax értéke. A gyökér egy MAX 
csomópont; a követőinek minimax értékei 3, 2, és 2, így a gyökér minimax értéke 3. 
Azonosíthatjuk a gyökér minimax döntését (minimax decision) is. MAX számára az aj 
cselekvés az optimális választás, mert maximális értékű követőhöz vezet. 

Ezen optimális játékdefiníció MAX számára feltételezi, hogy MIN is optimálisan ját- 
szik - hiszen a dolgok kimenetelét MAX számára a legrosszabb esetre kivetítve maxima- 
lizálja. Mi van azonban, ha MIN nem játszik optimálisan? Ekkor könnyű belátni (6.2. 
feladat), hogy MAX még jobban jár. Szuboptimális ellenféllel! szemben sok stratégia el- 
képzelhető, amely az optimálisnál jobb, azonban ezek a stratégiák rosszabbnak fognak 
bizonyulni optimális ellenfelekkel szemben. 


A minimax algoritmus 


A minimax algoritmus (minimax algorithm) (6.3. ábra) az optimális döntést az aktu- 
ális állapotból számítja ki, felhasználva az egyes követő állapotok minimax értékeinek 
kiszámítására a definiáló egyenletekből közvetlenül származtatott, egyszerű rekurzív 
formulát. A rekurzió egészen a falevelekig folytatódik, majd a minimax értékeket a fa 
mentén visszafelé terjesztjük (back-up), ahogy a rekurzió visszalép. A 6.2. ábrán pél- 
dául az algoritmus először rekurzív módon leereszkedik a három bal alsó csomópont- 
hoz, a HASZNOSSÁG függvénnyel kiszámítva, hogy az értékek rendre 3. 12, és 8. Majd 
az algoritmus előveszi ezen értékek minimumát, azaz 3-t, és ezt adja vissza, ahogy a 
B csomóponthoz visszatér. Hasonló procedúra eredményezi a további visszaadott 
értékeket: 2-t a C és 2-t a D csomópont számára. Végül vesszük a 3, 2 és 2 értékek 
maximumát, hogy a gyökér által visszaadott 3-as értéket megkaphassuk. 

A minimax algoritmus a játékfa teljes mélységi feltárását végzi. Ha a fa maximális 
mélysége m, és minden csomópontban b legális lépés létezik, akkor a minimax algorit- 


214 6. KERESÉS ELLENSÉGES KÖRNYEZETBEN 





function MINIMAX-DöNTÉs(állapot) returns egy cselekvés 
inputs: állapot, a játék aktuális állapota 


4 §— MAX-ÉRTÉK(állapon 
return v értékű cselekvés KÖVETŐÁLLAPOTOK[állapor)-ban 





function MAx-ÉRTÉK(állapot) returns egy hasznossági érték 
if Véc-TEszr(átlapot) then return HASZNOssáG(állapoi) 
ve -o0 
for minden s € KÖVETŐÁLLAPOTOK(állapot) do 
v — MAx(v, MIN-ÉRTÉK(5)) 
return v 





function MIx-ÉRTEK( állapot) returns egy hasznossági érték 
ir VéG-Teszt(állapot) then return HAsznosság(állapot) 
vo 
for minden s € KÖVETŐÁLLAPOTOK(állapor) do 
v — MINI, MAX-ÉRTÉK(5)) 
return v 











6.3. ábra. Egy algoritmus a minimax döntések kiszámítására. Az algoritmus a lehető legjobb lépéshez 
tartozó operátort adja vissza, vagyis ahhoz a lépéshez tartozó operátort, amelyik a legnagyobb hasznos- 
sági értékkel rendelkező eredményre vezet, feltételezve. hogy az ellenfél úgy játszik, hogy minimalizálja 
a hasznossági értéket. A MAX-ÉRTÉK és MiN-ÉRTÉK függvények végigmennek a teljes játékfán, le egészen 
a levélcsomópontokig, hogy meghatározzák a csomópont felfelé terjesztett értékét. 


mus időkomplexitása 0(b""). A tárkomplexitása O(bm) egy olyan algoritmus számára, 
amely az összes követőt egyszerre számítja ki, és O(m) egy olyan algoritmus esetében, 
amely a követőket egyenként generálja (lásd 115-116. oldal). Valós játékok esetén ez 
az időkomplexitás az algoritmust teljesen haszontalanná teszi, az algoritmus azonban jó 
alap a játékok matematikai elemzéséhez és a gyakorlati szempontból alkalmasabb algo- 
ritmusokhoz. 


Optimális döntések többszemélyes játékokban 


Számos elterjedt játékban több játékos is részt vehet, nem csupán kettő. Vizsgáljuk meg, 
hogy a minimax ötletet hogyan terjeszthetjük ki többszemélyes játékok esetére. Technikai 
szempontból a dolog egyszerű, azonban felmerül néhány érdekes koncepcionális kérdés. 

Először is egy csomópontokhoz rendelt egyetlen értéket egy értékvektorral kell fel- 
váltani. Például egy háromszemélyes játékban, ahoi három játékos, A, B és C vesz részt, 
minden csomóponttal egy (va, va, ve) vektort társítunk. Végállapotok esetén ez a vek- 
tor megadja az állapot hasznosságát minden játékos szemszögéből (kétszemélyes zérus- 
összegű játékokban a kételemű vektort egy értékre le lehet egyszerűsíteni, mert az 
értékek mindig ellentétesek). Ezt a kibővítést legjobb úgy implementálni, hogy a HASZ- 
NOSSÁG függvény adja vissza a hasznosságok vektorát. 

Most a nem terminális állapotokkal foglalkozunk. Nézzük meg a 6.4. ábrán látható 
játékfában az X jelzésű csomópontot. Ebben az állapotban a C játékos dönti el, hogy mit 
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6.A. ábra. Három játékos (A, B, C) játékfája a három első fél lépés esetén. Minden csomópontot az ÖSSZES 
játékos szemszegéből számított értékkel címkéztük meg. A legjobb lépést a gyökérnél jelöltük be. 


csináljon. Egyik választása a (va — I, ve — 2, ve — 6), míg a másik a (va — 4, vp — 2, 
ve — 3) vektorokkal rendelkező végállapothoz vezet. Mivel 6 több, mint 3, C-nek az el- 
ső lépést kellene választania. Ez azt jelenti, hogy ha a játék az X csomópontot eléri, 
a következő lépés a (va — I, ve — 2, ve — 6) hasznosságú végállapothoz fog vezetni. 
X visszaadott értéke így ez a vektor. Általánosságban egy n csomópont visszaadott ér- 
téke annak a követőnek a hasznosságvektora, amely követőnek az n csomópontnál 
választó játékos szempontjából legnagyobb az értéke. 

Mindenki, aki olyan többszemélyes játékokat játszik, mint például a Diplomacy", 
gyorsan meggyőződhet, hogy a kétszemélyes játéknál sokkal többről van itt szó. Több- 
személyes játékban a játékosok között általában lehetségesek formális vagy informális 
szövetségek (aliances). A játék előrehaladtával szövetségek köttetnek és bontatnak fel. 

Hogyan is kellene értelmezni egy ilyen viselkedést? Természetes következménye-e 
a szövetség az egyes játékosok optimális stratégiáinak egy többjátékos játékban? Úgy 
tűnik, hogy ez igaz lehet. Tegyük fel például, hogy A és B gyengén, míg C erősebben 
áll. Akkor néha optimális mind A, mind B számára, ha nem egymást, hanem C-t támad- 
ják meg, hogy az egyenként ne végezzen velük. Ily módon az együttműködés tisztán 
egoista viselkedésből ís kialakulhat. Persze ahogy az együttes támadásnak kített C 
gyengül, a szövetség értéke csökken, és vagy A, vagy B a megegyezést megszegheti. 
Egyes esetekben az explicit szövetségek az úgyis bekövetkezendő eseményeket rögzí- 
tik konkrét módon. Más esetekben szociális megbélyegzés jár a szövetség megszegé- 
séért, így a játékosnak mérlegelnie kell a szövetség megszegésének rövid idejű előnyét 
és a szavahihetetlenként való megbélyegzés hosszú távú hátrányát. (Az ilyen bonyodal- 
makról többet a 17.6. alfejezetben.) 

Ha a játék nem zérusösszegű, akkor együttműködés két játékos esetén is létrejöhet. 
Tegyük fel például, hogy létezik olyan végállapot, amelynek hasznossága (v4 — 1000, 
ve — 1000), és 1000 mindkét játékos számára az elérendő legnagyobb hasznosság. 
A két játékos optimális stratégiája akkor az, hogy ennek az állapotnak az elérése érde- 
kében mindent megtesznek — azaz a két játékos automatikusan kooperálni fog, hogy a 
kölcsönösen előnyös célt elérjék. 
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A minimax keresés problémája, hogy a játékban a megvizsgálandó állapotok száma 
exponenciális a lépések számában. A kitevőtől sajnos megszabadulni nem tudunk, ám 
lényegében megfelezhetjük. A trükk az, hogy lehetséges a korrekt minimax döntés ki- 
számítása anélkül, hogy a játékfában minden csomópontra rá kelljen nézni. Ehhez köl- 
csönözhetjük a 4. fejezetben megismert nyesés (prunning) gondolatát, és a játékfa 
nagyobb részét a megfontolásokból kihagyhatjuk. A konkrét vizsgált technika az alfa- 
béta nyesés (alpha-beta prunning). Ha ezt egy standard minimax fára alkalmazzuk, 
ugyanazt az eredményt adja vissza, mint a minimax, a döntésre hatással nem lévő ága- 
kat azonban lenyesi. 

Tekintsük ismét a 6.2. ábrán látható egylépésváltásos játékfát. Kövessük még egy- 
szer az optimális döntés kiszámításának menetét, most azonban kísérjük figyelemmel, 
hogy mit is tudunk valójában a folyamat minden pontjában. A lépésekhez a 6.5. ábra ad 
magyarázatot. Az eredmény az, hogy meg tudjuk határozni a minimax döntést anélkül, 
hogy a két levélcesomópontot bármikor is megnéznénk. 

A módszert értelmezhetjük másképpen is, mint a MINIMAX-ÉRTÉK függvény egy egy- 
szerűsítését. Legyen a C csomópontot a 6.5. ábrán látható, ki nem értékelt követő csomó- 
Pontok értéke x és y, és legyen z a kettő minimuma. A gyökércsomópont értéke ekkor: 


MINIMAX-ÉRTÉK(gyökér) — max(min(3, 12, 8), min(2, x, y), min(14, 5, 2) 
 max(3. min(2, x, y). 2) 
s max(3, 22) aholz S2 
3 


Más szóval a gyökér értéke és így a minimax döntés független a lenyesett levelek x és y 
értékeitől. 

Az alfa-béta nyesést tetszőleges mélységű fákra lehet alkalmazni, és sokszor lehetsé- 
ges, hogy levelek helyett teljes részfákat nyessünk le. Az általános elv az alábbi: tekint- 
sünk egy olyan n csomópontot valahol a fa belsejében (lásd 6.6. ábra), hogy a Játékosnak 
lehetősége legyen e csomópontba lépni. Ha a Játékosnak van az n szülőcsomópontjánál 
vagy ettől feljebb bármelyik döntési pontban egy jobb választása, m, akkor az n-t az 
aktuális játékban soha nem érjük el. Ha az n-ről tehát (néhány követőjének megvizsgálá- 
sával) már eleget tudunk, hogy ehhez a konklúzióhoz jussunk, a csomópontot nyugodtan 
lenyeshetjük. 

Emlékezzünk, hogy a minimax keresés mélységi keresés, egy adott időben tehát ele- 
gendő a fában egy egyedi út menti csomópontokkal foglalkozni. Az alfa-béta nyesés 
megnevezése két paramétertőt származik, mely paraméterek az út mentén megjelenő 
visszaléptetett értékek korlátjaira vonatkoznak: 


a — az út mentén tetszőleges döntési pontban a MAX számára eddig megtalált legjobb 
(azaz a legmagasabb értékű) választás értéke. 


A — az út mentén tetszőleges döntési pontban a MIN számára eddig megtalált legjobb 
(azaz a legkisebb értékű) választás értéke. 
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6.5. ábra. Az optimális döntés kiszámításának lépései a 6.2. ábrán látható játékfa esetén. Minden ponton 
a lehetséges értékek terjedelmét mutatjuk meg minden egyes csomópont számára, (a) A B csomópont 
alatt az első levélnek 3 az értéke. B tehát, ami egy MIN csomópont, legfeljebb 3 értékű. (b) A B alatti má- 
sodik csomópontnak 12 az értéke. MIN ezt a lépést elkerüli, így B értéke még mindig legfeljebb 3. (c) 
A B alatti harmadik levélnek 8 az értéke. B összes követőit láttuk már, B értéke tehát pontosan 3. Most 
azt következtethetjük ki, hogy a gyökér értéke legalább 3, mert MAX-nak a gyökérben 3-as értékű válasz- 
tása van. (d) A C alatti első levélnek 2 az értéke. C tehát, ami egy Miv csomópont, legfeljebb 2 értékű. 
De mi tudjuk már. hogy 8-nek 3 az értéke, MAX tehát C-t soha nem fogja választani. Azért nem is érde- 
mes C további követőit megvizsgálni. Ez az alfa-béta nyesés egy példája. (e) A D alatti első levélnek 14 
az értéke, így D értéke legfeljebb 14. Ez több mint MAX legjobb alternatívája (azaz 3), meg kell vizsgál- 
ni ezért D követőit. Jegyezzük meg, hogy most a gyökér minden követője esetén rendelkezünk értékkor- 
láttal, a gyökér értéke legfeljebb 14. (f) D második követőjének értéke 5, így tovább kell folytatnunk 
a vizsgálatot. A harmadik követő értéke 2, D értéke tehát pontosan 2. MAx döntése a gyökérnél, hogy B 
felé kell lépni, 3-as értékkel. 


Az alfa-béta keresés az a és a 8 értékeit munka közben frissíti, és a csomópontnál 
a megmaradó ágakat lenyesi (a rekurzív hívást terminálja), amint csak biztossá válik, 
hogy az aktuális csomópont értéke rosszabb lesz, mint az aktuális er és ő érték, MAX-ra, 
illetve MIN-re. A teljes algoritmust a 6.7. ábra mutatja. Bátorítjuk az olvasót. hogy a 6.5. 
ábrán látható fára alkalmazva, kövesse végig az algoritmus működését. 

Az alfa-béta nyesés hatékonysága erősen függ a követő csomópontok vizsgálatának 
sorrendjétől. Például a 6.5. (e) és (f) ábrán D egyetlen követőjét sem lehetne lenyesni, 
mert először a legrosszabb követőt (MIN szemszögéből) generáltuk. Ha a harmadik 
követőt elsőnek generálnánk, a maradó kettőt le lehetne nyesni. Ez azt sugallja, hogy 
érdemes lenne először a legjobbnak tűnő csomópontokat megvizsgálni. 
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6.6. ábra. Alfa-béta nyesés: általános eset, Ha m a Játékos számára jobb, mint , akkor a játék során 
sosem fogunk elérni n-be. 


Ha feltételezzük, hogy ez megtehető, ! akkor az alfa-béta nyesésnek elég az O(p"/?) 
csomópontot megvizsgálni, a legjobb lépés kiszámításához, a minimax 0(b") értéké- 
"vel szemben. Ez azt jelenti, hogy az effektív elágazási tényező b helyet /b lesz — pél- 
dául a sakk esetében 35 helyett 6. Más szóval, az alfa-béta nyesés ugyanannyi idő 
alatt kétszer olyan messzire néz, mint a minimax. Ha a követő csomópontokat vélet- 
len sorrendben vizsgálnánk a legjobbat-először helyett, a vizsgált csomópontok össz- 
száma O(b3r/4) lenne, mérsékelt értékű b-kre. A sakk esetében egy igen egyszerű 
rendezőfüggvény (mint például az, hogy először a leütésekkel, majd a támadásokkal, 
ezt követően az EKE BBB és végül a hátralépésekkel próbálkozunk) a legjobb 
esetre vonatkozó O(4"/") eredményt egy 2-es tényező erejéig közelíti meg. Dinamika 
hozzáadása a lépésrendező sémákhoz, mint például azokkal a lépésekkel próbálkozni 
először, amelyek legutóbb a legjobbnak bizonyultak, az elvi korláthoz egészen közel 
visz. 

A 3. fejezetben megjegyeztük, hogy a keresési fában az ismétlődő állapotok a kere- 
sési költségekben exponenciális növekedéshez is vezethetnek. Játékokban gyakran elő- 
fordulnak ismétlődő állapotok a transzpozíciók (transpositions) — a lépési szekven- 
ciának az ugyanahhoz az álláshoz vezető különböző permutációi — miatt. Ha például 
Fehér lépése ay, amire Fekete by lépéssel válaszolhat, és a tábla más részén van egy ve- 
le nem kapcsolatos az lépése, amire Fekete b2-vel válaszolhat, akkor az [aj, by, aa, bal 
és az [aj, ba, az, bi] szekvenciák mind ugyanabban az állásban végződnek (ahogy eb- 
ben az állásban végződik az előbbi lépések minden a2-vel kezdődő permutációja). 
Érdemes ennek az állásnak a kiértékelését az első előforduláskor egy hash-táblában el- 
tárolni, mert így a későbbi előfordulásoknál a kiszámítás megismétlését megspóroljuk. 

Az előbb látott pozíciók hash-tábláját hagyományosan transzpozíciós táblának 
(transposition table) hívják. Ez lényegében azonos a GRÁF-KERESÉS zárt listájával 
(lásd 122. oldal). A transzpozíciós tábla használata drámai hatású lehet és a sakkban 


Természetesen nem tökéletes módon, különben a sorbarendező-függvény segítségével egy hibátlan játékot 
tudnánk játszani. 
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function ALFA-BÉTA-KEREsés(állapot) returns egy cselekvés 
inputs: állapot, a játék jelenlegi állása 


v — MAx-ÉRTÉK( állapot, —oo, -t-o0) 
return egy cselekvés a KÖVETŐÁLLAPOTOK(állapot)-ban v értékkel 





function MAX-ÉRTÉK(állapot, a, 8) returns egy hasznossági érték 
inputs: állapot. a játék aktuális állása 
a, az állapot-ig vezető út mentén a legjobb érték MAX számára 
3. az állapot-ig vezető út mentén a legjobb érték Min számára 


if Véc-Teszr(áltapot) then return HASzNossác(állapor) 
ve -oc 
for minden s € KÖVETŐÁLLAPOTOK(állapor) do 
v 6 MAXx(v, MIN-ÉRTÉK(s, a, 8) 
ifv 2 é then return v 
€r— MAX(a, v) 
return v 





function MIN-ÉRTÉK(állapot, c, $) returns egy hasznossági érték 
inputs: állapot, a játék aktuális állása 
a, az állapot-ig vezető út mentén a legjobb érték MAX számára 
B, az állapot-ig vezető út mentén a legjobb érték MIN számára 


if VéG-TESzT(állapot) then return HASZNOSSÁG (állapot) 
ve 4oo 
for minden s € KÖVETŐÁLLAPOTOK[(állapor) do 
v — MIN(v, MAX-ÉRTÉK(s, a, 8) 
ífv S a then return v 
B6 MIN, v) 
[ return v 











6.7. ábra. Az alfa-béta keresési algoritmus. Ugyanazt a számítást hajtja végre, mint egy normál minimax 
algoritmus a 6.3. ábrán, kivéve két sort a MAX-ÉRTÉK és a MIN-ÉRTÉK hívásokban, ahol az a és a  ér- 
tékeket kezeli (és adminisztrálja e paraméterek átadását). 


néha az elérhető mélység megduplázásához vezet. Másrészt ha másodpercenként a cso- 
mópontok millióit értékeljük ki, nem praktikus ezeket mind a transzpozíciós táblában tar- 
tani. A legértékesebb csomópontok megválasztására különböző stratégiákat dolgoztak ki. 
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A minimax algoritmus a játék egész keresési terét állítja elő, az alfa-béta nyesés viszont 
lehetőséget ad annak nagy részét lenyesni. Az alfa-béta nyesésnek mégis a végállapo- 
tokig kell keresnie legalább a keresési tér egy részében. Ez a mélység általában nem 
praktikus, mert a lépéseket elfogadható idő alatt — tipikusan legfeljebb percek alatt — keli 
megtenni. Shannon az 1950-es Programming a computer for playing chess c. cikkében 
azt javasolta, hogy a programnak a keresést korábban keil abbahagynia, és a csomópon- 
tokra egy heurisztikus kiértékelő függvényt (evaluation function) kell alkalmaznia, a 
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nem végállapotokat lényegében végállapotoknak tekintve. Más szóval a minimaxot vagy 
az alfa-bétát kétféle módon kellene módosítani: a hasznossági függvényt egy heuriszti- 
kus KIÉRTÉKEL kiértékelő függvény helyettesíti, amely az állás hasznosságának egy 
becslését adja meg, valamint a célállapottesztet egy vágási teszt (cutoff test) váltja fel, 
amely eldönti, hogy KIÉRTÉKEL-t kell-e alkalmazni. 


Kiértékelő függvények 


Egy kiértékelő függvény egy adott állásból kiindulva a játék várható hasznosságának 
becslését adja vissza, éppúgy, ahogy a 4. fejezet heurisztikus függvénye a céltól való 
távolság becslését adja. A becslés ötlete, amikor Shannon felvetette, nem számított új- 
nak. A sakkozók (és természetesen más játékok szerelmesei) az évszázadok során kifej- 
lesztettek olyan módszereket, amelyekkel mérlegelni tudták egy állás értékét, hiszen 
a keresés mennyiségének tekintetében az emberek még inkább korlátozottak, mint a 
számítógépes programok. Nyilvánvaló, bogy egy játékprogram teljesítménye függ az 
alkalmazott kiértékelő függvény minőségétől. Egy pontatlan függvény a programot 
olyan állásokhoz vezeti, amelyek valójában vesztes pozíciók. Milyen pontosan tudunk 
jó kiértékelő függvényeket tervezni? 

Először is a kiértékelő függvénynek a végállapotokat ugyanúgy kellene sorba ren- 
deznie, mint az igazi hasznosságfüggvénynek, máskülönben az azt használó ágens még 
akkor is szuboptimális lépéseket választhatna, ha tönénetesen a játék végéig előre lát- 
na mindent. Másodsorban a kiértékelő függvény kiértékelése nem tarthat túl sokáig! 
(A kiértékelő függvény szubrutinként meg tudná hívni a MINIMAX-DÖNTÉS-t, és ki tud- 
ná számítani a pozíció pontos értékét, ez azonban az egész gyakorlat értelmét — az idő- 
megtakarítást — megkérdőjelezné.) Harmadsorban a nem végállapotok tekintetében a 
kiértékelő függvénynek pontosan kell tükröznie a nyerés valódi esélyét. 

EI lehet merengeni a , nyerés esélye" kifejezésen. Végül is a sakk nem szerencsejáték, 
az aktuális állapotot biztosan tudjuk, és nincs a dologban kockavetés. Ha azonban egy nem 
végállapotban levágtuk a keresést, akkor az algoritmus szükségszerűen bizonytalan lesz 
annak valódi kimenetelében. Ezt a bizonytalanságot nem információs, hanem inkább szá- 
mítási korlátok okozzák. Ha a kiértékelő függvény egy adott állapotban csak egy bizonyos 
mennyiségű számítást végezhet el, a legjobb. amit tehet, hogy kitalálja a végkimenetelt. 

Próbáljuk meg ezt az ötletet pontosan megfogalmazni. A kiértékelő függvények 
többsége az állapot különböző tulajdonságait (features) kiszámítva dolgozik — a sakk- 
ban például ilyen a mindkét félnél lévő gyalogok száma. A tulajdonságok, egybevéve, 
az állapotok különböző karegóriáit, avagy ekvivalenciaosztályait definiálják: az egyes 
kategóriákhoz tartozó állapotok az összes tulajdonság szempontjából ugyanazt az érté- 
ket képviselik. Minden egyes kategória általánosságban tartalmazni fog olyan állapoto- 
kat, melyek győzelemhez vezetnek, olyanokat, amelyek döntetlent eredményeznek, és 
olyanokat, amelyek vereséggel végződnek. A kiértékelő függvény nem tudhatja, hogy 
melyik állapot melyik, azonban visszatérhet egyetlen olyan értékkel, amely tükrözi az 
egyes kimenetelekhez tartozó állapotok arányát. Tegyük fel például, hogy a tapaszta- 
latunk azt sugallja, hogy a kategóriához tartozó állapotok 7296-a vezet győzelemhez 
(--1 hasznosság), 2099-a vesztéshez (-1 hasznosság) és 896-a döntetlenhez (0 hasznos- 
ság). Akkor a kategóriához tartozó állapotok értelmes értékelése a súlyozott átlag vagy 
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a várható érték (expected value): (--1 x 072) 4 (-1 x 020) -k (0 x 0,08) — 0,52. 
Elvben a várható értéket minden kategóriára meg lehetne határozni, ami egy tetszőle- 
ges állapot esetén is működő kiértékelő függvényhez vezetne. A végállapotokhoz ha- 
sonlóan, a kiértékelő függvénynek nem kell tényleges várható értékeket visszaadnia, 
amíg az állapotok sorba rendezése ugyanaz. 

A gyakorlatban az ilyen elemzés túl sok kategóriát és így túl sok tapasztalatot kíván 
ahhoz, hogy a győzelem valószínűségét megállapítsuk. A kiértékelő függvények többsé- 
ge ehelyett az egyes tulajdonságokból adódó numerikus értékeket külön számítja, majd 
a végleges értéket ezek kombinációjaként határozza meg. A kezdőknek szánt sakk-köny- 
vek például egy közelítő pontértéket (material value) rendelnek minden egyes bábu- 
hoz: minden gyalog 1 pontot, egy huszár vagy egy futó 3 pontot, egy bástya 5 pontot, 
míg egy vezér 9 pontot ér. Más jellemzők, mint például egy ,jó gyalogstruktúra" és a 
, király biztonsága" érhetnek mondjuk egy fél gyalogot. Az állás kiértékeléséhez ezeket 
az értékeket egyszerűen összeadjuk. Egy gyaloggal ekvivalens biztonságos előny a győ- 
zelem lényeges valószínűségét adja, három gyaloggal ekvivalens biztonságos előny 
majdnem biztos győzelemhez vezet, ahogy ezt a 6.8. (a) ábra mutatja. Az ilyen típusú ki- 
értékelő függvényt a matematikában súlyozott lineáris függvénynek (weighted linear 
function) nevezik, mert kifejezhető az alábbi alakban: 


KIÉRTÉKEL(5) — wi fi(5) -- w2.f2(5) - ... 4 ma ful) EZ fiW5) 
4-1 
ahol a w-k a súlyok és az f-ek az adott táblaállás jellemzői. Sakk esetében az. frk a táb- 
lán levő egyes bábufajták számát jelölhetik és a w;-k a bábukhoz rendelt pontértékek 
(gyalog I, futó 3 stb.) lehetnek. 

A tulajdonságértékek összeadása értelmes dolognak tűnik, azonban ezzel valójában egy 
igen erős feltételezéssel élünk: t. í. hogy az egyes tulajdonságok hozzájárulásai más tulaj- 
donságok értékeitől függetlenek. A 3-as érték hozzárendelése a futóhoz figyelmen kívül 
hagyja például azt, hogy a végjátékban, amikor sok tér áll rendelkezésre a manőverezéshez, 
a futó erősebb. Ezért a jelenlegi sakk- és más játékokat játszó programok a tulajdonságok 
nemlineáris kombinációit is használják. Egy futópár egy kicsit értékesebb lehet például, 
mint egy futó értékének kétszerese, és egy futó a végjátékban értékesebb. mint a nyitásnál. 





(a) Fehér lép (b) Fehér lép 


6.8. ábra. Két, kissé eltérő sakktábiaállás. (a) Feketének egy huszár és két gyalog előnye van, és a játékot 
megnyeri. (b) Fekete veszít, miután Fehér a vezérét leüti. 
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Az éles elméjű olvasó észreveszi, hogy a tulajdonságok és a súlyok a sakk szabálya- 
inak nem részei! Ezek az emberi sakkjátszás évszázados tapasztalataiból származnak. 
Lineáris kiértékelő képletet alkalmazva a tulajdonságok és a súlyok az állapotoknak az 
értékeik szerinti igazi sorrendezésük legjobb közelítését adják meg. A tapasztalat kü- 
lönösképpen azt sugallja, hogy az egy pontnál nagyobb biztonságos anyagi előny va- 
lószínűleg győzelemhez vezet, ha minden más tényező azonos. Hárompontos előny ele- 
gendő a majdnem biztos győzelemhez. Olyan játékokban, ahol ilyen tapasztalatra szert 
tenni nem lehet, a kiértékelő függvény súlyértékeit a 18. fejezetben leírt gépi tanulási 
technikákkal lehet becsülni. Biztató, hogy e technikák sakkra történő alkalmazása tény- 
leg azt támasztja alá, hogy egy futó kb. három gyalogot ér. 





A keresés levágása 


Következő lépés az ALFA-BÉTA-KERESÉS olyan módosítása, hogy az algoritmus meg- 
hívja a heurisztikus KIÉRTÉKEL függvényt, amikor a keresést le kell vágni. Az imple- 
mentációt tekintve a 6.7. ábrának a VÉG-TESZT-et tartalmazó két sorát az alábbi sorra 
cseréljük: 

if LEvÁGÁS-TESZT(állapot, mélység) then return KIÉRTÉKEL(állapot) 


Meg kell oldani annak az adminisztrálását is, hogy az aktuális mélység inkrementálisan 
változzék minden rekurzív hívás alkalmából. A legkézenfekvőbb megközelítés a kere- 
sés vezérlésére, ha a kereséshez rögzített mélységkorlátot rendelünk, hogy a LEVÁGÁS- 
TEszr(állapot, mélység) igazzal térjen vissza egy d-nél nagyobb mélységre (igazzal kell 
visszatérnie minden végállapot esetében is, ahogy azt a VÉG-TESZT tette). A d mélysé- 
get úgy választják meg, hogy a felhasznált idő ne haladja meg a játék szabályai által 
megengedett időt. 

Egy kicsit robusztusabb megközelítést kapunk, ha a 3. fejezetben definiált íteratívan 
mélyülő algoritmust alkalmazzuk. Ha a program kifut az időből, akkor a legmélyebb, 
befejezett keresés által kiválasztott lépést adja vissza. Az ilyen megközelítések azonban 
hibákhoz vezethetnek a kiértékelő függvény közelítő jellege miatt. Tekintsük ismét a 
sakkban a pontelőnyön alapuló kiértékelő függvényt. Tegyük fel, hogy a program a mély- 
ségkorlátig keres, és a 6.8. (b) ábra táblaállásába jut, ahol Feketének huszár és két gyalog 
előnye van. A program a heurisztikus érték alapján ezt az állapotot Fekete számára való- 
színű győzelemnek fogja minősíteni. Fehér következő lépésében azonban leüti a fekete 
vezért, kárpótlás nélkül. Az állás így valójában Fehér számára jelent győzelmet. viszont 
hogy ezt belássuk, egy további lépésváltásig előre kellene nézni. 

Nyilvánvalóan egy kifinomultabb levágási tesztre van szükség. A kiértékelő függ- 
vényt csak az egyensúlyi (gmiescent) táblaállásokra szabad alkalmazni, vagyis olyan 
állásokra, amelyek értéke a közeljövőben nem változik meg radikálisan. A sakkban pél- 
dául az olyan táblaállások, amelyeknél tisztet lehet leütni, egy csak a pontértéket figye- 
lembe vevő kiértékelő függvény esetén nem tekinthetők egyensúlyi állásnak. 
A nem egyensúlyi táblaállásokat tovább ki lehet fejteni, amíg egyensúlyi állásokat nem 
érünk el. Ezt a többletkeresést egyensúlyi keresésnek (guiescence search) nevezzük. 
Ezt a keresést néha csak bizonyos típusú lépésekre korlátozzák, mint például a tábla- 
állás bizonytalanságait gyorsan feloldó bábuleütésekre. 
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A horizontproblémát (horizont problem) nehezebb megszüntetni. A probléma ak- 
kor jelentkezik, amikor a program az ellenfél egy olyan következő lépésével kerül 
szembe, ami komoly károkat okoz, és egyben elkerülhetetlen. Tekintsük a 6.9. ábra 
sakkjátszmáját. Fekete egy kicsit erősebb pontértékű, ha azonban Fehér a hetedik sor- 
ról a nyolcadikba tudja juttatni a gyalogját, akkor vezérré változik, és Fehér könnyen 
megnyeri a játszmát. Fekete ezt 14 lépésváltással elodázhatja, ha bástyával sakkot ad, 
de a fehér gyalog elkerülhetetlenül vezérré fog változni. A rögzített mélységű keresé- 
sek problémája, hogy ezek azt gondolják, hogy ilyen elodázó lépésekkel el lehet kerül- 
ni a vezérré változtató lépést. Azt mondjuk, hogy az elodázó lépések a vezér váltását 
A horizonton túlra kitolják", egy olyan helyre, ahol ezt nem lehet észrevenni. 








Fekete lép 


6.9. ábra. A horizonthatás. A fekete bástyával adott sorozatos sakk a , horizonton túlra" kényszeríti az 
elkerülhetetlen vezérré változtató lépést, és ezt a táblaállást enyhén előnyös állásként tünteti fel Fekete 
számára, holott Fehér számára ez egy biztos nyerő állás. 


Mivel a hardverek fejlődése mélyebb kereséshez vezet, azt várjuk, hogy a horizont- 
probléma kevésbé lesz gyakori, a nagyon hosszú késleltető lépésszekvenciák igen ritkák. 
A szinguláris kiterjesztés (singular extension) használata szintén hatásos a horizont- 
probléma elkerülésében. lényeges keresési költségtöbblet nélkül. A szinguláris kiterjesz- 
tés egy olyan lépés, amely , lényegesen jobb", mint az állás minden más lépése. A szin- 
guláris kiterjesztés keresése lényeges többletköltség nélkül a normális mélységkorláton 
túl is mehet, mert elágazási tényezője egységnyi. (Az egyensúlyi keresést a szinguláris 
kiterjesztés egy változatának lehet tekinteni.) A 6.9. ábrán a szinguláris kiterjesztés a 
lehetséges vezérlépést meg fogja találni, feltéve, hogy Fekete sakkot adó és Fehér véde- 
kező lépéseit , nyilvánvalóan jobb"-nak azonosítja a többi alternatívához képest. 

Eddig a keresés egy adott szinten történő levágásáról és az eredményt igazoltan nem 
befolyásoló alfa-béta nyesésről beszéltünk. De előrenyesést (forward prunning) is al- 
kalmazhatunk, ahol egy adott csomópontban egyes lépéseket minden további elemzés 
nélkül azonnal lenyesünk. A sakkozók többsége egy adott állásnál nyilván csak néhány 
lépést vesz figyelembe (legalább tudatosan). Sajnos ez a megközelítés veszélyes lehet, 
mert nincs garancia arra, hogy nem fogjuk a legjobb lépést lenyesni. Ez katasztrofális 
lehet, ha a gyökér közelében történik, mert a program sokszor néhány , nyilvánvaló" 
lépést el fog nézni. Az előrenyesést speciális helyzetekben biztonságosan lehet alkal- 
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mazni — például amikor a két lépés szimmetrikus, vagy más szempontból ekvivalens, 
elegendő csak az egyiket figyelembe venni -, vagy olyan csomópontoknál, amelyek a 
keresési fában mélyen találhatók. 

Az ítt leírt technikák kombinált alkalmazásával egy elfogadható szinten sakkozó 
(vagy más játékot játszó) programot kaphatunk. Tegyük fel, hogy a sakk esetére imple- 
mentáltunk egy kiértékelő függvényt. egy értelmes kereséslevágást egyensúlyi keresés- 
sel és egy nagy transzpozíciós táblát. Tegyük fel azt is. hogy hónapokig tartó munkás 
bitfaragással, a legújabb PC-n tudunk generálni és kiértékelni másodpercenként kb. egy- 
millió csomópontot, ami kb. 200 millió csomópont megvizsgálását teszi lehetővé lépé- 
senként a standard időkorlátok mellett (3 perc lépésenként). A sakk elágazási tényezője 
átlagosan kb. 35. Mivel 355 kb. 50 millióval egyenlő, a minimax keresést alkalmazva így 
csak öt lépésváltásig tudnánk előrenézni. Bár egy ilyen program nem hasznavehetetlen, 
egy átlagos emberi játékos, aki esetenként hat vagy nyolc lépésváltásig tud előrenézni, 
könnyűszerrel bolondot tudna belőle csinálni. Az alfa-béta nyeséssel kb. 10 lépésváltást 
kapunk, ami a játék mesteri színvonalának felel meg. A 6.7. alfejezet további nyesési 
technikákat ír le, amikkel az effektív keresési mélység durván 14 lépésváltásig kiter- 
jeszthető. A nagymesteri minősítéshez egy lényegesen finomított kiértékelő függvény 
kellene továbbá az optimális megnyitások és a végjátékok nagy adatbázisa. És az sem 
ártana, ha lenne egy szuperszámítógépünk, amin a programot futtatnánk. 
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A valós életben számos olyan megjósolhatatlan külső eseménnyel van dolgunk, ami mi- 
att előre nem látható helyzetbe kerülünk. Sok játék ezt a megjósolhatatlanságot egy 
véletlen elem, mint például a kockadobás, bevezetésével veszi figyelembe. Ily módon 
egy lépéssel közelebb visznek bennünket a valósághoz, és megéri megvizsgálni, hogy 
ez milyen hatással van a döntési folyamatra. 

Az ostábla tipikusan olyan játék, amely ötvözi a szerencsét és a tudást. A játékosok 
a lépések előtt kockát dobnak, amivel meghatározzák az adott játékos számára meg- 
engedett lépéseket. A 6.10. ábra ostáblaáltásánál Fehér egy 6-ost és egy 5-öst dobott, és 
négy lehetséges lépés közül választhat. 

Habár Fehér tudja, hogy számára melyek a megengedett lépések, azt nem tudja, hogy 
Fekete milyen számokat fog dobni, így nem tudhatja, hogy melyek lesznek Fekete megen- 
gedett lépései. Ez azt jelenti, hogy Fehér nem tud egy 3 x 3-as amőbánál látott teljes 
játékfához hasonlót elkészíteni. Az ostábla esetén a játékfának a MAX ÉS MIN csomópontok 
mellett tartalmaznia kell véletlen csomópontokat (chance nodes) is. A 6.11. ábrán a vé- 
letlen csomópontokat körök jelölik. A véletlen csomópontokból kiinduló ágak a lehetséges 
kockadobásokat jelölik. Minden ág a dobott értékkel és előfordulásának valószínűségével 
van felcímkézve. Két kockával történő dobásnál harminchatféle eredményt kaphatunk. 
Ezek a dobások mind azonos valószínűségűek, mivel azonban a 6-5 megegyezik az 
5-6-tal, így csak 21 különböző dobás létezik. A hat dupla (1-1-től egészen 6-6-ig) 1/36- 
od valószínűséggel, míg a többi 15 különböző dobás 1/18-ad valószínűséggel fordul elő. 

A következő lépés annak megértése, hogyan kell helyes döntéseket hozni. Nyilvánva- 
lóan továbbra is azt a lépést szeretnénk kiválasztani, ami a legjobb álláshoz vezet. 
A lehetséges állások azonban most nem rendelkeznek egy jól meghatározott minimax 
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48 17 16 15 14 13 


6.10. ábra. Egy tipikus ostáblaállás. A játék lényege. hogy az egyik fél összes bábuját eltávolítsuk a táb- 
láról. Fehér az óramutató járásával egyező irányban halad a 25-ös felé, míg Fekete az óramutató járásával 
ellentétes irányban, a 0 felé halad. Egy bábuval bármelyik helyre lehet lépni, kivéve azokat a helyeket, 
ahol az ellenfélnek már legalább két bábuja található. Ha egy olyan helyre lépünk, ahol az ellenfélnek egy 
bábuja található, akkor azt a bábut elfogtuk, és a lépkedést az elejéről keli újrakezdenie. Ennél a tábla- 
állásnál Fehér épp most dobott 6-5-öt. és négy megengedett lépés közül választhat: (5-10,5-11), 
(5-1 11924), (5-10,10-16) és (5-11,11-16). 








VÉGCSOMÓPONT 2. sefrr1 ked.) 1 
6.11. ábra. Egy ostáblaállás sematikus játékfája 
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értékkel. Ehelyett csak egy átlagos vagy várható értéket (expected value) tudunk 
kiszámítani, ahol az átlagolást az összes lehetséges kockadobásra végezzük el. Ezzel a 
determinisztikus játékok minimax értékét (minimax value) a véletlen csomópontokat 
tartalmazó játékok várhatóminimax értékére (expectiminimax value) általánosítot- 
tuk. A végállapotok és a MAX és MIN állapotok (ahol a kockadobás eredménye ismert) 
ugyanúgy viselkednek, mint eddig. A véletlen csomópontok kiértékeléséhez az összes 
lehetséges kockadobás figyelembevételével számított súlyozott átlagot kell venni, vagyis: 


VÁRHATÓMINIMAX(71) — 


(ASZNOSSÁG(71) ha n egy végállapot 
max se Követőktn), VÁRHATÓMINIMAX (5) ha n egy MAX csomópont 
MiDsekövetőkíny VÁRHATÓMINIMAX (5) ha n egy MIN csomópont 

seKövetőkti) P(5) : VÁRHATÓMINIMAX (5) ha n egy véletlen csomópont 


ahol a véletlen n csomópont állapotátmenet-függvénye az n állapotot egyszerűen mó- 
dosítja az összes kockadobás eredményezte s követő állapot értékével és a dobás P(s) 
valószínűségével. Ezt az eljárást rekurzívan alkalmazhatjuk a gyökérig, ugyanúgy, mint 
a minimax esetén. Az algoritmus részleteit feladatnak hagyjuk meg az olvasónak. 


Az állás kiértékelése véletlen csomópontokat 
tartalmazó játékok esetén 


Hasonlóan a minimaxhoz, a várhatóminimax esetén is alkalmazhatjuk a nyilvánvaló 
közelítést, vagyis valamilyen ponton levághatjuk a keresést, és a levelekre egy kiérté- 
kelő függvényt alkalmazhatunk. Úgy gondolhatnánk, hogy egy olyan játék esetén, mint 
az ostábla, a kiértékelő függvény elvben semmiben sem tér el a sakknál alkalmazott ki- 
értékelő függvényektől, melyeknek most is magasabb pontot kell adniuk a jobb állások- 
ra. Valójában azonban a véletlen csomópontok jelenléte azt jelenti, hogy sokkal körül- 
tekintőbbnek kell lennünk abban a tekintetben, hogy a kiértékelő függvény értékei mit 
jelentenek. A 6.12. ábra mutatja a problémát: ha a kiértékelő függvény a levelekhez az 
[1. 2. 3, 4] értékeket rendeli hozzá, az A) lépés lesz a legjobb, az (1, 20, 30, 400] érté- 
kekkel az A; lesz a legjobb. Ebből adódóan egy program teljesen másként viselkedik, 
ha átskálázzuk a kiértékelő függvény értékeket! Kiderül. hogy ha el akarjuk kerülni ezt 
az érzékenységet, akkor a kiértékelő függvény az egy adott állásból való győzelem va- 
lószínűségének (vagy általánosabban az állás várható hasznosságának) csak egy pozitív 
lineáris transzformációja lehet. Ez a bizonytalanságot is tartalmazó helyzetek fontos és 
általános tulajdonsága. A 16. fejezetben tovább foglalkozunk ezzel a kérdéssel. 


A várhatóminimax komplexitása 


Ha a program előre tudná a játék folyamán a későbbiekben előforduló összes kocka- 
dobás eredményét, akkor egy kockadobást is tartalmazó játék megoldása ugyanolyan 
lenne, mint egy kockadobást nem tartalmazó játéké, amit a minimax 0(4") idő alatt 
tesz meg. Mivel a várhatóminimax figyelembe veszi az összes lehetséges kockadobás- 
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MAX 


VÉLETLEN 


MIN 





2020 30 30 1 1400 400 


6.12. ábra. A levélértékeken végrehajtott sorrendőrző transzformáció megváltoztatja a legjobb lépést 


sorozat eredményét is, annak időigénye O(9"r") lesz, ahol n a különböző dobások 
számát jelöli. 

Még ha a fa mélységkorlátja egy kis értékű d is, a minimaxhoz képesti többletköltség 
miatt irreális túl messzire előrenézni a véletlen játékok többségénél. Ostáblánál n értéke 
21, b pedig általában 20 körüli értéket vesz fel, de bizonyos helyzetekben akár 4000 is le- 
het, a dupla kockadobásoknál. Valószínűleg csak három lépésváltást tudunk kezelni. 

A problémáról másféleképp ís gondolkodhatunk: az alfa-béta algoritmus előnye, hogy 
figyelmen kívül hagyja azokat a későbbi fejleményeket, amelyek a legjobb játék során 
egyszerűen nem következnek be. Így a valószínű előfordulásokra koncentrál. A kockát 
használó játékok esetén nem léteznek valószínű lépéssorozatok, mivel adott lépések 
megtételéhez először a kockának kell a megfelelő oldalára esnie, hogy ezek a lépések 
egyáltalán megengedhetők legyenek. Ez egy általános probléma minden olyan esetben, 
amikor a bizonytalanság is képbe kerül: a lehetőségek óriási mértékben megsokszoro- 
zódnak, és értelmetlenné válik részletes cselekvési terveket kidolgozni, mert a világ va- 
lószínűleg nem ezek szerint fog viselkedni. 

Kétségtelen, hogy az olvasónak már eszébe jutott, hogy valami alfa-béta nyeséshez 
hasonló dolgot a véletlen csomópontokat tartalmazó játékfákra is alkalmazni lehetne. 
Kiderül, hogy ez valóban lehetséges. A MAX és a MIN csomópontok elemzése változat- 
lan, de egy kis leleményességgel a véletlen csomópontokat is nyeshetjük. Tekintsük a 
6.11. ábra C véletlen csomópontját, és nézzük meg, mi történik az értékével, amikor 
a gyermekeit vizsgáljuk és kiértékeljük. Kérdés, hogy lehetséges-e C értékére egy felső 
korlátot találni, még mielőtt az összes gyermekét megvizsgálnánk? (Idézzük vissza. 
hogy az alfa-béta nyesésnek pontosan erre van szüksége ahhoz, hogy egy csomópontot 
és az abból kiinduló részfát lenyeshesse.) Ez első pillantásra lehetetlennek tűnhet, mi- 
vel a C értéke a gyermekei értékének az átlaga, és amíg nem láttuk az összes kocka- 
dobás eredményét, addig ez az átlag akármi is lehet, mivel a meg nem vizsgált gyerme- 
kek akármilyen értéket felvehetnek. Ha azonban a hasznosságfüggvény lehetséges 
értékeit korlátok közé szorítjuk. akkor korlátokat kaphatunk az átlagra is. Például ha azt 
mondjuk, hogy a hasznosságértékek -t-3 és -3 között lehetnek, akkor a levélcsomópon- 
tok értékei már korlátosak, és a véletlen csomópont értékére az összes gyermekének 
megvizsgálása nélkül is adhatunk felső korlátot. 
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Kártyajátékok 


A kártyajátékok sok szempontból érdekesek, nem csupán a szerencsejáték-jellegük mi- 
att. A játékok óriási választékából azokra fogunk összpontosítani, ahol a kártyákat a já- 
ték elején véletlen módon osztják szét, és ahol mindegyik játékos által kapott leosztás 
más játékosok számára nem megfigyelhető. Ilyen játék a bridzs. a whistjáték, a hearts5 
és a póker néhány formája. 

Az első pillantásra úgy tűnhet, hogy a kártyajátékok pont olyanak, mint a kockadobá- 
sos játékok. A kártyákat véletlenül osztjuk szét, és ez meghatározza a játékosok lehetséges 
lépéseit. Itt azonban az összes kocka a legelején gördül le! Ezt a hasonlatot próbáljuk 
továbbvinni. Ki fog derülni, hogy ez a gyakorlatban igen hasznos lesz. Mellesleg hibás 
is, igen érdekes okok miatt. 

Képzeljük el, hogy két játékos, MAX és MIN, négykártyás kétkezes bridzset gyakorol, 
ahol minden kézleosztás látható. A leosztások az alábbiak, és MAX hív elsőnek: 


MAX: V6 96498 MIN: V4 424105 


Tegyük fel, hogy MAX 499-et játszik. MIN-nek szint kell játszania, tehát ee 10-et vagy 
4. 5-öt. MIN ve 10-et játszik és elviszi az ütést. Most MIN következik és 4.2-vel indul. 
MAX-nak nincs pikkje (és így az ütést elvinni nem tudja), következésképpen valamelyik 
kártyáját le kell játszania. Nyilvánvaló választás a 6 6, mert a két másik győztes kár- 
tya. Most függetlenül attól, hogy MIN mivel indul a következő ütésben, MAX az utolsó 
két ütést elviszi, és a játék két-két ütés szinten döntetlen lesz. Könnyű megmutatni a 
minimax megfelelő változatával (lásd 6.12. feladat), hogy MAX 469-es indulása valójá- 
ban egy optimális választás. 
Módosítsuk most MIN leosztását, 9 4-et $ 4-re cserélve: 


MAX: V6 96498 MIN: 6442 4.105 


A két eset tökéletesen szimmetrikus: a játék lefolyása azonos lesz, kivéve, hogy a má- 
sodik ütésnél MAX a 96-ot fogja megjátszani. A játék ugyanúgy döntetlen lesz két-két 
ütéssel, és a 49 optimális döntés lesz most is. 

Egyelőre minden jónak tűnik. Most rejtsük el MIN kártyáinak egyikét: MAX tudja, 
hogy MIN-nek vagy az egyik ( 9 4-gyel), vagy a másik ( 9 4-gyel) leosztása van, de fo- 
galma sincs melyik. MAX a következőképpen érvel: 


A 4.9-es indulás optimális választás MIN első leosztásával szemben és hasonlóan a második leosz- 
tásával szemben is, így most is optimálisnak kell lennie, mert tudomásom szerint MIN-nél a két 
leosztás valamelyike van. 


Amit MAX használ, azt általánosságban a , jövőbe látás szerinti átlagolásnal 5" nevezhet- 
nénk. Az ötlet a cselekvés értékelése nem látott kártyák mellett oly módon, hogy elő- 
ször kiszámítunk minimax értékeket minden lehetséges leosztás esetére, majd várható 
értéket számítunk a leosztásokra nézve, azok valószínűségét felhasználva. 

Ha azt gondolja, hogy ez egy értelmes stratégia (vagy ha nincs véleménye, mert nem 
érti a bridzset), tekintse a következő történetet: 


5 Az Angol-magyar Nagyszótár sem segít — ezeknek a játékoknak nincs a mai magyar nyelvben használa- 
tos nevük. (A ford.) 
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1. nap: Az A út egy halom aranyhoz vezet. A B út egy elágazáshoz vezet. Ha az elágazás- 
nál balra fordul, egy ékszerhegyet talál, ha az elágazásnál jobbra fordul, elüti egy busz. 

2. nap: Az A út egy halom aranyhoz vezet. A B út egy elágazáshoz vezet. Ha az elágazás- 
nál jobbra fordul, egy ékszerhegyet talál, ha az elágazásnál balra fordul, elüti egy busz. 

3. nap: Az A út egy halom aranyhoz vezet. A B út egy elágazáshoz vezet. Ha jól 
választ, egy ékszerhalmot talál, ha rosszul, elüti egy busz. 


Nyilvánvaló, nem buta döntés, ha az első két napon a B utat választjuk. Nincs olyan 
épelméjű személy azonban, aki a harmadik napon is maradna B-nél. Mégis pontosan ez 
az, amit a jövőbe látás szerinti átlagolás sugall. A 8 út az 1. nap és a 2. nap helyzetek- 
ben optimális, következésképpen optimális a 3. nap szituációban is, hiszen az első két 
eset egyike fog előfordulni. Térjünk vissza a kártyajátékunkhoz: miután MAX de 9-et 
hív, MIN d 10-zel győz. MIN 4.2-vel indul, mint korábban, és most MAX ott van az el- 
ágazásnál bármiféle eligazítás nélkül. Ha MAX a WV 6-ot játszotta meg, és MIN-nek van 
még 9 4-e, 94 lesz a győztes, és MAX a játékot elveszíti. Hasonlóan, ha MAX a $ 6-ot 
játszotta meg, és MIN-nek van még 6 4-e, MAX szintén veszteni fog. A 49 első ízben 
való hívása tehát olyan helyzethez vezet, ahol MAX-nak 5090-os esélye van a vesztésre 
(sokkal jobb lenne, ha a 96-ot vagy a 6 6-ot hívná elsőnek, döntetlent biztosítva). 

A leszűrendő lecke az, hogy amikor hiányos az információ, meg kell fontolni, hogy mi- 
lyen információval fogunk rendelkezni a játék minden pillanatában. MAx algoritmusával az 
a probléma, hogy feltételezi, hogy minden lehetséges leosztásnál a játék úgy folytatódik, 
mintha minden kártya látható lenne. Ahogy a példánk mutatja, ez olyan cselekvésre kész- 
teti MAX-ot, mintha minden jövőbeli bizonytalanság feloldódna, ha eljön az ideje. MAX al- 
goritmusa sem fog soha információgyűjtéshez folyamodni (vagy a partner informálásá- 
hoz), mert egy-egy leosztáson belül erre nincs szüksége. Az olyan játékoknál, mint a 
bridzs, gyakran értelmes dolog olyan kártyával indulni, amely segíti kideríteni az ellenség 
leosztását, vagy a partnerünket a saját leosztásunkról informálja. Ilyen viselkedést automa- 
tikusan generálhatunk a nem tökéletes információjú játékokra kifejlesztett optimális al- 
goritmussal. Az ilyen algoritmus nem a világállapotok terében (kártyaleosztások), hanem 
a hiedelmi állapotok terében (belief states) (hiedelmek, hogy kinek milyen kártyája van. 
milyen valószínűséggel) keres. Az algoritmust a 17. fejezetben tudjuk majd megfelelően 
elmagyarázni, miután felépítettük a szükséges valószínűségi apparátust. Abban a fejezet- 
ben azzal a nagyon fontos szemponttal ís fogunk foglalkozni, hogy a nem tökéletes infor- 
mációjú játékokban az a legjobb, ha minél kevesebb információt adunk ki az ellenségnek, 
és ennek legjobb módszere, ha nem megjósolható módon cselekszünk. Ez az oka annak, 
hogy az étteremellenőrök véletlen módon választják meg az ellenőrzések időpontját. 
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Azt lehetne mondani, hogy a játékok valami olyat jelentenek az MI számára, mint amit 
a Forma-1 versenyek a gépkocsiipar számára. A legfejlettebb játékprogramok villám- 
gyors, hihetetlenül finoman hangolt rendszerek, amelyek nagyon fejlett módszereket 
alkalmaznak, de amelyeknek nem sok hasznát vesszük a vásárláskor. Bár vannak kuta- 
tók, akik azt gondolják, hogy a játékok az MI fővonalát tekintve többé-kevésbé irrele- 
érdeklődést váltanak ki, és folyamatosan fenntartják az innovációt, 
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Sakk 


Herbert Simon 1957-ben megjósolta, hogy 10 éven belül a számítógépek legyőzik az em- 
beri világbajnokot. Negyven év múltával hatjátszmás kirakatmérkőzésen a Deep Blue le- 
győzte Garri Kaszparovot. Simon tévedett, de csak egy 4-es szorzóval. Kaszparov azt írta: 


A mérkőzés döntő játszmája a 2. játszma volt, amely emlékeimben sebként maradt meg ... láttunk 
valamit, ami a legvadabb elképzeléseinket is felülmúlta, hogy egy számítógép hogyan lesz képes 
döntéseinek hosszú távú pozíciós konzekvenciáit előre látni. A gép — emberi veszélyérzetet produ- 
kálva — megtagadta, hogy egy döntően rövid távú előnyt jelentő állásba kerüljön. (Kaszparov, 1997) 


A Deep Blue-t Murray Campbell, Feng-Hsiung Hsu és Joseph Hoane fejlesztették ki az 
IBM-nél (Campbell és társai, 2002), a Campbel? és Hsu által korábban a Carnegie 
Mellon Egyetemen kifejlesztett Deep Thought tervére alapozva. A győzedelmes gép 
egy párhuzamos számítógép volt 30 IBM RS/6000 processzorral, amelyek a , Szoftver- 
keresést" futtatták, és 480 VLSI sakk-célprocesszorral, amelyek a lépésgenerálást (be- 
leértve a lépések sorba rendezését). a fa utolsó néhány szintjén a ,hardverkeresést" és 
a levélcsomópontok kiértékelését valósították meg. A Deep Blue átlagosan másodper- 
cenként 126 millió, csúcssebességnél 330 millió csomópontot vizsgált meg. Lépésen- 
ként 30 milliárd állást generált, rutinszerűen 14-es mélységet elérve. A gép szíve a stan- 
dard alfa-béta keresés volt, transzpozíciós táblával, a siker kulcsa azonban úgy tűnik, az 
a képessége, hogy kiterjesztéseket tudott generálni az érdekes kényszerlépés-sorozatok 
mélységi korlátjain túl. Egyes esetekben a keresés a 40-es mélységet is elérte. A kiér- 
tékelő függvény 8000 tulajdonsággal dolgozott, ezekből egyesek a bábuk igen specifi- 
kus konfigurációit is leírták. A rendszer felhasználta a 4000 állást tartalmazó , Megnyi- 
tások könyvét" és a 700 000 nagymesteri játszmaleírást tartalmazó adatbázist, ahonnan 
konszenzusos javaslatokat lehetett generálni. A rendszer a megoldott végjáték-pozíciók 
nagy adatbázisával is rendelkezett, amely minden ötbábus és számos hatfigurás állást 
tartalmazott. Ez az adatbázis a keresési mélység lényeges kiterjesztését jelentette, lehe- 
tővé téve Deep Blue számára egyes esetekben a tökéletes játékot annak ellenére, hogy 
sok lépésre volt még a matthelyzettől. 

A Deep Blue sikere megerősítette azt a széles körű hiedelmet, hogy számítógépes 
játékokban az előrehaladás főleg az egyre hatékonyabb hardver eredménye -— ezt a vé- 
leményt az IBM is bátorította. Másfelől a Deep Blue megalkotói azt nyilatkozták, 
hogy a keresés kiterjesztése és a kiértékelő függvény szintén kritikusak voltak 
(Campbell és társai, 2002). Azonban tudjuk azt is, hogy néhány közelmúltbeli algorit- 
mikus javítás lehetővé tette, hogy standard PC-n futó programok 1992 óta minden Szá- 
mitógépes Sakkvilágbajnokságot megnyerjenek, sokszor 1000-szer több csomópont 
keresésére is képes masszívan parallel ellenségeket ís legyőzve. A nyesési heuriszti- 
kák egész választékának használatával az effektív elágazási tényezőt kevesebb mint 
3-ra lehet csökkenteni (a tényleges 35-ös elágazási tényezőhöz viszonyítva). Ezek kö- 
zül legfontosabb a nulla lépés (null move) heurisztika. amely sekély keresést alkal- 
mazva — ahol az ellenség az indulásnál kétszer is léphet — az állás értékének jó alsó 
becslését adja. Ez az alsó korlát sokszor lehetővé teszi az alfa-béta nyesést a teljes 
mélységű keresés költsége nélkül. Fontos még a hatástalanság nyesése (futility 
Pprunnig), amely segíti eldönteni, hogy mely lépések vezetnek béta nyeséshez a köve- 
tő csomópontok szintjén. 
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A Deep Blue csapata a Kaszparovval való visszavágó alól kibújt. Helyette 2002-ben 
a fő mérkőzés a FRITZ program és Vlagyimir Kramnyik világbajnok összecsapása volt, 
amely nyolc játszmában döntetlennel végződött. A mérkőzés feltételei az emberi játé- 
kosnak sokkal jobban kedveztek. és a hardver egy közönséges PC volt, nem egy szuper- 
számítógép. Kramnyik véleménye szerint mégis , most már világos. hogy a csúcsprog- 
ramok és a világbajnok közel azonos szinten vannak". 


Dámajáték 


Az IBM-nél dolgozó Arthur Samuel szabad idejében 1952-től kezdve kifejlesztett egy 
dámaprogramot, mely a kiértékelő függvényét több ezerszer saját maga ellen játszva ma- 
ga tanulta meg. Ezt az ötletet a 21. fejezetben tárgyaljuk részletesebben. Samuel prog- 
ramja egy kezdő játékos szintjén kezdett játszani, de miután néhány napig önmagával 
játszott, már Samuel játékszintjét is felülmúlta (bár Samuel nem számított erős játékos- 
nak). 1962-ben a program Robert Nealyt — a ,,vak dámajáték" bajnokát is megverte, egy 
hibás lépése miatt. Sokan azt hitték, hogy ezzel bizonyítást nyert, hogy dámajátékban 
a gép erősebb, mint az ember, azonban ez így nem igaz. Ha viszont figyelembe vesszük, 
hogy Samuel számítógépe (egy IBM 704-es) 10 000 szavas memóriával, háttértárként 
mágnesszalagos egységgel és majdnem egy milliszekundumos ciklusidővel rendelke- 
Zett, ez a győzelem az MI nagy eredményeinek egyike marad. 

Kevesen próbálták meg túlszárnyalni ezt a teljesítményt, amíg Jonathan Schaeffer és 
kollégái ki nem fejlesztették a Chinookot, amely közönséges PC-n futott és alfa béta ke- 
resést alkalmazott. A Chinook egy olyan előre létrehozott adatbázissal dolgozott, amely 
az összes nyolc vagy kevesebb bábut tartalmazó 444 milliárd állásból épült fel, hogy a 
végjátéka hibátlan legyen. 1990-ben az U.S. Openen a Chinook másodikként futott be 
és megnyerte a jogot, hogy a világbajnoki címért mérkőzzön. Ekkor a program Marion 
Tinsley képében egy problémába ütközött. Dr. Tinsley már 40 éve világbajnok volt és 
ez alatt a 40 év alatt összesen csak három játszmát vesztett. A Chinookkal vívott első 
mérkőzésén elszenvedte a negyedik, majd az ötödik vereségét is, de a bajnokságot 
20,5:18,5 pontra megnyerte. 1994 augusztusában a Tinsley és a Chinook közötti világ- 
bajnoki mérkőzés idő előtt félbeszakadt, amikor Tinsleynek egészségügyi problémák 
miatt vissza kellett vonulnia. A Chinook lett a hivatalos világbajnok. 

Schaeffer úgy gondolja, hogy megfelelő számítási teljesítménnyel a végjátékok adat- 
bázisát annyira ki lehetne bővíteni, hogy a kezdeti pozíciótól induló előre keresés vala- 
melyik már megoldott pozíciót mindig el tudná érni, vagyis a dámajáték teljesen 
megoldható lenne (volt, hogy a Chincok már az 5-ik lépésnél győzött). Az ilyen 
kimerítő elemzést kézi módszerekkel a 3 x 3-as amőbára meg lehet tenni és számító- 
gépen a 4 x 4 x 4-es amőbára (Oubic), a Go-Mokura (öt egy sorban) és a Nine-Men"s 
Morrisra is elvégezték (Gasser, 1998). Ken Thompson és Lewis Stiller figyelemre 
méltó munkája (Fhompson és Stiller, 1992) az összes öt- és hatfigurás sakkvégjátszmát 
is megoldotta, az eredményeket az interneten hozzáférhetővé téve. Stiller egy olyan 
kényszermatt esetét is felfedezte, amely 262 lépést igényelt. Ez egy kis felfordulást 
okozott, mert a sakk szabályai megkövetelik, hogy 50 lépés alatt valamilyen , előre- 
haladásnak" kell történnie. 
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Othello 


Az Othello vagy más néven Reversi számítógépes játékként talán népszerűbb, mint táb- 
lajátékként. Keresési tere kisebb, mint a sakké, általában 5-15 megengedett lépés van, 
de a kiértékelő szaktudást a semmiből indulva kellett kifejleszteni. 1997-ben a Logis- 
tello program (Buro, 2002) az emberi világbajnokot, Takeshi Murakamit, képes volt hat 
nullára megverni. Általánosságban elfogadott, hogy az Othellóban az emberek nem el- 
lenfelei a számítógépeknek. 


Ostábla 


A 6.5. alfejezetben elmagyaráztuk, hogy a kockadobásból eredő bizonytalanság a mély 
keresést drága luxussá teszi. Az ostáblára vonatkozó kutatások zöme a kiértékelő függ- 
vény javítására összpontosult. Gerry Tesauro (Tesauro, 1992) neurális hálós technikákkal 
(lásd 20. fejezet) ötvözte Samuel megerősítéses tanulási módszerét, hogy egy figyelemre 
méltó kiértékelő függvényt hozzon létre, amit 2-es, illetve 3-as mélységű kereséssel 
együtt használt. A saját magával játszott több mint egy millió tanító játszma után Tesauro 
programja, a TD-GAMMON a világranglistán stabilan az első három játékos között foglal 
helyet. A program eredményei alapján a játék nyitó lépéseit tekintve egyes esetekben az 
eddigi gyakorlat radikálisan megváltozott. 


Gó 


Ázsiában a gó a legnépszerűbb táblajáték, ami a mesterektől legalább olyan felkészült- 
séget igényel, mint a sakk. A 19 x 19-es tábla miatt az elágazási tényező 361-gyel in- 
dul, így a hagyományos keresési algoritmusok teljesen használhatatlanok. Egészen 
1997-ig kompetens programoknak híre-hamva sem volt, most azonban már programok 
is képesek elfogadható lépéseket tenni. A legjobb programok többsége alakzatfelisme- 
rési technikákat (amikor adott alakzat előfordul, akkor bizonyos lépés megtételét kell 
megfontolni) korlátos kereséssel (annak eldöntésére, hogy bizonyos köveket el lehet-e 
fogni, egy lokális területen maradva) kombinál. A könyv írásának idején a legerősebb 
programok valószínűleg Chen Zhixing Goemate és Michael Reiss Go44-4 programja 
voltak, mindegyiket kb. 10 kyu-ra (gyenge amatőrszint) értékelték. A gó olyan terület- 
nek tűnik, ami a kifinomult következtetési módszereket alkalmazó intenzív kutatásokból 
valószínűleg nyerhet. Sikert hozhat például az, hogy megtaláljuk annak a módját, hogy 
sok, lazán csatolt , részjátszmára" (amire a gó dekomponálható) vonatkozó lokális követ- 
keztetés néhány szálát hogyan kellene integrálni. Az ilyen technikák az intelligens rend- 
szerek szempontjából hihetetlen értéket képviselnek. 


Bridzs 


A bridzs egy nem tökéletes információjú játék — az egyik játékos kártyái a többi játé- 
kos elől el vannak rejtve. A bridzs többszemélyes játék is egyben, négy játékossal kettő 
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helyett, bár a játékosok két csapatot alkotnak, párban. Ahogyan ezt a 6.5. alfejezetben 
láttuk, egy bridzsparti optimális lejátszása az információgyűjtés, a kommunikáció, a 
biöffölés és a valószínűségek gondos mérlegelésének az elemeit is tartalmazhatja. 
E technikákból számos elemet használ a Bridge BaronTM program (Smith és társai, 
1998), amely megnyerte az 1997-es Számítógépes Bridzsbajnokságot. Bár nem játszik 
optimálisan, a Bridge Baron azon ritka sikeres, játékot játszó programok egyike, ame- 
lyek hierarchikus tervkészítési technikákat alkalmaznak (lásd 12. fejezet), olyan magas 
szintű, bridzsjátékosok számára ismerős ötleteket felhasználva, mint az impasszolás 
(finessing) és a dobáskényszer (sgueezing). 

A GIB program (Ginsberg, 1999) meggyőző fölénnyel nyerte meg a 2000. évi baj- 
nokságot. A GIB a , jövőbe látás szerinti átlagolás" módszerét használja, két lényegi 
módosítással. Először, ahelyett hogy megvizsgálná, hogy egy adott választás mennyire 
bizonyul jónak a rejtett kártyák minden lehetséges kombinációja mellett (amiből 10 
millió is lehet), a program egy véletlenszerűen választott 100 kombinációból álló min- 
tát vizsgál. Másodszor, a GIB magyarázatalapú általánosítást (explanation-based 
generalization) használ arra, hogy különféle standard helyzetekre az optimális játékve- 
zetés általános szabályait kiszámítsa és eltárolja. Ez lehetővé teszi minden leosztás eg- 
zakt megoldását. A GIB taktikai pontossága ellensúlyozza azt, hogy az információra 
következtetni nem tud. Az 1998-as emberi világbajnokságon az egyenlő rangú mérkő- 
zésen (egy leosztás lejátszásában) 35-ből 12-ikként végzett, az emberi szakértők elvá- 
rásait messze túlszárnyalva. 


6.7. ÉRTÉKELÉS 


Mivel a játékokban az optimális döntés kiszámítása a legtöbb esetben kezelhetetlen, 
ezért az összes algoritmusnak valamilyen feltételezéssel és közelítéssel keli élnie. 
A minimax algoritmuson, kiértékelő függvényeken és az alfa-béta algoritmuson alapu- 
ló standard megközelítés csak egy lehetséges megoldás. Valószínűleg a standard meg- 
közelítés azért emelkedik ki a versenyjátékokra alkalmazott többi módszer közül, mert 
korán vetették fel és intenzíven fejlesztették. A terület néhány szakértője úgy gondolja, 
hogy a játékok épp ezért váltak el az MI fő irányvonalától, mert a standard megközelí- 
tés már nem hagy elegendő teret ahhoz, hogy új betekintést nyerjünk a döntéshozatal ál- 
talános kérdéseibe. Ebben a részben az alternatív megközelítésekre fogunk rápillantani. 

Először tekintsük a minimax algoritmust. A minimax optimális módszert ad egy lé- 
Pés kiválasztásához egy adott keresési fából, feltéve, hogy a levélcsomópontok kiérté- 
kelései tökéletesen pontosak. A valóságban azonban a kiértékelések az állás értékének 
durva becslői, és úgy vehetjük, hogy nagy hibával rendelkeznek. A 6.13. ábra egy olyan 
egylépésváltásos játékfát mutat, amire a minimax alkalmatlannak tűnik. A minimax a 
jobb oldali ágat javasolja, holott nagyon valószínű, hogy a bal oldali ág valódi értékei 
nagyobbak. A minimax azon a feltételezésen alapul, hogy a 100-as, a 101-es, a 102-es 
és a 100-as címkét viselő csomópontok mindegyike valóban jobb, mint a 99-es címkét 
viselő csomópont. Az a tény azonban, hogy a 99-es címkéjű csomópontnak 1000-es 
címkéjű testvérei vannak, azt sugallja, hogy a csomópont valódi értéke valójában ma- 
gasabb. Ezen probléma kezelésének egyik lehetséges módja, ha a kiértékelés egy, a le- 
hetséges értékek feletti valószínűség-elosztást ad vissza. Ekkor standard statisztikai 
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MAX 


99 1000 1000 1000 100 101 7 102 100 
6.13. ábra. Egy olyan egylépésváltásos játékfa, amire a minimax alkalmatlannak tűnik 


módszerekkel ki lehet számítani a szülő értékének valószínűség-eloszlását. Sajnos a 
testvércsomópontok értékei általában erősen korreláltak, ezért ez költséges számítás 
lehet, mert olyan részletes ismeretre van szükség, amit általában nehéz beszerezni. 

A következőkben tekintsük a fát generáló kereső algoritmust. Az algoritmustervező 
célja, hogy olyan algoritmust adjon meg, ami megfelelő idő alatt lefut, és jó lépést vá- 
laszt. Az alfa-béta algoritmus legszembetűnőbb problémája, hogy nem arra tervezték, 
hogy egyszerűen kiválasszon egy jó lépést, hanem arra, hogy értékkorlátokat számítson 
ki az összes megengedett lépés értékére. Hogy lássuk, ez a többletinformáció miért 
szükségtelen, tekintsünk egy állást, ahol egyetlen megengedett lépés létezik. Ettől füg- 
getlenül az alfa-béta keresés egy hatalmas és teljesen haszontalan keresési fát generál 
és értékel ki. Természetesen beiktathatunk egy tesztet az algoritmusba, de ezzel csak el- 
rejtjük a problémát — az alfa-béta algoritmus által elvégzett számítások nagy része egy- 
általán nem releváns. Az az eset, amikor csak egyetlen megengedett lépés létezik, nem 
sokban tér el attól az esettől, amikor néhány megengedett lépés létezik, ami közül egy jó, 
a többi pedig nyilvánvalóan katasztrofális. Egy ilyen egyértelműen favorit helyzetben" 
szerencsésebb lenne egy kis keresés után gyors döntésre jutni, mintsem az időt fecsérel- 
ni, amit később egy problémásabb helyzetben esetleg hasznosabban fel lehetne használ- 
ni. Ez elvezet a csomópontkifejtés hasznosságának gondolatához. Egy jó keresési algorit- 
musnak nagy hasznosságú csomópontot kell kiválasztania kifejtésre, vagyis olyat, ami 
valószínűleg egy lényegesen jobb lépés felfedezéséhez vezet. Ha nincs olyan csomópont- 
kifejtés, aminek a hasznossága nagyobb, mint a kifejtésének (időre vonatkoztatott) költ- 
sége, akkor az algoritmusnak be kell fejeznie a keresést, és lépnie kell. Vegyük észre, 
hogy ez nemcsak az egyértelmű favorithelyzetekre működik, hanem a szimmetrikus lépé- 
sekre is, ahol bármennyi keresést is végeznénk, egyik lépés sem mutatkozna jobbnak. 

Azt a fajta következtetést, amikor megmondjuk, hogy milyen számításokat kell vég- 
rehajtani, metakövetkeztetésnek (metareasoning) nevezik (következtetés a következ- 
tetésről). Ez nemcsak a játékokra vonatkozik, hanem mindenfajta következtetésre is. 
Minden számítást azért végzünk el, hogy jobb döntéseket hozhassunk. Mindegyiknek 
van valamilyen költsége, és mindegyik valamilyen valószínűséggel bizonyos javulást 
eredményezhet a döntés minőségében. Az alfa-béta algoritmus a lehető legegyszerűbb 
metakövetkeztetést foglalja magában: olyan tételt, miszerint a fa bizonyos ágait veszteség 
nélkül figyelmen kívül lehet hagyni. Ennél sokkal jobbat is lehet tenni. A 16. fejezetben 
megnézzük, hogy ezeket a gondolatokat hogyan lehet pontossá és megvalósíthatóvá 
tenni. 
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Végezetül ismét vizsgáljuk meg magának a keresésnek a természetét. A heurisztikus 
keresés és a játékok algoritmusai úgy működnek, hogy a kiinduló állapotból induló 
konkrét állapotsorozatokat generálnak, majd alkalmaznak egy kiértékelő függvényt. 
Az emberek nem így játszanak. A sakkban gyakran van egy konkrét célunk — például le 
akarjuk ütni az ellenfél vezérét -, és ezt a célt használhatjuk arra, hogy a cél elérése érde- 
kében szelektíven megfelelő terveket generáljunk. Ez a fajta célvezérelt következtetés 
(goal-directed reasoning) vagy tervkészítés (planning) néha teljesen eltünteti a kombi- 
natorikus keresést (lásd IV. rész). David Wilkins PARADISE programja (Wilkins, 1980) az 
egyetlen olyan program, amely sikeresen alkalmazta a célvezérelt következtetést a sakk- 
ra: néhány 18 lépésből álló kombinációt igénylő sakkfeladványt is képes volt megoldani. 
Ez idáig azonban még nem látjuk tisztán, hogyan kellene a két algoritmustípust egyetlen 
robusztus és hatékony rendszerbe ötvözni, bár a Bridge BaronTY jelenthet egy, a helyes 
irányban tett lépést. Egy ilyen teljesen integrált rendszer jelentős eredménynek számítana 
nemcsak a játékkutatás területén, hanem általánosságban véve az MI-kutatás területén is, 
mert egy általános intelligens ágens számára megfelelő alapot is tudna nyújtani. 


6.8. ÖSSZEFOGLALÁS 


A játékok sokaságát néztük meg, hogy megértsük, mit is jelent optimálisan és a gyakor- 
latban is jól játszani. A legfontosabb gondolatokat az alábbiakban foglalhatjuk össze: 


s Egy játékot a kiinduló állapottal (initial state) (a táblaállással), mindegyik állapotban 
a legális cselekvésekkel (actions), egy végteszttel (terminal test) (ami megmondja, 
hogy mikor ért véget a játék) és egy hasznossági függvénnyel (utility function) (ami 
megmondja, hogy ki és mennyivel nyert) lehet megadni. 

. Tökéletes információval (perfect information) rendelkező kétszemélyes zérus- 
összegű játékoknál a minimax algoritmus a teljes játékfa mélységi felsorolásával 
meg tudja határozni a játékos legjobb lépését. 

a Az alfa-béta algoritmus ugyanazt a számítást végzi el, mint a minimax algoritmus, 
azonban jóval hatékonyabb, mivel lenyesi a keresési fa azon ágait, amiről be tudja 
bizonyítani, hogy a végső eredmény szempontjából irrelevánsak. 

s A teljes játékfa általában nem kezelhető (még az alfa-béta algoritmussal sem), ezért 
a keresést valahol abba kell hagynunk, és egy kiértékelő függvényt (evaluation 
function) kell alkalmaznunk, ami az adott állapot hasznosságának becslőjét adja. 

s A véletlen elemet is tartalmazó játékokat a minimax algoritmus olyan kiterjesztésé- 
vel lehet kezelni, amely a véletlen csomópontokat (chance node) úgy értékeli ki, 
hogy az egyes hasznosságokat a gyermekcsomópontok valószínűségével súlyozva 
veszi az összes gyermekcsomópontjának az átlagos hasznosságát. 

s. A nem tökéletes információjú játékok (imperfect information), mint például a bridzs, 
optimális lejátszása mindegyik játékostól az aktuális és a jövőbeli hiedelmi állapotaira 
(belief states) vonatkozó következtetést igényli. Egy egyszerű közelítés kapható, ha átla- 
goljuk egy cselekvés értékét a hiányos információ minden lehetséges konfigurációjára. 

s A programok egyenlő ellenfelek, vagy akár meg is verik a legjobb emberi játéko- 
sokat dámajátékban, Othellóban és ostáblajátékban, és igen közel állnak ehhez a 
bridzsben. Egy program legyőzte egy kirakatmérkőzésen az emberi sakkvilágbaj- 
nokot. A góban a programok még amatőr szinten játszanak. 
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A mechanikus játékok korai történetére számos csalás rányomta a bélyegét. Ezek közül 
a legnevezetesebb Kempelen Farkas báró 1769-ben kiállított ,, kje", egy feltétele- 
zett sakkautomata, amely Napóleont is megverte, mielőtt kiderült, hogy a szekrénye 
valójában egy törpe növésű emberi sakkmestert rejtett (Levitt, 2000). A Török 1769-től 
1854-ig játszott. Úgy tűnik, Charles Babbage (aki a Török hatása alatt álit) volt az első, 
aki 1846-ban számítógépes sakk és dámajáték megvalósíthatóságának első komoly 
elemzését adta (Morrison és Morrison, 1961). Tervezett egy 3 x 3-as amőbát játszó cél- 
gépet is, amit soha sem épített meg. Az első igazi játékgépet 1890 táján egy spanyol 
mérnök, Leonardo Torres y Ouevedo tervezte és építette meg. A , KRK" a sakkvégjáték- 
ra specializált gép volt (király és bástya a király elten) és képes volt bármilyen kiinduló 
állásból mattot adni. 

A minimax algoritmust sokszor Ernst Zermelo, a modern halmazelmélet atyja 1912-es 
cikkéhez vezetik vissza. A cikk sajnálatos módon tartalmaz hibákat, és a minimaxot nem 
írja le helyesen. A játékelmélet komoly alapjait a nagy hatású Theory of Games and 
Economic Behavior c. munkában Neumann és Morgenstern (Neumann és Morgenstern, 
1944) fektették le, kimutatva azt is, hogy egyes játékokban szükség van randomizált 
(avagy nem megjósolható) stratégiákra. (További információért tásd 17. fejezet.) 

A korai számítógépes korszak számos prominens személyét kíváncsivá tette a számí- 
tógépes sakk lehetősége. Konrad Zuse — aki elsőként tervezett programozható számító- 
gépet — igen részletes ötleteket dolgozott ki arra, hogy ezt hogyan lehetne megvalósíta- 
ni (Zuse, 1945). Norbert Wiener nagy befolyású Cybernetics c. könyve (Wiener, 1948) 
tartalmazta egy számítógépes sakkprogram működésének egy lehetséges vázlatát, a 
minimax keresést, a mélységi levágást és a kiértékelő függvényt is beleértve. Claude 
Shannon a modern számítógépes játékok elvi alapjait sokkal részletesebben fejtette ki, 
mint Wiener (Shannon, 1950). Shannon bevezette az egyensúlyi állás fogalmát, és né- 
hány ötletet vázolt fel a szelektív (nem kimerítő) játékfakeresésre vonatkozólag. Slater 
És az ugyanabban a kötetben a cikkére reflektáló szerzők szintén megvizsgálták a szá- 
mitógépes sakkozás lehetőségeit (Slater, 1950). I. J. Good Shannontól függetlenül 
kidolgozta az egyensúlyi állás fogalmát (Good, 1950). 

1951-ben Alan Turing írta meg az első valódi számítógépes programot, ami képes 
volt egy teljes sakkjátszmát lejátszani (Turing és társai. 1953). Valójában azonban 
Turing programja sohasem futott számítógépen, kézi szimulációval tesztelték egy na- 
gyon gyenge emberi sakkjátékos ellen, aki legyőzte a programot. Időközben D. G. Prinz 
megírt és valóban futtatott is egy programot (Prinz, 1952), ami sakkfeladványokat 
oldott meg, bár nem játszott teljes játszmát. Alex Bernstein írta az első olyan sakkprog- 
ramot, amely egy teljes standard sakkjátszmát játszott (Bernstein és Roberts, 1958; 
Bernstein és társai, 1958).§ 

Az alfa-béta keresés alapötletét John McCarthy dolgozta ki 1956-ban, habár nem 
publikálta. Az NSS-sakkprogram az alfa-béta algoritmus egy leegyszerűsített változa- 
tát használta, ez volt az első sakkprogram, ami ezt alkalmazta (Newell és társai, 1958). 
Nilsson szerint Arthur Samuel dámaprogramja (Samuel, 1959; 1967) szintén alfa-béta 





§ Newell (Neved! és társai, 1958) egy orosz BESM programot említ, amely lehet, hogy Bernstein programját 
me előzte. 
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algoritmust használt, habár maga Samuel ezt nem említi a rendszerről publikált beszá- 
molóiban (Nilsson, 1971). Az 1960-as évek elején jelentek meg az alfa-béta algoritmust 
ismertető cikkek (Hart és Edwards, 1961; Brudno, 1963; Slagle, 1963b). Az alfa-béta 
algoritmus egy teljes implementációját Slagle írta le egy cikkben (Slagle és Dixon, 1969), 
ami a kalah" játékot játszó játékprogram működését ismertette. A John McCarthy egyik 
diákja által írt , Kotok-McCarthy" sakkprogram (Kotok, 1962) is az alfa-béta algorit- 
must használta. Knuth ismerteti az alfa-béta algoritmus történetét (Knuth és Moore, 
1975), megadja az algoritmus teljességének a bizonyítását és elvégzi az időigény elem- 
zését. Knuth és Moore elemzése az alfa-béta keresésnek a követők véletlen sorba rende- 
zésével O((b/logb)") aszimptotikus komplexitást mutatott ki, ami lehangoló eredmény, 
mert a b/logb effektív elágazási tényező magánál a b-nél nem sokkal jobb. Később jöt- 
tek rá, hogy az aszimptotikus képlet csak a b 5 1000 igaz, és az aktuális játékokra talál- 
ható elágazási tényezőkre a gyakran idézett O(4?7/4) érvényes. Pearl megmutatta (Pearl, 
1982b), hogy az alfa-béta algoritmus aszimptotikusan optimális az összes rögzített 
mélységű játékfa-keresési algoritmus között. 

Az első két sakkprogram, ami egymás ellen játszott, a Kotok-McCarthy-program és 
a Moszkvai Elméleti és Kísérleti Fizika Intézet által megírt , ITEP" program (Adelson- 
Velsky és társai, 1970) volt az 1960-as évek közepén. Ezt az interkontinentális mérkő- 
zést távírón játszották le. A küzdelem 1967-ben az ITEP-program 3:1 arányú győzel- 
mével ért véget. A MacHack 6 volt az első olyan sakkprogram, ami sikeresen játszott 
emberek ellen (Greenblatt és társai, 1967). 1400-as Élő-pontszáma jóval több volt, mint 
a kezdők 1000-es Élő-pontja, azonban így is igen messze volt a 2800 vagy több Élő- 
ponttól, ami szükséges lett volna, hogy Herb Simon 1957-es jóslata teljesüljön, misze- 
rint 10 éven belül a számítógépes sakkprogramok lesznek a sakkvilágbajnokok (Simon 
és Newell, 1958). 

Az 1970-es első ACM Észak-Amerikai Számítógépes Sakkbajnoksággal a sakkprogra- 
mok versengése komollyá vált. A korai 1970-es évek programjai igen bonyolultak voltak, 
számos trükköt vetettek be, hogy a keresés bizonyos ágait levágják, elfogadható lépése- 
ket generáljanak stb. Az első Számítógépes Sakkvilágbajnokságot 1974-ben Stockholm- 
ban rendezték. Ezt az első világbajnokságot a Kaissa (Adelson-Velsky és társai, 1975), 
egy másik ITEP-program nyerte meg. Kaissa egy egyszerűbb megközelítésen alapult és 
kimerítő alfa-béta keresést használt egyensúlyi kereséssel vegyítve. A megközelítés fel- 
sőbbrendűségét igazolta a CHESS 4.6 győzelme az 1977-es Számítógépes Sakkvilágbaj- 
nokságon. A CHESS 4.6 lépésenként 400 000 állást elemzett és 1900 Élő-pontot ért el. 

Greenblatt MacHack 6-osának egy későbbi változata volt az első olyan sakkprogram, 
amely már kifejezetten a sakkra tervezett célhardveren futott (Moussouris és társai, 
1979), de a Belle (Condon és Thompson, 1982) volt az első olyan program, ami a cél- 
hardvernek köszönhetően jelentős sikereket ért el. A Belle lépésgeneráló és állásértéke- 
lő hardvere lehetővé tette, hogy lépésenként néhány millió állást is elemezzen. A Belle 
2250 Élő-pontot ért el, és az első mesteri fokozat szintű program lett. A HITECH rendszer 
egy speciális rendeltetésű számítógép volt, amit Hans Berliner, a korábbi levelező sakk- 
világbajnok és egy CMU-beli diákja, Carl Ebeling tervezett, hogy a kiértékelő függ- 
vények gyors számítását tegyék lehetővé (Ebeling, 1987; Berliner és Ebeling, 1989). 


7 A kalah egy afrikai eredetű kétszemélyes játék, amelyben kavicsokat (gyémántokat) kell átrakosgatni csészék 
között. Több számítógépes változata is létezik, I. például: kípriceman.ecn.purdwe.edu/-ee373/katah hunt. (A ford.) 
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A HiITECcH észak-amerikai sakkbajnok lett 1985-ben, és 1987-ben az első olyan program 
volt, amely egy emberi nagymestert is legyőzött. A CMU-n szintén kifejlesztett Deep 
Thought (Hsu és társai, 1990) a tiszta keresés sebességét tovább fokozta. 2551 Élő-pon- 
tot ért el és a Deep Blue előfutára lett. Az 1980-ban alapított Fredkin-díj 5000 dollárt 
ajánlott fel annak a sakkprogramnak, amelyik elsőként éri el a mesterfokozatot, és 
10 000 dollárt ajánlott fel annak a sakkprogramnak, amely elsőként éri el a USCF 
(Amerikai Egyesült Államok Sakkszövetsége) 2500-as Élő-pontot (ez a nagymesteri 
szinthez közeli érték), és 100 000 dollárt ajánlott fel azon sakkprogramnak, amelyik el- 
sőként legyőz egy emberi sakkvilágbajnokot. Az 5000 dolláros díjat 1993-ban a Belle, a 
10 000 dolláros díjat 1989-ban a Deep Thought, majd a 109000 dolláros díjat 1997-ben 
a Deep Blue nyerte el a Kaszparov felett aratott győzelemért. Fontos emlékezni, hogy 
a Deep Blue sikerét mind az algoritmikus javítások, mind a hardver biztosította (Hsu, 
1999: Campbell és társai, 2002). Az olyan technikák, mint a nulla lépés heurisztika 
(Beal, 1990) a keresésben igen szelektív programokhoz vezettek. Az utolsó három Szá- 
míitógépes Sakkvilágbajnokságot 1992-ben, 1995-ben és 1999-ben a standard PC-n futó 
programok nyerték meg. Egy korszerű sakkprogramnak talán a legrészletesebb leírását 
Ernst Heinz adja meg (Heinz, 2000), amelynek DARKTHOUGHT programja volt a legma- 
gasabb pontszámú nem kereskedelmi program az 1999-es világbajnokságon. 

Kísérletek történtek arra, hogy a , standard megközelítés" 6.7. alfejezetben leírt prob- 
lémáit leküzdjék. Az első szelektív kereső algoritmus, elméleti igénnyel, valószínűleg 
a B" algoritmus (Berliner, 1979) volt. ami megkísérli. hogy a játékfa csomópontjainak 
az értékeire egyetlen becsült érték helyett intervallumkorlátokat adjon. A levélcsomó- 
pontok kifejtése annak érdekében történik, hogy a legfelső szintű korlátokat finomítsuk, 
amíg egy , nyilván legjobb" lépést nem találunk. Palay az alfa-béta algoritmus becsült 
értékei, illetve a B" algoritmus intervallumai helyett valószínűség-eloszlásokat használ 
(Palay, 1985). David McAllester konspirációs szám keresési algoritmusa azokat a le- 
vélcsomópontokat fejti ki, amelyek, ha megváltoznának az értékeik, előidéznék, hogy 
az algoritmus a gyökérnél új lépést válasszon (David McAllester, 1988). Az MGSS" 
(Russell és Wefald, 1989) a 16. fejezet fejlett döntéselméleti technikáit használja min- 
den levélcsomópont kifejtésének értékbecslésére a gyökérszintű döntés minőségében 
tapasztalt várható javulás függvényében. Ez a program az Othellóban képes volt jobb 
eredményeket elérni, mint az alfa-béta algoritmus, annak ellenére, hogy egy nagyság- 
renddel kevesebb csomópontot vizsgált meg. Az MGSS" megközelítés elvben alkalmas 
a következtetés bármilyen formájának vezérlésére. 

Az alfa-béta keresés több szempontból a mélységi áglenyeső megfelelője két játékos 
esetén, amit az egyedi ágens esetében az A?" dominál. Az SSS" algoritmus (Stockman, 
1979) egy kétszemélyes A?-nak tekinthető, és azonos döntés eléréséhez soha nem fejt ki 
több csomópontot. mint az alfa-béta algoritmus. Eredeti formájában az SSS" memória- 
igénye és a sorba állítás számítási overheadje miatt nem praktikus, azonban az RLEK al- 
gorítmusból kifejlesztettek egy lineáris tárkomplexitású változatot (Korf és Chickering, 
1996). Plat az SSS"-ja egy új megközelítést dolgozott ki (Plat és társai, 1996) az alfa- 
béta keresés és a transzpozíciós táblák együtteseként, és megmutatta, hogy az eredeti 
algoritmus problémáit hogyan kell elkerülni, végül MTD(f) néven egy új változatot fej- 
lesztett ki, amit sok kiemelkedő teljesítményű programba építettek be. 

D. F. Beal és Dana Nau a minimax közelítő kiértékelésekre történő alkalmazásoknál 
jelentkező gyengeségeit tanulmányozták (Beal, 1980; Dana Nau, 1980; 1983). Kimutatták, 
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hogy a levélértékeknek a fában való eloszlására bizonyos függetlenségi feltételezésekkel 
élve, a minimax algoritmus kevésbé megbízható becsléseket ad a gyökérre, mintha a ki- 
értékelő függvényeket közvetlenül, mindenféle keresés nélkül alkalmaznánk. Pearl 
Heuristics c. könyve (Pearl, 1984) ezt a látszólagos paradoxont részben megmagyarázza és 
számos játékalgorítmust elemez. Baum és Smith (Baum és Smith, 1997) a minimax egy 
valószínűség-alapú helyettesítését javasolja, és azt mutatja ki, hogy ez bizonyos játékok- 
ban jobb döntésekhez vezet. A keresés különféle szinteken való levágásából és a kiértékelő 
függvény alkalmazásából adódó hatások elmélete még mindig szegényes. 

A várhatóminimax algoritmust Donald Michie vetette fel (Michie, 1966), habár az 
közvetlenül következik Neumann és Morgenstern játékfa-kiértékelési elméletéből. 
Bruce Ballard az alfa-béta nyesést kiterjesztette a véletlen csomópontokat is tartalma- 
zó fákra (Bruce Ballard, 1983). Az első sikeres ostáblaprogram a BKG volt (Berliner, 
1977; 1980b). Csak 1 mélységig keresett és bonyolult, manuálisan összeállított kiérté- 
kelő függvényt használt. Ez volt az első számítógépes program. ami képes volt legyőz- 
ni egy emberi világbajnokot az ismert klasszikus táblajátékok egyikében (Berliner, 
1980a), habár Berliner elsőként ismerte el, hogy ez csak egy rövid, bemutató mérkő- 
zés volt (nem egy világbajnoki mérkőzés), és hogy a BKG nagyon szerencsés , kézzel" 
dobott a kockával. Gerry Tesauro kutatásai, először a NEUROGAMMON (Tesauro, 1989), 
majd a TD-GAMMON (Tesauro, 1995) programokkal, azt mutatták, hogy sokkal jobb 
eredmény érhető el a megerősítéses tanulással (amely területtel a 21. fejezetben fog- 
lalkozunk). 

A dáma, és nem a sakk volt az első olyan klasszikus játék, amire egy valóban számí- 
tógépen futó program képes volt végigjátszani egy teljes játszmát. Christopher Strachey 
írta az első működőképes dámajátékprogramot (Strachey, 1952). Schaeffer (Schaeffer, 
1997) nagyon olvasmányosan leírja a Chinook — a világbajnok dámajátékprogram — 
fejlesztéstörténetét az összes műhelytitkával együtt. 

Az első góprogramokat valamivel a dáma- és a sakkprogramok után fejlesztették ki 
(Lefkovitz, 1960. Remus, 1962), és lassabban fejlődtek a dáma- és a sakkprogramok- 
nál. Ryder tiszta keresésalapú megközelítést használt (Ryder, 1971) a szelektív nyesé- 
si módszerek egész palettájával, hogy le tudja győzni a hatalmas elágazási tényezőből 
adódó problémát. Zobrist feltétel-cselekvés szabályokat használt elfogadható lépések 
generálására, ha a játékban ismert alakzatok jelentek meg (Zobrist. 1970). Reitman és 
Wilcox jó eredménnyel kombinálta a szabályokat és a keresést (Reitman és Wilcox, 
1979), a legtöbb modern program követte ezt a hibrid megközelítést. A számítógépes 
gó jelenlegi állását Müller (Müller, 2002) foglalja össze, és tömérdek hivatkozást is 
közöl. Anshelevich (Anshelevich, 2000) hasonló módszereket a HEx játékra alkalmaz. 
A friss fejleményekről a Számítógépes Go Szövetség által kiadott Computer Go 
Nevwsletter számol be. 

A számítógépes játékokról több fórumon jelennek meg cikkek. A felettébb félreve- 
zető nevű konferenciakiadvány, a Heuristic Programming in Artificial Intelligence szá- 
mol be a Számítógépes Sakkolimpiákról, amely rendezvények a játékok egész sorára 
terjednek ki. A játékprogramok kutatásáról fontos cikkeket publikáltak számos szer- 
kesztett cikkgyűjteményben (Levy, 1988a; Levy, 1988a; Marsland és Schaeffer, 1990). 
Az 1977-ben alapított Nemzetközi Számítógépes Sakkszövetség (International Compu- 
ter Chess Association, ICCA) negyedévenként adja ki az ICGA Journalt (korábban 
ICCA Journal). (Clarke, 1977) óta fontos cikkek jelentek meg az Advances in Computer 
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Chess antológiasorozatban. Az Artificiai Intelligence folyóirat 134. kötete (Artificial 
Intelligence, 2002) leírásokat tartalmaz a legfejlettebb sakk, Othello, Hex, shogi, gó, 
ostábla, póker, ScrabbleTX és más játékprogramokról. 


Feladatok 


6.1. 


6.3. 


Ez a feladat a játékok alapvető elveit a 3 x 3-as amőbán (körök és ikszek) ke- 
resztül gyakoroltatja be. X,, azon sorok, oszlopok vagy átlók számát jelöli, ahol 
pontosan s db X, míg egyetlen O sem található. Hasonlóan, O,, azon sorok, osz- 
lopok vagy átlók számát jelöli, ahol pontosan n db O, míg egyetlen X sem talál- 
ható. A hasznosságfüggvény --1-et rendel minden olyan álláshoz, ahol X; — I, 
és -1-et rendel minden olyan álláshoz, ahol 03 — 1. Az összes többi végállás 
hasznossága 0. A nem végállapotok esetén az alábbi módon definiált lineáris 
kiértékelő függvényt fogjuk használni: 

Kiértékel(s) — 3X.(5) -- XI(5) - (302(5) 4 01(5)) 


(a) Körülbelül hány különböző 3 x 3-as amőbajátszmát lehet lejátszani? 

(b) Üres táblából kiindulva, a szimmetriát is figyelembe véve, 2-es mélységig 
(vagyis egy X és egy 0 a táblán) mutassa meg a teljes játékfát. 

(c) A fában 2-es mélységben tüntesse fel az összes álláskiértékelést. 

(d) A fában az 1-es és a 0-s mélységben levő állásokhoz a minimax algoritmust 
felhasználva tüntesse fel a felfelé terjesztett értékeket. és használja fel azo- 
kat a legjobb kezdő lépés meghatározásához. 

(e) Karikázza be a 2-es szinten levő azon csomópontokat, amelyeket az alfa- 
béta nyesés alkalmazása esetén az algoritmus nem értékelne ki, feltételez- 
ve, hogy a csomópontokat az algoritmus az alfa-béta nyeséshez optimális 
sorrendben generálja. 


Bizonyítsa be az alábbi állítást: minden játékfa esetén a MAX által kapott hasz- 
nosság, amikor MAX a minimax döntést használva játszik egy szuboptimális 
MIN-nel szemben, sohasem lesz alacsonyabb, mint az a hasznosság, ami akkor ér 
el, ha egy optimális MIN-nel szemben játszana. Ki tud találni egy olyan játékfát, 
ahol MAX egy szuboptimális stratégiával egy szuboptimális MIN-nel szemben 
még jobban teljesítene? 


Tekintse a 6.14. ábrán látott kétszemélyes játékot. 
(a) Rajzolja fel a teljes játékfát az alábbi konvenciót alkalmazva: 
s minden állapotot (S4, Sp) formában írja fel, ahol S4 és Sg a zsetonok 
helyzete. 
s minden végállapotot egy négyzetbe, a játékértékét pedig egy körbe írja be. 
s a hurokállapotokat (azon állapotok, amelyek már megjelentek a gyö- 
kérig vezető út mentén) dupla négyzetekbe írja be. Mivel nem világos, 
hogy az ilyen állapotok értéke mennyi, jelölje be mindegyiket egy körbe 
írt ,,?"-lel. 
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64. 


(b) Most mindegyik csomóponthoz írja be a visszaterjesztett minimax értékét 
(szintén egy körbe írva). Magyarázza meg, hogy a ,,?" értékeket hogyan 
kezelte, és miért? 

(c) Magyarázza meg, hogy a standard minimax ebben a játékfában miért ful- 
ladna kudarcba, és röviden vázolja fel, hogy a (b) kérdésre adott válaszra 
támaszkodva hogyan lenne képes az algoritmust megjavítani. Képes-e a 
módosított algoritmus megadni az optimális döntéseket az összes hurkokat 
tartalmazó játékban? 

(d) Ez a 4-négyzetes játék n négyzet esetére általánosítható, minden n 5 2-re. 
Bizonyítsa be, hogy A győz, ha n páros, és veszít, ha n páratlan. 





1 2 3 4 


6.14. ábra. Egy egyszerű játék kiinduló állása. Az A játékos indul elsőnek. Mindkét játékos fel- 
váltva lép és a zsetonját a szomszédos szabad helyre helyezheti, mindkét irányban. Ha a szom- 
szédos mező foglalt, akkor a játékos az ellenfél felett átugorhat a következő szabad helyre, ha 
van ilyen. (Például ha A a 3-n és B a 2-n van, akkor A visszaléphet 1-re.) A játéknak vége, 
ba az egyik játékos eléri a tábla ellentétes végét. Ha az A játékos elsőnek éri el a 4-et, a játék 
értéke --I, ha B játékos éri el elsőnek az 1-et. a játék értéke az A számára -I. 


Implementáljon lépésgenerátort és kiértékelő függvényt az alábbi játékok közül 
néhányat: kalah, Othello, dáma, sakk. Az implementációt használva tervezzen 
egy általános alfa-béta játékágenst. Hasonlítsa össze a keresési mélység növelé- 
sének, a lépéssorrendezés tökéletesítésének és a kiértékelő függvény tökéletesí- 
tésének a hatását. Milyen közel esik az Ön effektív elágazási tényezője a töké- 
letes lépéssorrendezés ideális esetéhez? 


Állítsa elő az alfa-béta nyesés helyességének formális bizonyítását. Ehhez 
tekintse a 6.15. ábrán bemutatott helyzetet. A kérdés az, hogy az algoritmus 
lenyesse-e az n; csomópontot, ami egy max-csomópont és az si leszármazottja. 
Az alapötlet, hogy akkor és csak akkor nyessük le, ha n minimax értéke igazol- 
hatóan független n; értékétől. 

(a) ni értékét az alábbi képlet adja meg: 


ny — min(m, ni, .... 122) 


Adjon egy hasonló kifejezést n2-re, és ny-re, mj-t felhasználva. 

(b) Legyen [; az n; csomóponttól balra levő, ismert minimax értékű, ; mélység- 
ben található csomópontok minimális (maximális) csomópontértéke. Hason- 
lóan, legyen r; az n;, csomóponttól jobbra levő, még ki nem fejtett, i mély- 
ségben található csomópontok minimális (maximális) csomópontértéke. 
Az ny-re előbb meghatározott kifejezést írja át I; és r; értékekkel kifejezve. 

(c) Most fogalmazza át a kifejezést, hogy megmutassa. ahhoz. hogy n; befolyá- 
solja ny-et, nj-nek meg kel! haladnia bizonyos, az I; értékekből meghatározott 
korlátot. 


242 6. KERESÉS ELLENSÉGES KÖRNYEZETBEN 





6.15. ábra. Az a helyzet, amikor az algoritmus eldönti, hogy lenyesheti-e az n, csomópontot 


(d) Az eljárást ismételje meg arra az esetre, amikor az n; egy min-csomópont. 


Implementálja a véletlen csomópontokat tartalmazó játékfák lenyesésére alkal- 
mas várhatóminimax és "-alfa-béta algoritmust, amit Ballard (Ballard, 1983) ír 
le. Próbálja ki azokat az algoritmusokat olyan játékokon, mint az ostábla, és 
mérje meg a "-alfa-béta nyesési hatékonyságát. 





6.7. — Bizonyítsa be, hogy a levélcsomóponti értékek pozitív lineáris transzformációja 
(azaz egy transzformáció x-től ax -t b-ig, ahol a 5 0), nincs befolyással a lépések 
választékára a játékfában, akkor sem, ha léteznek benne véletlen csomópontok. 


6.8. Tekintse az alábbi eljárást a lépések megválasztására a véletlen csomópontot is 
tartalmazó játékokban: 

s Generáljon egy megfelelő számú (mondjuk 50) kockadobásból álló sorozatot 
egy megfelelő (mondjuk 8) mélységig. 

s Ismert kockadobások esetén a játékfa determinisztikussá válik. Minden egyes 
kockadobás-sorozatra oldja meg az eredményül kapott determinisztikus já- 
tékfát az alfa-béta algoritmussal. 

s Az eredményeket használja fel az egyes lépések értékének megbecslésére, és 
válassza ki a legjobb lépést. 

Helyesen fog működni ez az eljárás? Miért (nem)? 


6.9. Írjon és implementáljon egy valós idejű, többszemélyes játszókörnyezetet, ahol 
az idő a környezeti állapot része, és a játékosok rögzített időszeleteket kapnak. 


6.10. Adja meg és/vagy implementálja az alábbi játékok egyikére vagy akár többre is 
az állapotleírást, lépésgenerálást és a kiértékelő függvényt: Monopoly, Játék a 


6.8. ÖSSZEFOGLALÁS 243 


6.11. 


6.12. 


6.13. 


6.14. 


6.15. 


6.16. 


betűkkel, bridzs (egy konkrét licitet feltételezve) és póker (válassza meg a ked- 
venc változatát). 


Gondosan tekintse át a 6.10. feladat minden egyes játékában a véletlen esemé- 

nyek és a részleges információk összefüggéseit. 

(a) Melyikre lesz jó a standard várhatóminimax modell? Implementálja az. al- 
goritmust és futtassa le a játékágensében a játékkörnyezet szükséges módo- 
sításaival. 

(b) Melyekre lenne jó a 6.8. feladatban leírt séma? 

(c)  Vitassa meg, hogyan kellene kezelni azt a tényt, hogy egyes játékokban a 
játékosok nem rendelkeznek ugyanazzal az információval az aktuális álla- 
potról. 


A minimax algoritmus feltételezi, hogy a játékosak felváltva lépnek, az olyan 
kártyajátékokban azonban, mint a whist vagy a bridzs, mindig a leütés győztese 
indul a következőnek. 

(a) Módosítsa algoritmusát, hogy e játékokra ís megfelelően működjön. Felté- 
telezheti, hogy rendelkezésére áll a GyőzrEs(leütés) függvény, amely azt 
adja vissza. hogy az adott leütést mely kártya nyerte meg. 

(b) Rajzolja fel a 228. oldalon látható első leosztásra a játékfát. 


A Chinook dámaprogram kiterjedten használja a végjáték adatbázisokat, ame- 
lyek pontos értéket adnak a játék utolsó hat lépésében előálló összes álláshoz. 
Hogyan lehet egy ilyen adatbázist hatékonyan legenerálni? 


Vítassa meg, hogyan alkalmazható a játékok standard megközelítése az olyan 
játékokra. mint például a tenisz, a póló és a krikett, amelyeket folytonos, fizikai 
állapottérben játszanak. 


Írja le, hogy a minimax és az alfa-béta hogyan változik kétszemélyes, nem 
zérusösszegű játékok esetén, ahol minden játékosnak külön kiértékelő függvé- 
nye van. Feltételezheti, hogy mindegyik játékos mások kiértékelő függvényeit 
ismeri. Ha a két véghasznosság értékére nincs korlát, lehetséges-e valamelyik 
csomópont számára, hogy az alfa-béta lenyesi? 


Tegyük fel, hogy egy olyan sakkprogrammal rendelkezik, amely képes egymil- 
lió csomópontot kiértékelni másodpercenként. Válassza a játékállás egy tömör 
reprezentációját a transzpozíciós tábla számára. Kb. mennyi állást képes eltárol- 
ni memóriában, az 500 Mbájt nagyságú táblában? Elég lesz-e ez a lépésenként 
allokált 3 perces kereséshez? Hány táblakiolvasást képes megvalósítani egy ál- 
láskiértékelés ideje alatt? Most tételezze fel, hogy a transzpozíciós tábla na- 
gyobb, és nem fér el a memóriában. Hány kiértékelést lehetne megvalósítani egy 
diszkhozzáférés ideje alatt, standard diszkhardver mellett? 
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7. LOGIKAI ÁGENSEK 


Ebben a fejezetben olyan ágenseket tervezünk, amelyek képesek reprezentációkat kiala- 
kítani a világról, következtetési folyamatot alkalmaznak a világ új reprezentációjának 
a származtatására, és felhasználják az új reprezentációt a teendők kikövetkeztetésére. 


Ez a fejezet tudásbázisú ágenseket mutat be. A fogalmak, amelyeket itt tárgyalunk — 
a tudás reprezentációja és a tudás alkalmazását lehetővé tevő következtetési folyamatok 
— központi témái a mesterséges intelligencia minden területének. 

Az emberek, úgy tűnik, ismernek a világról számos dolgot, és következtetéseket vé- 
geznek. A tudás és a következtetés fontos a mesterséges ágenseknek is, mert sikeres 
viselkedést tesz lehetővé, amelyet nagyon nehéz volna másképpen elérni. Láthattuk, 
hogy a problémamegoldó ágens számára cselekvéseinek ismerete lehetővé teszi, hogy 
komplex környezetekben jól teljesítsen. A reflexív ágens csak a vakszerencse segítsé- 
gével tudta megtalálni az utat Aradról Bukarestbe. A problémamegoldó ágens tudása 
azonban igen specifikus és rugalmatlan. Egy sakkprogram ki tudja számítani egy király 
helyes lépéseit, de nincsen semmilyen értelmezhető ismerete arról, hogy egy figura 
egyidejűleg nem lehet két különböző mezőn. A tudásbázisú ágens képes kihasználni 
a nagyon általános formában leírt tudást, újra és újra összegyűjtve ennek elemeit úgy, 
hogy az számos célra megfelelő legyen. Gyakran ez a folyamat nagyon messzire kerül 
a pillanatnyi igénytől, például amikor egy matematikus egy tételt bizonyít, vagy ami- 
kor egy csillagász a Föld várható élettartamát számítja. 

A tudás és a következtetés alapvető szerepet játszanak a részben megfigyelhető kör- 
nyezetek kezelésénél is. A tudásbázisú ágens képes összekombinálni az általános tudást 
a pillanatnyi érzetekkel, hogy kikövetkeztesse a pillanatnyi állapot rejtett aspektusait, 
mielőtt cselekvést választ. Ilyen például, amikor egy orvos diagnosztizál egy beteget, 
azaz kikövetkeztet egy közvetlenül nem megfigyelhető betegségállapotot, mielőtt meg- 
határozná a kezelés módját. A tudás egy része, amelyet az orvos használ, könyvekből 
vagy tanároktól megtanult szabályok formájában áll rendelkezésre, más része pedig 
asszociációs minták formájában van, amelyeket lehet. hogy az orvos nem is tud tudato- 
san leírni. Ha ezek is az orvos fejében vannak, akkor tudásnak számítanak. 

A természetes nyelv megértése szintén igényli, hogy rejtett állapotokra következtes- 
sünk, nevezetesen, hogy a beszélő szándékát megismerjük. Amikor azt halljuk, hogy 
, János egy gyémántot látott az ablakon keresztül, és szeretné (azt) megkapni", akkor 
tudjuk, hogy az , azt" a gyémántra vonatkozik, és nem az ablakra. Ilyenkor, talán nem 
is tudatosan, a relatív értékekről meglévő ismereteink segítségével következtetünk. 
Hasonlóan, amikor azt halljuk, hogy , János kidobott egy követ az ablakon keresztül, és 
betörte (azt)", akkor tudjuk, hogy az , azt" az ablakra vonatkozik. A következtetés lehe- 
tővé teszi számunkra, hogy megbirkózzunk a kijelentések virtuálisan végtelen változa- 
tosságával, hétköznapi tudásunk egy véges halmazát felhasználva. 
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Az utolsó érvünk a tudásbázisú ágensek tanulmányozása mellett e rendszerek rugal- 
massága. Képesek explicit célok formájában megadott új feladatokat elfogadni, egy új 
környezetről kapott vagy megtanult új ismeretek révén kompetenssé válni, és frissítve 
a tudásuk releváns részét képesek alkalmazkodni a környezet változásához. 

A 7.1. alfejezetben az ágens általános tervezésével kezdünk. A 7.2. alfejezet egy egy- 
szerű új környezetet, a wumpus világot mutatja be, amelyben illusztrálni fogjuk a tudás- 
bázisú ágens működését a technikai részletek ismertetése nélkül. Ezután a 7.3. alfeje- 
zetben elmagyarázzuk a logika (logic) általános elveit. A könyv JEL. részében végig 
a logika lesz az elsődleges eszköz a tudás reprezentálására. A logikai ágensek tudása 
mindig határozott, minden kijelentés vagy igaz, vagy hamis a világban, habár az ágens 
lehet agnosztikus néhány kijelentéssel kapcsolatban. 

A logika jelentős pedagógiai előnye. hogy egy tudásbázisú ágens egyszerű reprezen- 
tációs formáját jelenti, viszont van néhány komoly korlátja is. A helyzet az, hogy az 
emberek vagy más ágensek által részlegesen megfigyelhető környezetekben végzett 
következtetések jelentős része függ bizonytalan tudás felhasználásától. A logika nem 
tudja ezt a bizonytalanságot jól reprezentálni, ezért az V. részben a valószínűséget tár- 
gyaljuk, amely már képes erre. A VI. és VII. részben számos reprezentációt tárgyalunk, 
köztük néhány folytonos matematikán alapulót, mint a Gauss-görbék keverését, neurá- 
lis hálózatokat és más reprezentációkat. 

A 7.A. alfejezet bemutat egy egyszerű logikát, az ítéletkalkulust (propositional 
logic). Miközben ez lényegesen kevésbé kifejező, mint az elsőrendű logika (first-order 
logic) (8. fejezet), az ítéletkalkulus lehetőséget ad arra, hogy illusztráljuk a logika min- 
den alapvető fogalmát. Létezik egy jól megtervezett technológia az ítéletkalkuluson tör- 
ténő következtetésre, amelyet a 7.5. és 7.6. alfejezetben írunk le. Végül a 7.7. alfejezet 
összekombinálja a logikai ágensek fogalmát az ítéletkalkulus technológiájával, hogy 
egyszerűbb ágenseket építsünk a wumpus világ számára. Azonosítjuk majd az ítéletkal- 
kulus bizonyos hiányosságait, amelyek még hatékonyabb logikák fejlesztését fogják 
motiválni a következő fejezetekben. 


7.1. A TUDÁSBÁZISÚ ÁGENS 


Egy tudásbázisú ágens központi eleme a tudásbázisa (knowledge base). Egyszerűen 
fogalmazva, a tudásbázis mondatok (sentences) halmaza. (Itt a , mondatot" technikai 
fogalomként használjuk. A fogalom kapcsolatban van az angol, a magyar vagy más ter- 
mészetes nyelvek mondataival, de nem azonos velük.) A mondatokat egy nyelv segít- 
ségével fejezzük ki, amelyet tudásreprezentációs nyelvnek (knowledge represen- 
tation language) nevezünk, és a világról szóló állításokat fogalmazunk meg vele. 

Új mondatoknak a tudásbázishoz való hozzáadására, illetve a tudás lekérdezésére 
valamilyen eljárásra van szükségünk. Ezeknek a feladatoknak a tipikus elnevezése a 
KIJELENT, illetve a KÉRDEZ. Mindkét feladat tartalmazhat következtetési (inference), 
azaz új mondatok levezetését régiekből. A logikai ágenseknél (logical agents), amelyek- 
kel ebben a fejezetben foglalkozunk, a következtetéssel szemben az alapvető köve- 
telmény, hogy amikor valaki KÉRDEZ egy kérdést a tudásbázisról, akkor a válasznak 
következnie kell azokból a mondatokból, amit korábban a tudásbázishoz hozzáadtunk 
(pontosabban KHELENT-ettünk). Később a fejezetben még pontosabban leírjuk az igen 
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fontos , következik" fogalom jelentését. Most egyelőre ez jelentsen csak annyit, hogy 
a következtetési folyamat során nem csak úgy egyszerűen keletkeznek dolgok. 

A 7.1. ábra egy tudásbázisú ágens programjának vázát mutatja. Mint ahogy az összes 
ágensünk, ez ís észlel valamit bemenetként, és egy cselekvést ad vissza válaszként. 
Az ágens fenntart egy tudásbázist, 7B-t, amely kezdetben bizonyos háttértudást 
(background knowledge) tartalmazhat. Ha az ágensprogramot meghívják, az három 
dolgot tesz. Először KIJELENT-i a tudásbázisnak, hogy mit észlelt. Másodszor KÉRDEZ-i 
a tudásbázist, hogy milyen cselekvést kell végrehajtania. A lekérdezés megválaszolásá- 
nak folyamatában egyre bővülő következtetést lehet végezni a világ pillanatnyi állapo- 
táról, a lehetséges cselekvéssorozatok eredményéről és így tovább. Harmadszor az ágens 
rögzíti a kiválasztott cselekvést a KIJELENT felhasználásával, és végrehajtja a cselekvést. 
A második KIJELENT azért szükséges, hogy a tudásbázissal tudassuk, hogy a feltételezett 
cselekvés végrehajtása megtörtént. 





function  TB-ÁGEnstészlelés) returns egy cselekvés 
static: TB, egy tudásbázis 
1, egy számláló, kezdetben 0, mutatja az időt 


KIJELENT(7B, ÉSZLELÉS-MONDAT-KÉszíÉS[észtelés, 1) 
cselekvés — KÉRDEZITB, CSELEKVÉS-KÉRDEZÉS-KÉSZÍTÉS(1)) 
KIJELENT(TB, CSELEKVÉS-MONDAT-KÉSZÍTÉS cselekvés. 1) 
tert 

return cselekvés 








7.1. ábra. Egy általános tudásbázisú ágens 


A reprezentációs nyelv részletei három függvényben vannak elrejtve, amelyek az 
érzékelők és beavatkozók, az alapreprezentáció, valamint a következtető rendszer kö- 
zötti kapcsolatot valósítják meg. Az ÉSZLELÉS-MONDAT-KÉSZÍTÉS eljárás egy olyan 
mondatot konstruál, amelyik megállapítja, hogy az ágens egy adott pillanatban észlelte 
az érzékelt dolgot. A CSELEKVÉS-KÉRDEZÉS-KÉSZÍTÉS az időt felhasználva bemeneti 
adatként, visszatér egy mondattal, amely alkalmas arra, hogy megkérdezzük, milyen 
cselekvés szükséges ebben a pillanatban. Végül a CSELEKVÉS-MONDAT-KÉSZÍTÉS egy 
olyan mondatot hoz létre, ameiy megállapítja, hogy a kiválasztott cselekvés végre- 
hajtása megtörtént. A következtetési mechanizmus részletei a KIJELENT És a KÉRDEZ 
eljárások belsejében vannak elrejtve. A későbbi fejezetekben ezeket a részleteket is 
bemutatjuk. 

A 7.1. ábra ágense egészen hasonlónak tűnik, mint a 2. fejezetben bemutatott belső 
állapottal rendelkező ágens. Azonban a KIJELENT és a KÉRDEZ eljárások definíciója 
miatt a tudásbázisú ágens nem egy tetszőleges, cselekvéseket meghatározó program. 
Meghatározható egy leírással a tudásszinten (knowledge level), ahol csak azt kell 
megfogalmaznunk, hogy mit tudjon és milyen céljai legyenek az ágensnek, hogy rög- 
zíthessük a viselkedését. Például egy automata taxi számára a cél lehet egy utas elszál- 
lítása Marin megyébe, és a taxi ismerheti, hogy ez San Franciscónál van, és a Golden 
Gate híd az egyetlen, amelyen keresztül oda el lehet jutni. Ezután feltételezhetjük, hogy 
átmegy a Golden Gate hídon, mivel tudja, hogy el fogja érni a célját. Vegyük észre, 
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hogy ez az elemzés független attól, hogy a taxi hogyan is működik az implementáci- 
ós szinten (implementation level). Nem számít, hogy a földrajzi elhelyezkedéssel 
kapcsolatos tudása láncolt listákkal vagy pixeltérképekkel van megvalósítva, vagy 
hogy vajon a következtetést regiszterekben tárolt szimbólumok listáinak manipulálásá- 
val vagy neuronhálókban zajos jelek továbbküldésével végzi el. 

Említettük a fejezet bevezetőjében, hogy egy rudásbázisú ágens megalkotható úgy, 
hogy KUELENT-jük számára, hogy mit szükséges tudnia. Az ágens inicializáló program- 
ja a tervező környezetről lévő tudását leíró mondatok egyenkénti átadásával építhető 
fel, még mielőtt az ágens elkezdené érzékelni a környezetét. Rendkívül leegyszerűsíti 
az ágens létrehozásának problémáját, ha olyan reprezentációs nyelvet tervezünk, 
amellyel egyszerű lesz ennek a tudásnak mondatokban való megfogalmazása. A rend- 
szerépítésnek ezt a megközelítési módját deklaratív (declarative) módszernek nevez- 
zük. Ezzel szemben a procedurális (procedural) megközelítés közvetlenül a program 
kódjában rögzíti a kívánt viselkedést, amivel minimalizálja az explicit reprezentáció 
És a következtetés szerepét, és így lényegesen hatékonyabb rendszer jöhet létre. Mind 
a kétféle ágensre látunk majd példát a 7.7. alfejezetben. Az 1970-es és 1980-as évek- 
ben a két megközelítés támogatói parázs vitákat folytattak. Mi mára felismertük, hogy 
egy sikeres ágens tervezésekor kombinálni kell a deklaratív és a procedurális elemeket. 

Amellett hogy KUELENT-hetjük az ágensnek, hogy mit kell tudnia, adhatunk is szá- 
mára egy olyan mechanizmust, amely képessé teszi őt, hogy saját maga megtanulja ezt. 
Ez a mechanizmus, amit a 18. fejezetben tárgyalunk, általános, a környezetre vonatkozó 
tudást hoz létre érzetek sorozatának felhasználásával. Ezt a tudást bele lehet illeszteni az 
ágens tudásbázisába, és felhasználható a döntések meghozatalakor. Ily módon az ágens 
teljesen autonómmá válhat. 

Ezek a képességek — a reprezentáció, a következtetés és a tanulás — mind a logika 
elméletének és technológiájának több évszázados fejlődésén alapulnak. Mielőtt azon- 
ban az elméletet és a technológiát elmagyaráznánk, létrehozunk egy egyszerű világot, 
amelyet majd felhasználunk ezek illusztrálásához. 


7.2. A WUMPUS VILÁG 


A wumpus világ (wumpus world) egy barlang, amely szobákból és az ezeket össze- 
kötő átjárókból áll. A wumpus egy szörnyeteg, aki mindenkit megesz, ha a szobájába 
lép, a barlangban lapul valahol. Az ágens le tudja lőni a wumpust, de csak egyetlen 
nyila van ehhez. Néhány szoba feneketlen csapdát tartalmaz, amely mindenkít csapdá- 
ba ejt, aki belép a szobába (kivéve a wumpust, aki túl nagy ahhoz, hogy beleessen). 
A wumpus környezetében az egyetlen csábító lehetőség, hogy egy halom aranyat lehet 
találni. Habár a wumpus világ meglehetősen unalmas a modem számítógépes játékokhoz 
képest, azonban a játék kiváló tesztkörnyezet az intelligens ágensek számára. Michael 
Genesereth volt az első, aki javasolta ennek a környezetnek az alkalmazását. 

Egy példa wumpous világ látható a 7.2. ábrán. A példakörnyezet pontos definícióját, 
ahogy a 2. fejezetben javasoltuk, a TKCSÉ-leírással adjuk meg: 


a  Teljesítménymérték: --1000 az arany felvétele, —1000 a csapdába esés vagy ha 
a wumpus felfal, —I minden végrehajtott cselekvés, —10 a nyíl használata. 
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7.2. ábra. Egy tipikus wumpus világ. Az ágens a bal alsó sarokban van. 


s Környezet: Egy szobákból álló 4 x 4-es háló. Az ágens mindig az [1,1]-gyel jelölt 
négyzetből indul, arccal jobbra nézve. Az arany és a  wumpus elhelyezkedése vélet- 
lenszerűen, a kiinduló négyzeten kívüli négyzetek közül egyenletes eloszlás szerint 
van megválasztva. Ezen kívül még bármely, a kiinduló négyzeten kívüli négyzet 0.2 
valószínűséggel lehet csapda. 

s Cselekvések: Az ágens mozoghat előre, fordulhat balra 907-kal, vagy fordulhat 
jobbra 90"7-kal. Az ágens szörnyűséges halált hal, ha belép egy négyzetbe, ahol csap- 
da van vagy egy élő wumpus található. (Biztonságos, habár meglehetősen rossz illa- 
tú egy olyan négyzetbe belépni, amelyben egy halott wumpus van.) Az előrelépés- 
nek nincs hatása, ha egy fal van az ágens előtt. A Megragad cselekvést lehet arra 
használni, hogy az ágens felvegyen egy tárgyat, amely vele azonos szobában van. 
A Lövés cselekvést lehet használni egy nyílnak abban az irányban történő kilövésé- 
re, amerre az ágens éppen áll. A nyíl addig repül, amíg el nem találja (és egyben meg 
nem öli) a wumpust, vagy falnak nem ütközik. Az ágensnek csak egy nyila van, így 
csak egy Lövés cselekvésnek van hatása. 

. Érzékelők: Az ágensnek öt érzékelője van, mindegyik egyetlen bitnyi információt ad; 
o A wumpoust tartalmazó négyzetben és a közvetlenül (nem átlósan) szomszédos 

négyzetekben az ágens bűzt érez. 
o A csapdával közvetlenül szomszédos négyzetekben az ágens szellőt érzékel. 
o A négyzetben, ahol az arany található, az ágens csillogást érzékel. 
o Ha az ágens falnak megy, akkor ütést érzékel. 
0 Ha a wumpust megölték, akkor egy elkeseredett sikolyt hallat, amit a barlangban 
bárhol hallani lehet. 
Az érzeteket az ágens egy öt szimbólumot tartalmazó lista formájában kapja meg; 
például ha bűz és szellő van egy négyzetben, de nincs ütés, csillogás vagy sikoly, ak- 
kor az ágens egy [Bűz, Szellő, Nincs, Nincs, Nincs) érzetet kap. 


A 7.1. feladatban definiálni kell egy wumpus környezetet a 2. fejezetben megadott kü- 
lönböző dimenziók mentén. Az alapvető nehézség az ágens számára, hogy kezdetben 
semmit sem tud a környezet konfigurációjáról. Úgy tűnik, hogy logikai következtetésre 
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van szüksége az ágensnek ahhoz, hogy felülkerekedhessen a tudatlanság okozta hátrá- 
nyon. A wumpus világok legtöbb példányában az ágens számára lehetséges az arany 
biztonságos megszerzése. Néhány környezetben azonban az ágensnek választania kell, 
hogy hazamegy-e üres kézzel, vagy kockázatot vállal, ami vagy az aranyhoz vagy a ha- 
lálhoz vezet. És a környezetek 219-a teljesen tisztességtelen (mivel az arany egy csap- 
dában van vagy csapdákkal körülvett mezőben). 

Nézzünk meg egy tudásbázisú wumpus ágenst, hogy hogyan fedezi fel a 7.2. ábrán 
látható környezetet. Az ágens kezdeti tudásbázisa a környezetet leíró, az előzőkben 
felsorolt szabályokat tartalmazza. Nevezetesen tudja, hogy az [1, 1]-ben tartózkodik és 
hogy az (1, I] biztonságos hely. Látni fogjuk, hogy hogyan bővül az ágens tudása, 
amint új érzékelések érkeznek és cselekvések történnek. 

Az első érzékelés a [Nincs, Nincs, Nincs, Nincs, Nincs), amiből az ágens arra tud kö- 
vetkeztetni, hogy a szomszédos négyzetek biztonságosak. A 7.3. (a) ábra mutatja az 
ágens tudásának állapotát ezen a ponton. Az ábrán a tudásbázis néhány mondatát s0- 
roljuk fel, betűket használva a megfelelő négyzetekben, mint az Sz (szellő) és az OK 
(biztonságos, nincs se csapda, se wumpus). A 7.2. ábra ezzel szemben magát a világot 
írja le. 

Abból a tényből, hogy nem volt se bűz, se szeltő az [1, II-ben, az ágens kikövetkez- 
tetheti, hogy az (1, 2] és [2. 1] négyzetek veszélytelenek. Ennek jelzésére a megfelelő 
négyzetekbe OK-t írunk. Egy óvatos ágens csak olyan négyzetbe lép, amelyről tudja, 
hogy OK. Feltételezzük, hogy az ágens úgy dönt, hogy a [2, 1]-be megy, előállítva 
a 7.3. (b) ábrán látható helyzetet. 

Az ágens detektálja a szellőt a (2, 1]-ben, tehát egy csapdának kell lennie valamelyik 
szomszédos négyzetben. A csapda nem lehet az (1, 1]-ben a játék szabályai szerint, így 
csapdának kell lennie a [2, 2]-ben vagy a [3, 1]-ben vagy mindkettőben. A Cs? jelölés 
egy lehetséges csapdát jelez a mezőkben a 7.3. (b) ábrán. Ezen a ponton csak egy olyan 
ismert négyzet van, ami OK, és amit még nem látogatott meg. Így a megfontolt ágens 
visszafordul, visszamegy az [1. 1]-be és az [1, 2]-be halad tovább. 

Az új érzet az [1, 2]-ben a [Bűz, Nincs, Nincs, Nincs, Nincs], ami a 7.4. (a) ábrán lát- 
ható helyzetet eredményezi. A bűz az [1, 2]-ben azt jelenti, hogy a wumpusnak a közel- 


























7.3. ábra. Az ágens első lépése a wumpus világban. (a) A kezdeti helyzet a (Nincs, Nincs, Nincs, Nincs, 
Nincs) érzékelése után. (b) Az első lépés után, érzékelve a [Nincs, Szellő, Nincs, Nincs, Nincs]-et. 
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ben kell lennie. De a wumpus a játék szabályai szerint nem lehet az [1, 1]-ben és nem 
lehet a [2. 2]-ben sem (mert akkor az ágens érezte volna a bűzt, amikor a [2, 11-ben 
jár0. Így az ágens kikövetkeztetheti, hogy a wumpus az [1, 3]-ban van. A W! jelölés ezt 
mutatja. Még érdekesebb, hogy a Szellő érzet hiánya az [1, 2]-ben azt jelenti, hogy 
nincs csapda a (2, 2]-ben. De mi már kikövetkeztettük, hogy vagy a [2. 2]-ben, vagy a 
[3,1]-ben van egy csapda, ami tehát azt jelenti, hogy a csapdának a [3, 1]-ben kell len- 
nie. Ez egy viszonylag nehéz következtetés, mivel különböző időpontokban és különbö- 
ző helyeken gyűjtött tudást használ fel, és egy érzet hiányára támaszkodva végez el egy 
fontos lépést. Ez a következtetés meghaladja a legtöbb állat képességeit, de tipikusan 
jellemzi azt a fajta következtetést, amit egy logikai ágens végez. 

Az ágens így bebizonyította maga számára, hogy nincs se csapda, se wumpus a [2, 2]- 
ben, így a mozgás ebbe a négyzetbe OK. Nem mutatjuk be az ágens tudását a (2, 2]-ben, 
csak feltételezzük, hogy fordul és átlép a (2. 3]-ba, ami a 7.4. (b) ábrán látható. A (2, 3]- 
ban az ágens detektálja a csillogást, így megragadja az aranyat, és ezzel véget ér a játék. 








7.A. ábra. Két későbbi helyzet az ágens előrehaladása során. (a) A harmadik lépést követően, miután 
(Bűz, Nincs, Nincs, Nincs, Nincs)]-et érzékelt. (b) Az ötödik lépés és a [Bűz, Szellő, Csillogás, Nincs, 
Nincs] érzékelése után 


Bármely esetben, amikor az ágens következtetéseket von le a rendelkezésre álló 
információkból, a következmény garantáltan helyes lesz, ha a rendelkezésre álló infor- 
mációk helyesek. Ez alapvető jellegzetessége a logikai következtetéseknek. A fejezet 
hátralevő részében megmutatjuk, hogyan építhetünk olyan logikai ágenseket, amelyek 
képesek reprezentálni a szükséges információkat, és következtetéseket vonnak le, ahogy 
azt az eddigi fejezetekben leírtuk. 


7.3. A LOGIKA 


Ez az alfejezet áttekintést nyújt a logikai reprezentáció és következtetés alapvető fogal- 
mairól. A logika bármely speciális formájára vonatkozó technikai részletek bemutatását 
a következő fejezetre halasztjuk. Ehelyett egyszerű példákat fogunk használni a wumpus 
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világból vagy ismerős aritmetikai területekről. Azért választjuk ezt az igen rendhagyó 
megközelítést, mivel a logika fogalmai messze általánosabbak és szebbek, mint azt ál- 
talában feltételezik. 

A 7.1. fejezetben említettük, hogy a tudásbázis mondatokból áll. Ezeket a monda- 
tokat a reprezentációs nyelv szintaxisa (syntax) szerint fejezzük ki, amely specifikál- 
ja az összes jól formált, nyelvtanilag helyes mondatot. A szintaxis fogalma elég tisz- 
ta a szokásos aritmetikai műveleteknél: , x t- y — 4" egy jól formált mondat, míg az 
.X2y 4 —" nem az. A logikai nyelvek szintaxisait (És a matematikáét is egyébként) 
rendszerint cikkek és könyvek írása céljából tervezték. A szó szoros értelmében tu- 
catjai léteznek a különböző szintaxisoknak, néhány tele görög betűkkel és egzotikus 
matematikai szimbólumokkal, néhány inkább vizuálisan követhető, nyilakat és buboré- 
kokat tartalmazó diagramokból áll. Minden esetben azonban, az ágens tudásbázisában 
a mondatok az ágensnek magának vagy az ágens egy részének valódi fizikai konfigu- 
rációi. A következtetés ezeknek a konfigurációknak a létrehozását vagy manipulálását 
fogja jelenteni. 

A logikának a nyelv szemantikáját (semantics) is definiálnia kell. Egyszerűen fo- 
galmazva a szemantika a mondatok , jelentéséről" szól. A logikában a definíció ponto- 
sabb. A nyelv szemantikája definiálja minden mondat igazságát (truth) minden egyes 
lehetséges világra (possible world) vonatkozóan. Például egy szokásos aritmetikához 
választott szemantika meghatározza, hogy az ..x - y — 47 mondat igaz abban a világ- 
ban, ahol x értéke 2 és y értéke 2, de hamis abban a világban, ahol x értéke I és y értéke 
is 1.! A standard logikákban minden mondat vagy igaz, vagy hamis minden lehetséges 
világban, és nem lehet , valahol az igaz és hamis között" 2. 

Amikor szükséges, hogy pontosak legyünk, a modell (model) kifejezést fogjuk hasz- 
nálni a , lehetséges világ" helyén. (Szintén használni fogjuk az ,m modellje a-nak" ki- 
fejezést. ami azt jelenti, hogy az ar mondat igaz az m modellben.) Miután a lehetséges 
világokat úgy képzelhetjük el, mint (potenciálisan) valós környezeteket, amelyekben az 
ágens ott lehet vagy nem lehet ott, a modellek olyan matematikai absztrakciók, amelyek 
csak rögzítik az igazság vagy hamisság értékét minden releváns mondatnak. Például, 
tegyük fel, hogy x és y a férfiak és nők száma, akik egy kártyaasztal körül ülnek és bri- 
dzset játszanak, és az x -- y — 4 mondat igaz, amikor négyen vannak összesen. Formá- 
lisan, a lehetséges modellek nem mások, mint minden lehetséges hozzárendelés az x és 
y változókhoz. Minden ilyen hozzárendelés bármely olyan aritmetikai mondat igazságát 
rögzíti, amely az x és y változókat tartalmazza. 

Most, hogy van egy képünk az igazság fogalmáról, tudunk beszélni a logikai követ- 
keztetésről. Ennek része a mondatok közötti logikai vonzat (entailment) reláció, annak 
kifejezése, hogy egy mondat logikusan következik egy másik mondatból. Matematikai 
jelöléssel ezt így írjuk: 


ar 6 


! Az olvasó minden bízonnyal észrevette a hasonlóságot a mondatok igazságának fogalma és az 5. 
fejezetben bemutatott kényszerek kielégítésének fogalma között. Ez nem véletlen, a kényszernyelvek valójában 
logikák, és a kényszerproblémák megoldása a logikai következtetés egy formája. 

A fuzzy logika (fuzzy logics). amelyet a 14. fejezetben mutatunk be, megengedi az igazság fokának 
kezelését. 
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aminek jelentése, hogy az a mondat maga után vonzza a ő mondatot. A vonzat formá- 
lis definíciója a következő: a HF ő akkor és csakis akkor, ha minden modellben, amely- 
ben a igaz, 8 szintén igaz. Közvetlenebbül azt mondhatjuk, hogy 8 igazságát , tartal- 
mazza" a igazsága. A vonzat reláció ismerős az aritmetikából is, örömmel vehetjük 
észre, hogy az x t- y — 4 mondat maga után vonzza a 4 — x -- y mondatot. Nyilvánva- 
ló, hogy bármely modellben, ahol x -t y — 4, mint például az a modell, amelyben x és 
yis 2 értékű, a 4 — x -- y is fenn áll. Hamarosan látni fogjuk, hogy a tudásbázist tekint- 
hetjük egy kijelentésnek, és gyakran beszélhetünk arról, hogy egy tudásbázis maga után 
vonz egy mondatot. 

Alkalmazhatunk hasonló elemzést az előző részben bemutatott wumpus világbeli kö- 
vetkeztetési példára is. Tekintsük a 7.3. (b) ábrán látható szituációt: az ágens nem ész- 
lelt semmit az [1, 1]-ben és szellőt észtelt a (2, 13-ben. Ezek az érzetek, kombinálva az 
ágensnek a wumpus világ szabályaira vonatkozó tudásával (a 250-251. oldalon található 
TKCSÉ-leírás), alkotja a TB-t. Az ágenst (más dolgok mellett) az érdekli, hogy vajon a 
szomszédos [1, 2], [2. 2], (3, 1] négyzetek tartalmaznak-e csapdát. Bármelyik a három 
négyzet közül tartalmazhat vagy éppen nem tartalmaz csapdát, így a példa esetében 
29 — 8 lehetséges modell létezik. Ezt mutatja a 7.5. ábra. 

A TB hamis azokban a modellekben, amelyek ellentmondanak annak, amit az ágens 
tud, Például a 7B hamis minden modellben, ahol az [1, 2] tartalmaz csapdát, mivel 
nincs szellő az [1, 1]-ben. Valójában csak három olyan modell van, amelyben a TB 
igaz, ezeket a 7.5. ábra a modellek egy részhalmazaként mutatja. Most tekintsünk két 
lehetséges következményt: 


az — , Nincs csapda az [1, 2]-ben" 
az — , Nincs csapda a [2. 2]-ben" 


A 7.5. ábrán megjelöltük az aj és az modelleket. Szemrevételezve megállapíthatjuk a 
következőt: 


minden olyan modellben, ahol a 7B igaz, ott az is igaz. 
Így TB a, és nincs csapda az (1, 2]-ben. Azt is láthatjuk, hogy: 
néhány modell, amelyben a 7B igaz, az cz hamis. 


Így TB az és az ágens nem tudja kikövetkeztetni, hogy nincs csapda a [2. 21-ben. (És 
azt sem tudja kikövetkeztetni, hogy van csapda a (2, 2]-ben.)? 

Az előző példa nem csak illusztrálja a maga után vonzást, hanem megmutatja, hogy 
a vonzat definícióját fel lehet használni a következmények levezetésére, azaz, hogy 1o- 
gikai következtetést (logical inference) végezzünk. A 7.5. ábrán illusztrált következ- 
tetési algoritmust modeltlellenőrzésnek (model checking) hívjuk, mivel számba vesz 
minden lehetséges modellt annak megvizsgálására, hogy a igaz-e minden modellben, 
amelyben a TB igaz. 


3 Habár az ábra a modelleket, mint egy részleges wumpus világot mutatja, ezek valójában nem mások, 
mint az igaz és hamis értékek hozzárendelései a csapda van az (1, 2]-ben" mondathoz, A modellek, 
matematikai értelemben, nem igénylik, hogy szörnyűséges illatú wurnpusok legyenek benne. 

Az ágens ki tudja számolni, hogy mekkora a valószínűsége annak, hogy van csapda a [2, 2]-ben. 
A 13. fejezet fogja megmutatni azt, hogy hogyan. 
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ee 
1 [e] 
(a) (b) 
7.5. ábra. Lehetséges modelljei a csapda jelenlétének az (1. 2]. [2. 2] és I3, 1J-ben, ha adott a megfigye- 


lés, hogy az (1, II-ben semmi és a (2, 1]-ben szellő érezhető. (a) A tudásbázis és cs1(nincs csapdaf 1, 2]- 
ben) modelljei. (b) A tudásbázis és a2(nincs csapda[2, 2]-ben) modelljei. 


A vonzat és a bizonyítás megértésében segíthet, ha a TB összes következményeit egy 
szénakazalnak, az a-t pedig egy gombostűnek képzeljük el. A vonzat olyan, mintha a 
gombostű benne volna a kazalban; a bizonyítás pedig nem más, mint megpróbálni meg- 
találni ezt a tűt. Ez a különbségtétel formálisan a következő megfogalmazásban ölt tes- 
tet: ha egy í következtetési algoritmus képes levezetni a-t a 7B-ből, akkor írhatjuk, hogy 


TB E ja 


amely kimondva: , c az i által levezethető 7B-ből" vagy ,.i levezeti a-t a 7B-ből". 

Egy következtetési eljárást, amely csak vonzat mondatokat vezet le, helyesnek (sound) 
vagy igazságtartónak (truth-preserving) nevezzük. A helyesség egy igencsak kívánatos 
tulajdonság. Egy nem helyes következtetési eljárás kitalál olyan dolgokat ahogy előreha- 
lad, olyan tűk megtalálását jelenti be, amelyek nem is léteznek. Egyszerű belátni, hogy a 
modellellenőrzés, ha alkalmazható, akkor helyes eljárás. 

A teljesség (completeness) tulajdonság szintén kívánatos: egy következtetési eljárás 
teljes, ha képes levezetni minden vonzatmondatot. Valódi szénakazlak esetében, ame- 
lyek véges méretűek, nyilvánvalónak tűnik, hogy szisztematikus kutatással mindig 
eldönthető, hogy a tű a kazalban van-e. Sok tudásbázis esetében azonban a konzekven- 
ciák szénakazlának mérete végtelen, és így a teljesség egy fontos kérdéssé válik.§ 
Szerencsére léteznek teljes következtetési eljárások a logikához, amelyek megfelelően 
kifejezők ahhoz, hogy számos tudásbázist kezeljenek. 

Egy olyan következtetési folyamatot írtunk le, amelynek következményei bármely 
világban garantáltan igazak, ahol a premisszák is igazak. Nevezetesen, ha a TB igaz 
a valódi világban, akkor bármely, a TB-ből helyes következtetési eljárással levezetett a 


5 A modellellenőrzés működik, ha a modellek tere véges, mint például egy rögzített méretű wumpus 
világ esetében. Az aritmetika esetében ezzel szemben a modellek tere végtelen, még akkor is, ha korlá- 
tozzuk magunkat az egész számokra, mivel végtelen számú x, y énékpár létezik az x 4 y — 4 egyenlethez. 

Hasonlítsuk össze a 3. fejezet végtelen kercsési tereinek esetével, ahol látható, hogy a mélységi 
keresés nem teljes. 
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mondat szintén igaz a valódi világban. Így, míg a következtetési folyamat a , szintaxi- 
son" működik — belső fizikai konfigurációkon, mint például regiszterek bitjein vagy az 
agy elektromos jelzéseinek mintáin —, addig a folyamat megfelel valódi világ viszonyai- 
nak. Ennek megfelelően a valódi világ néhány aspektusa lesz az eset," mivel a valódi 
világ bizonyos más aspektusai jelenleg képezik az esetet. Ezt a megfeleltetést a világ 
És a reprezentáció között mutatja a 7.6. ábra. 


Mondatok  ———— e Mondat 
Maga után vonz 


Reprezentáció É 





7.6, ábra. A mondatok az ágens fizikai konfigurációi, és a következtetés az a folyamat, amely új fizikai 
konfigurációkat hoz létre régiekből, A logikai következtetésnek biztosítania kell, hogy az új konfigurá- 
ciók olyan aspektusait reprezentálják a világnak, amelyek ténylegesen is következnek azokból az aspek- 
tusokból, amelyeket a régi konfigurációk reprezentálnak. 


Az utolsó kérdés, amivel foglalkoznunk kell a logikai ágensek tárgyalásánál, a meg- 
alapozottság (grounding) kérdése, ami nem más, mint a kapcsolat, ha egyáltalán léte- 
zik ilyen, a logikai következtetési folyamat és a valódi környezet között, amelyben az 
ágens létezik. Nevezetesen hogyan tudhatjuk meg, hogy a TB igaz-e a valódi világ- 
ban? (Ezután a TB már csak , szintaxis" az ágens fejében.) Ez egy filozófiai kérdés, 
amelyről sok-sok könyvet írtak (lásd 26. fejezet). Egy egyszerű válasz az, hogy az 
ágens érzékelői létesítik a kapcsolatot. Például a mi wumpus világbeli ágensünknek 
van egy szagló érzékelője. Az ágensprogram létrehoz egy megfelelő mondatot mindig, 
ha van illat. Így bármikor, ha ez a mondat a tudásbázisban van, ez igaz a valódi világ- 
ban is. Ezáltal az érzetmondatok jelentését és igazságát az őket létrehozó érzékelő és 
mondatkonstruáló folyamatok határozzák meg. És mi a teendő az ágens tudásának 
egyéb részeivel, mint az a meggyőződése, hogy a wumpus rossz illatot terjeszt a szom- 
szédos négyzetekben? Ez nem egy közvetlen reprezentációja egy egyedi érzetnek, 
hanem egy általános szabály, például érzékelési tapasztalatokból levezetve, de nem 
azonos magával a tapasztalatnak a kijelentésével. Az ilyen általános szabályokat a 
tanulásnak (learning) nevezett mondatkonstruáló folyamat hozza létre, ami a VI. rész- 
nek a tárgya. A tanulás nem tévedhetetlen. Lehet, hogy az eset az, hogy a wumpusok 
mindig rossz illatot árasztanak, kivéve szökőévekben február 29-én, amikor egyébként 
megfürödnek. Így lehet, hogy a 7B nem igaz a valódi világban, de jó tanuló eljárások- 
kal van ok az optimizmusra. 


7 Mint azt Wittgenstein (1922) írta híres művében, a Zractatusban: , A világ mindaz, aminek az esete 
fennáll." 
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7.4. AZ ÍTÉLETKALKULUS: EGY NAGYON EGYSZERŰ 
LOGIKA 


Most egy nagyon egyszerű logikát, az ítéletkalkulust (propositionai logic) mutatjuk 
be.? Áttekintjük az ítéletkalkulus szintaxisát, majd a szemantikáját — annak a módját, 
ahogy a mondatok igazságát meghatározzuk. Azután megnézzük a maga után vonzást 
— a relációt egy adott mondat és azon mondat között, amelyik az előbbiből követke- 
zik -, és megnézzük, hogy hogyan vezet ez egy egyszerű logikai következtetés algo- 
ritmushoz. Mindez természetesen a wumpus világban fog lejátszódni. 


Szintaxis 


Az ítéletkalkulus szintaxisa meghatározza a lehetséges mondatokat. Az atomi monda- 
tok (atomic sentences) — oszthatatlan szintaktikai elemek — egyetlen ítéletszíimbólum- 
ból (proposition symbol) állnak. Minden ilyen szimbólum egy kijelentés, ami igaz 
vagy hamis lehet. Nagybetűs neveket fogunk használni a szimbólumok jelölésére: P, 0, 
R és így tovább. A nevek tetszőlegesek, de gyakran úgy választjuk őket, hogy a nevek 
bizonyos jelentéssel is rendelkezzenek. Például használhatjuk a Wj 3-t annak az állítás- 
nak a kifejezésére, hogy a wumpus az [1, 3]-ban van. (Ne felejtsük el. hogy a Wj 3 ato- 
mi, így a W, az 1 és a 3 nem jelentéssel bíró részei a szimbólumnak.) Létezik két ítélet- 
szimbólum, amelyeknek rögzített az értelmezése: az Igaz egy mindig igaz állítás, és 
a Hamis egy mindig hamis állítás. 

Összetett mondatok (complex sentences) létrehozhatók egyszerűbb mondatokból 
logikai összekötőjelek (logical connectives) felhasználásával. Öt elterjedten használt 
összekötőjel van: 


— (nem). Egy mondatot, mint a -W4 3-t, negációnak (negation) nevezünk. Egy literál 
(literai) vagy egy atomi mondat (egy pozitív literál), vagy egy negált atomi mondat 
(egy negatív literál). 

N (és). Egy mondatot, amelynek fő kötőszava a A, mint például a Wiy. 3 A Ci 3 konjunkció- 
nak (conjunction) nevezünk; ennek részei a konjunktok (conjuncts). (Az A jel hason- 
lít egy A-ra, az angol And (és) szóból.) 

V (vagy). Egy mondat, amely használja a V összekötőjelet, mint a (Wi3 A Ci.) V. Wh2 
egy diszjunkció (disjunction), méghozzá a (Wj 3 A Ci.3) és a W2.2 diszjunktoknak 
(disjuncts) a diszjunkciója. (Történelmileg a V jel a latin vel kifejezésből származik, 
ami ,vagy"-ot jelent. A legtöbb ember számára könnyebb megjegyezni úgy, mint 
egy fejjel lefelé álló és jelet, vagy a magyar olvasók számára, mint a vagy szó első 
betűjét.) 

- (implikáció). Egy mondatot, mint amilyen a (Wj.3 A C13) 5 Wa implikációnak 
(implication) (vagy feltételes mondatnak) nevezünk. Ennek premisszája (premise) 
vagy előzménye (antecedent) a (W) 3 A Cak konklúziója (conclusion) vagy követ- 
kezménye (conseguent) pedig a -W 2 implikáció szabályként (rule) vagy ha-akkor 


§ Az ítéletkalkulust Boole-logikának (Boolean logic) is nevezzük, a logikával foglalkozó George Boole 
£1815-1864) után. 


7.4, AZ ÍTÉLETKALKULUS: EGY NAGYON EGYSZERŰ LOGIKA 259 


(if-then) állításként is ismert. Az implikációt más könyvekben időnként a D vagy a 
— szimbólumokkal jelölik. 


5 (akkor és csakis akkor). A W 38 7W2.2 mondat egy ekvivalencia (bicondítional). 


A 7.7. ábra mutatja az ítéletkalkulus formális nyelvtanát; ha nem ismeri a BNF jelölés- 
rendszert, akkor nézze meg az 1112. oldalt. 





Mondat — AtomiMondat ) KomplexMondat 


AtomiMondat — Igaz ] Hamis ] Szimbólum 
Szimbólum A PIOIRI -.. 
KomplexMondat — -Mondat 
I (Mondat A Mondat) 
] Wondat v Mondat) 
] (Mondat — Mondat) 
1 (Mondat es Mondat) 











7.7. ábra. Ítéletkalkulus-beli mondatok BNF (Backus-Naur-forma) nyelvtana 


Vegyük észre, hogy a nyelvtan nagyon szigorú a zárójelezésnél: minden mondatot, 
amelyet bináris összekötőjellel hozunk létre, zárójelek közé kell tenni. Ez biztosítja, 
hogy a szintaxis teljesen egyértelmű. Ez azt is jelenti például, hogy ((A A B) — C)-t kell 
írjunk A A B 5 C helyett. Az olvashatóság javítása céljából gyakran elhagyjuk a záró- 
jeleket, megbízva ehelyett az összekötőjeleknek egy precedencia-sorrendjében. Ez ha- 
sonló az aritmetikában alkalmazott precedenciához — például az ab -t- c-t ((ab) -t c)-nek 
olvassuk, és nem a(b -t c)-nek, mert a szorzásnak magasabb a precedenciája, mint az 
összeadásnak. Az ítéletkalkulus precedencia-sorrendje (a legmagasabbtól a legalacso- 
nyabb felé: —, A, V, 5 és 64. Így a mondat: 


-PVOAR5S 
ekvivalens a következő mondattal: 
(CPV(2AR) 5 S 


A precedencia nem oldja fel a többértelműséget az olyan mondatoknál, mint az 
AA BA C€, amelyet olvashatunk ((A A B) A C)-ként vagy (A A (B A €))-nek. Mivel a 
mondatnak ez a két olvasása ugyanazt jelenti a következő részben definiálandó szeman- 
tika szerint, az olyan mondatok, mint az A A B A C megengedettek. Szintén megenged- 
jükazA V BV CésazA 6 B 6 C mondatokat. Olyan mondatok, mintazA 5 85 C 
nem megengedettek, mert a két olvasásnak különböző jelentései vannak, ebben az eset- 
ben ragaszkodunk a zárójelhez. Végül, néha használni fogunk szögletes zárójelet az egy- 
szerű zárójel helyett, ami a mondatot áttekinthetőbbé teszi majd. 
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Szemantika 


Most, hogy specifikáltuk az ítéletkalkulus szintaxisát, definiáljuk a szemantikáját is. 
A szemantika definiálja a szabályokat, amivel meghatározható a mondat igazsága egy 
bizonyos modellben. Az ítéletkalkulusban a modell egyszerűen az igazságértéket — igaz 
vagy hamis — rögzíti minden ítéletszimbólumra. Például ha a tudásbázis mondatai a 
C1.2. C2.2 és Csa ítéletszimbólumokat használják fel, akkor egy lehetséges modell: 


mp —(C12 — hamis, C2 2 — hamis, Cz a — igaz) 


Három ítéletszimbólum esetén 2? — 8 lehetséges modell van — pontosan azok, amelyek 
a 7.5. ábrán vannak feltüntetve. Vegyük észre azonban, hogy miután elköteleztük ma- 
gunkat egy szintaxis mellett, a modellek tisztán matematikai objektumokká váltak. 
amelyeknek nem feltétlenül van kapcsolatuk a wumpus világgal. A C4 2 csak egy szim- 
bólum, jelentheti azt, hogy , csapda van az [1, 2]-ben" vagy azt, hogy , Párizsban vagyok 
ma és holnap". 

Az ítéletkalkulus szemantikájának meg kell határoznia, hogyan számítsuk ki bármely 
mondat igazságértékét egy adott modellben. Ez rekurzívan történik. Minden mondat 
atomi mondatokból és az ötféle összekötőjelből lett létrehozva, így meg kell határoz- 
nunk, hogy hogyan számítsuk ki az atomi mondatok igazságát, és meg kell határoznunk 
azt is, hogy hogyan számítsuk ki az igazságát az egyes összekötőjelek felhasználásával 
formált összetett mondatnak. Az atomi mondatok esete egyszerű: 


s [gaz akkor, ha minden modellben igaz. és Hamis akkor, ha minden modellben hamis. 
s Minden más ítéletszímbőlumnak az igazságértékét közvetlenül a modellben kell 
meghatározni. Például a korábban megadott my modellben a Ci 2 hamis. 


Összetett mondatokra olyan szabályaink vannak, mint 


s Bármely s mondatra és bármely m modellre, a -s mondat az m-ben akkor és csakis 
akkor igaz, ha s hamis m-ben. 


Az ilyen szabályok visszavezetik az összetett mondatok igazságának eldöntését egy- 
szerűbb mondatokra. Minden összekötőjelre vonatkozó szabály összefoglalható egy 
igazságtáblában (truth table), amely meghatározza egy összetett mondat igazságérté- 
két a mondat komponenseinek minden lehetséges igazságérték hozzárendeléseihez. 
Az öt logikai összekötőjel igazságtábláját mutatja a 7.8. ábra. Ilyen táblák felhaszná- 
lásával bármely s mondat igazságértéke egy m modellre vonatkozóan kiszámolható re- 
kurzív kiértékelések egyszerű folyamatával. Például a —Ci2 A (C22 V Cza) mondatot 
kiértékelve m-ben igaz A (hamis V igaz) — igaz A igaz — igaz értéket kapunk. A 7.3. 
feladat azt kéri, hogy írjon egy IK-IGAZ?(s,m) algoritmust, amely kiszámítja az s ítélet- 
kalkulus mondatnak az igazságértékét egy m modellben. 

Korábban azt mondtuk, hogy a tudásbázist mondatok halmaza alkotja. Most láthat- 
juk. hogy egy logikai tudásbázis ilyen mondatok konjunkciója. Tehát ha egy üres 7B- 
vel kezdünk, és végrehajtjuk a KIJELENT(TB, 571). --.. KNELENTÍTB, 5,) műveleteket, 
akkor a TB — SJ A ... A S, áll elő. Ez azt jelenti, hogy tudásbázisokat és mondatokat 
egymással felcserélhetően használhatunk. 

Az ,és", ,vagy" és ,nem" igazságtáblái eltérnek attól, amit a természetes nyelvi 
jelentésük alapján gondolnánk. A lehetséges félreértés legszembetűnőbb pontja, hogy a 
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P e -P PA PvO pg PsoO 
Hamis Hamis Igaz Hamis Hamis Igaz Igaz 
Hamis Igaz Igaz Hamis Igaz Igaz Hamis 
Igaz Hamis Hamis Hamis Igaz Hamis Hamis 
Igaz Igaz Hamis Igaz Igaz Igaz Igaz 


























7.8. ábra. Az öt logikai összekötőjel igazságtáblája. Amikor a táblát használjuk például a P V 0 értéké- 
nek számítására, ha P igaz és 0 hamis, akkor először megkeressük azt a sort, amelyben P igaz és 0 ha- 
mis (a harmadik sor). Ezután a sorban megkeressük a P V 0 alatti oszlopot, hogy megtaláljuk az ered- 
ményt: igaz. Tekinthetjük a táblázat úgy is, hogy minden sor egy modell, és az egyes oszlopbeli elemek 
az adott sorban azt mondják meg, hogy a megfelelő mondat igaz-e az adott modellben. 


Pv 0 kifejezés igaz akkor is, ha mind P, mind £? is igaz. Létezik másik összekötőjel is, 
a , kizáró vagy"-nak nevezett jel (röviden xor), amely hamisat ad, ha mindkét diszjunkt 
igaz.) Nincs általános egyetértés az . exkluzív vagy" szimbólumát illetően: két jelölés is 
ismert: av és a €. 

Az implikáció (2) igazságtáblája rejtélyesnek tűnhet első látásra, mivel nem telje- 
sen illeszkedik ösztönös megértésünkhöz, hogy ,,P implikálja 0-t" vagy ,ha P, akkor 
07. Az ítéletkalkulus nem kíván semmilyen ok-okozati relációt vagy relevanciát P és 
0 között. A mondat: , az a tény, hogy 5 páratlan implikálja, hogy Tokió Japán főváro- 
sa" az ítéletkalkulusnak egy igaz mondata (a normális interpretáció szerint), még akkor 
is, ha ez határozottan furcsa mondatnak tűnik. Egy másik esete a félreértéseknek, hogy 
bármely implikáció igaz, ha az előzménye hamis. Például az ..az az állítás, hogy 5 pá- 
ros szám, implikálja, hogy Samu okos" mondat igaz, függetlenül attól, hogy Samu 
okos-e. Ez bizarrnak tűnik, de elfogadható, ha a , P — 07-t úgy értelmezzük, hogy , ha 
P igaz, akkor azt állítom, hogy 0 is igaz. Egyébként nem állítok semmit". Az egyetlen 
eset, amikor ez a mondat hamis, ha P igaz, de 0 hamis. 

A P 6 0 ekvivalencia igazságtáblája azt mutatja, hogy akkor igaz, ha mind P — 0 
és 0 5 P igaz. Ezt gyakran úgy írjuk le, hogy ,.P akkor és csakis akkor, ha 0" vagy 
matematikában szokták jelölni , P aa 07-nak. A wumpus világ szabályait legjobban az 
43 használatával tudjuk felírni. Például, egy négyzet szellős, ha a szomszédos négyzet- 
ben csapda van, és egy négyzet csakis akkor szellős, ha a szomszédos négyzetben csap- 
da van. Így ekvivalenciákra van szükségünk, mint a 


511 6 (Ci2 V Cap) 
ahol S, jelenti, hogy szellő van az [1, 1]-ben. Vegyük észre, hogy az egyirányú ímp- 
likáció 

Sa (Ci2V Cam) 


igaz a wumpus világban, de nem teljes. Nem szabályozza azokat a modelleket, amelyek- 
ben S: hamis és Ci 2 igaz, amivel megszegnénk a wumpus világ szabályait. Egy másik 
mód ennek érzékeltetésére, hogy az implikáció igényli a csapda jelenlétét, ha szellő van, 
miközben az ekvivalencia szintén megkívánja a csapda hiányát, ha nincs szellő. 


9 A latinnak létezik külön szava az .exkluzív vagy" kifejezésére, ez az aut. 
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Egy egyszerű tudásbázis 





Most, hogy definiáltuk az ítéletkalkulus szemantikáját, létre tudunk hozni egy tudásbá. 
zist a wumpus világ számára. Az egyszerűség kedvéért csak a csapdákkal fogunk töi 
ni, a wumpust magát feladatként az olvasóra hagyjuk. A tudás, amelyet most leírunk, 
elégséges ahhoz, hogy elvégezzük a 7.3. alfejezetben nem formálisan már elvégzett 
következtetést. 

Először meg kell választanunk a szótárunkat az ítéletszimbólumaink megnevezésé- 
hez. Minden i, j-re: 


"s Legyen C;; igaz, ha csapda van [i, j]-ben. 

e Legyen S; ij igaz, ha szellő van [7, f1-ben. 

A tudásbázis tartalmazza a következő mondatokat (mindegyiket felcímkézzük a kénye- 
lem kedvéért): 


s Nincs csapda az (1, 1]-ben: 
Szi: 0Cia 


s Egy négyzet akkor és csakis akkor szellős, ha csapda van a szomszédos négyzetben. 
Ezt minden négyzetre vonatkozóan ki kell jelenteni. mi most csak a releváns négy- 
zeteket tekintjük: 


Szz:Sia 8 (Ci2 VC 
Sz: Sa 8 (Cin V C22 V Csa) 


s Az eddigi mondatok minden wumpus világban igazak. Most hozzáadjuk a szellő 
érzetet az első két meglátogatott négyzetre abban a specifikus világban, ahol az 
ágens jelenleg tartózkodik, ami elvezet a 7.3. (b) ábrán látott szituációhoz. 


Sza 751 
Szs: Sza 


A tudásbázis most Sz4-től Szs-ig tartalmaz mondatokat. Tekinthetjük ezt úgy is. mint 
egyetlen mondatot — az Szy A Sza A Szz A Szy A Szs konjunkciót -, mivel ez azt is kije- 
lenti egyben, hogy minden egyes mondat is igaz. 


Következtetés 


Emlékezzünk, hogy a logikai következtetés célja, hogy eldöntsük, hogy 7B F a bizonyos 
a mondatokra. Például, bogy a tudásbázis maga után vonzza-e a C) 2 állítást. Az első 
algoritmusunk a következtetésre a vonzat definíciójának közvetlen megvalósítása lesz: 
vegyük sorba a modelleket, és ellenőrizzük, hogy ar igaz-e minden modellben, amelyben 
a TB igaz. Az ítéletlogikában a modellek az igaz és hamis értékek hozzárendelései min- 
den egyes ítéletszimbólumhoz. Visszatérve a mi wumpus világbeli példánkhoz, a rele- 
váns ítéletszimbólumok az S) 1. S1.2. Cr.1 Ci.2 C21 C2.2 Cs. A 7 szimbólum 27 — 128 
lehetséges modellt jelent, háromban ezek közül a 7B igaz (7.9. ábra). Ebben a három 
modellben -Cj 2 igaz, így nincsen csapda az [1, 2]-ben. Viszont a C; ; a három mo- 
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detlből kettőben igaz és egyben hamis, így még nem tudjuk megmondani, hogy van-e 
csapda [2, 2]-ben. 

A 7.9. ábra precízebb formában megismétli a 7.5. ábrán illusztráli következtetést. 
A 7.10. ábra egy általános algoritmust mutat a maga után vonzás eldöntésére az ítéletkal- 
kulusban. Mint a VISSZALÉPÉSES-KERESÉS algoritmus a 115-116. oldalon, az IT-VONZAT? 
egy rekurzív felsorolást végez a változó hozzárendelések véges terén. Az algoritmus 
helyes, mivel közvetlenül a vonzat definícióját valósítja meg, és teljes, mivel bármely 
TB-on és a mondaton működik, és mindig sikeresen véget ér, hiszen véges számú mo- 
dellt kell megvizsgálni. 





Su 152 Ju 1 Ciz ] Ca Sza ! Szs 17B 





igaz ) hamis) hamis 
igaz ) hamis [hamis 
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7.9. ábra. A uudásbázis alapján épített igazságtábla látható az ábrán. A TB igaz, ha Szy-től és Szs-ig igaz, 
amely a 128 sorból csak 3-ban fordul elő. Mind a 3 sorban Ci. hamis, tehát nincsen csapda az 
[1, 2]-ben. Viszont lehet, hogy van csapda (2, 2]-ben (bár lehet, hogy nincs). 





function ÍT-VONZAT(7B, a) returns igaz vagy hamis 
input: 78, a tudásbázis, egy ítéletkalkulus mondat 
a, a lekérdezés, egy ítéletkalkulus mondat 


szimbólumok — TB-ban és a-ban szereplő szimbólumok listája 
return [T-ELLENŐRIZ-MINDAZB, er, színbólumnok, (]) 





function IT-ELLENŐRIZ-MIND(ZB, ar, szimbólumok, modetf) returns igaz vagy hamis 
íf ÜRES (szimbólumok) then 
if IK-IGAZA(TB, modell) then return IK-IGazt(a, modell) 
else return igaz 
else do 
P — ELsőíszimbólumok); maradék 6 MARADÉK(Sszimbólumok) 
return IT-ELLENŐRIZ-MINIX7B, a, maradék, KIEGÉSZÍMP, igaz, modelf) and. 
TT-ELLENŐRIZ-MIND(TB, a, maradék, KIEGÉSZÍT(P, igaz, modell) 











"7.10. ábra. Egy igazságtábla felsoroló algoritmus ítéletkatkulus állítás vonzatának eldöntésére. Az IT az 
igazságtáblát jelöli. A IK-IGaz? igazat ad vissza, ha a mondatot tartalmazza a modell. A modell változó 
reprezentál egy részleges modellt, egy hozzárendelést a változók egy részéhez. A KIEGÉSZÍT(P, igaz, mo- 
dell) függvény egy új részleges modellt ad vissza, amelyben P értéke igaz. 
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Természetesen a , véges számosság" nem mindig jelenti a , néhányat". Ha a TB és az 
€x mondat összesen n szimbólumot tartalmaz, akkor 2" modell létezik. Így az algoritmus 
időigénye 0(2"). (A tárigénye csak 0(n), mivel a felsorolás mélységi jellegű.) A feje- 
zet későbbi részében fogunk látni olyan algoritmusokat, amelyek sokkal hatékonyab- 
bak a gyakorlatban. Sajnos minden ismert, az ítéletlogikára vonatkozó következtetési 
algoritmusnak a legrosszabb esetre vonatkozó komplexitása exponenciálisan függ a 
bemenetek számától. Nem remélhetjük, hogy ennél hatékonyabbak is lehetnénk, mivel 
az ítéletlogikában a maga után vonzás co-NP-teljes (lásd A) függelék). 


Ekvivalencia, érvényesség és kielégíthetőség 


Mielőtt belemerülnénk a logikai következtetés részleteinek tárgyalásába, szükségünk 
van néhány további, a vonzattal kapcsolatos fogalomra. Mint a vonzat, ezek a fogalmak 
is a logika minden formájára alkalmazhatók, de legjobban egy konkrét logikán — mint 
amilyen az ítéletkalkulus — lehet illusztrálni őket. 

Az első fogalom a logikai ekvivalencia (logical eguivalence): két mondat, az az és 
a A mondatok logikailag ekvivalensek, ha ezek a mondatok a modellek ugyanazon hal- 
mazán igazak. Ezt úgy jelöljük. hogy a 6 A. Például (igazságtáblákat használva) 
könnyen megmutathatjuk, hogy P A 0 és 0 A P logikailag ekvivalensek; további ekvi- 
valenciák láthatók a 7.11. ábrán. Az ekvivalenciák nagyon hasonló szerepet játszanak 
a logikában, mint az aritmetikai identitások a közönséges matematikában. Az ekvíva- 
lencia alternatív definíciója a következő: bármely két a, ő mondatra, 


a z B akkor és csakis akkor, ha a F Bés BE a 


(Emlékeztetőül, at- a maga után vonzást jelöli.) 

A második fogalom, amelyre szükségünk lesz az érvényesség (validity). Egy mon- 
dat érvényes, ha igaz minden modellben. Például a P V -P mondat érvényes. Az érvé- 
nyes mondatokat tautológiáknak (tautologies) is szokták nevezni, ezek szükségszerű- 
en igazak és így feleslegesek. Mivel az [gaz mondat igaz minden modellben, minden 
érvényes mondat logikailag ekvivalens az [gaz mondattal. 








(aA BE (BA a) A kommutativitás 
(lavő)sz(őva) V kommutativitás 
(aA DATE (a A (BA 9) A asszociativitás 
fav(8vy)) V asszociativítás 
a kettős negáció kiküszöbölés 
(85 -a) kontrapozíció 
(-8v a) implikáció kiküszöbölés 
((a 5 B)A(ó 55 a)) ekvivalencia kiküszöbölés 
5) z (-avab) De Morgan 
(ca Ab) De Morgan 





(A (BV. 1)) E (la A 6) V (a A 9) A disztributivitás 
(a V(BA 9)) E (lav. Bjála va) V disztributivátás 











7.11. ábra. Standard logikai ekvivalenciák. Az a, A,  szímbólurnok tetszőleges ítéletkalkulus mondato- 
kat jelölnek. 
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Mire jók akkor az érvényes mondatok? A vonzatokra vonatkozó definíciónk alapján 
levezethetjük a dedukcióelméletet (deduction theorem), amelyet már az ókori görö- 
gök is ismertek: 


Bármely a: és B mondatra ak B akkor és csakis akkor, ha az (a — 8) mondat érvényes. 


(A 7.4. feladatban ennek a bizonyítását kérjük.) A 7.10. ábrán látható következtetési 
algoritmust úgy tekinthetjük, mint a (TB 5 a) érvényességének ellenőrzését. Másik 
oldalról nézve viszont minden érvényes implikáció leír egy legitim következtetést. 

Az utolsó fogalom, amelyre szükségünk lesz a kielégíthetőség (satisfiability). Egy 
mondat kielégíthető, ha igaz néhány modellben. Például a korábban bemutatott tudásbázis, 
az (Sza A Szz A Szz A Szy A Szs), kielégíthető, mert van három olyan modell, amelyben 
igaz, ahogy ezt a 7.9. ábrán megmutattuk. Ha egy a mondat igaz az m modellben, akkor 
azt mondjuk, hogy m kielégíti (satisfies) a-t, vagy m egy modellje a-nak. A kietégíthető- 
ség ellenőrizhető úgy, hogy a lehetséges modelleket felsoroljuk mindaddig, amíg nem ta- 
lálunk egyet, amely kielégíti a mondatot. A mondatok kielégíthetőségének meghatározása 
az ítéletlogikában az első olyan probléma volt, amelyről bebizonyították, hogy NP-teljes. 

Számos probléma a számítástechnikában valójában kielégíthetőségi probléma. Pél- 
dául a kényszerkielégítési problémák az 5. fejezetben alapvetően arra kérdeznek rá, 
hogy a kényszerek kielégíthetők-e néhány hozzárendelésset. Megfelelő transzformációk 
után a keresési problémák szintén megoldhatók a kielégíthetőség ellenőrzésével. Az ér- 
vényesség és a kielégíthetőség természetesen kapcsolatban vannak: a érvényes akkor 
és csakis akkor, ha -a nem kielégíthető; és fordítva, az akkor és csakis akkor kielégít- 
hető, ha -a nem érvényes. A következő hasznos eredményt is ismerjük: 


at B akkor és csakis akkor, ha az (a A —4) nem kielégíthető 


A B mondat bizonyítása a: alapján, az (a A -ő) kielégíthetetlenségének ellenőrzésével, 
Pontosan megfelel a szokásos matematikai bizonyítási technikának a redukcio ad absur- 
dumnak (szó szerint , redukció egy abszurd dologra"). Szokták ezt megcáfolás (refuta- 
tion) általi bizonyításnak is nevezni vagy bizonyítás ellentmondás (contradiction) 
által. Feltételezzük, hogy a 5 mondat hamis, és megmutatjuk, hogy ez a feltételezés 
ellentmondásra vezet az ismert a axiómákkal. Ez az ellentmondás pontosan azt jelenti, 
mint amikor azt mondjuk, hogy az (a A —6) mondat kielégíthetetlen. 
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Ez az alfejezet végigveszi a következtetés standard mintáit, amelyek alkalmazhatók ar- 
ra, hogy következmények láncolatait vezethessük le, amelyek elvezetnek a kívánt cél- 
hoz. Ezeket a következtetési mintákat következtetési szabályoknak (inference rules) 
hívjuk. A legjobban ismert szabály a Modus Ponens és a következőképpen írható le: 


azb§a 
B 
A jelölés azt jelenti, hogy ha bármikor adott egy a — 8 formájú mondat és adott egy 
a, akkor a ő mondat ebből következik. Például a (WumpusElőrefelé A WumpusÉl) 5 
Lövés és a (WumpusElőrefelé A WumpusÉl) adott, akkor a Lövés kikövetkeztethető. 


t1 
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Egy másik hasznos következtetési szabály az És-kiküszöbölés (And-Elimination), 
ami azt mondja ki, hogy egy konjunkcióból bármely konjunkt kikövetkeztethető: 


aA B 
a 

Például abból, hogy (WumpusElőrefelé A WumpusÉl) a WumpusÉl kikövetkeztethető. 

Tekintettel az a és A lehetséges igazságértékeire, könnyen megmutatható, hogy a 
Modus Ponens és az És-kiküszöbölés helyes egyszer és mindenkorra. Ezek a szabályok 
felhasználhatók bármely konkrét esetben, ahol alkalmazhatók, helyes következtetéseket 
eredményezve anélkül, hogy fel kellett volna sorolnunk a modelleket. 

A 7.II. ábrán található összes logikai ekvivalencia használható következtetési sza- 
bályként. Például az ekvivalencia kiküszöbölés két következtetési szabályt eredményez: 


asbB és (az BA (35 e) 

(a B)A (85 a) asbB 
Nem minden következtetési szabály működik mindkét irányban, mint ezek. Például 
nem futtathatjuk a Modus Ponenst ellenkező irányban, hogy megkapjuk a — 5-t és a-t 
a A-ból. 

Nézzük meg, hogyan használhatjuk ezeket a következtetési szabályokat és ekvivalen- 
ciákat a wumpus világban. Az Sz, ..., Szs szabályokból álló tudásbázisból indulunk ki, 
és megmutatjuk, hogy hogyan bizonyíthatjuk a 2C4.-t azaz, hogy nincs csapda az 
11, 2]-ben. Először alkalmazzuk az ekvivalencia kiküszöbölést Sz2-re, és így kapjuk, hogy 





Sz6: (S11 7 (Ci2 V Can) A ((Cr2 VC) 510 


Ezután alkalmazzuk az És-kiküszöbölést az Sz-ra, és így kapjuk, hogy 
Szr ((Ci2 V.C2a) 5 Si 
A kontrapozíció logikai ekvivalenciát alkalmazva: 
Sze: CSia 5 (C12 V C2a)) 
Most alkalmazhatjuk a Modus Ponenst az Szg-ra és az Szy érzetre (például a -51.1) és 
így kapjuk: 
Szo: (Ci2 V Cap 
Végül alkalmazzuk a De Morgan-szabályt, amely a konklúziót adja: 
Sz16 7C12 A 0C2t 


Tehát sem az [1, 2], sem a (2, 1] négyzet nem tartalmaz csapdát. 

Az előző levezetést — következtetési szabályok egy sorozatát — bizonyításnak (proof) 
nevezzük. A bizonyítás megtalálása pontosan olyan, mint megoldást találni egy keresé- 
si problémára. Valójában ha a következtetési szabályok összes lehetséges alkalmazásá- 
nak generálására egy új állapotátmenet-függvényt definiálnánk, akkor minden, a 3. és 4. 
fejezetbeli kereső algoritmust felhasználhatnánk a bizonyítás megtalálására. A bizonyítás 
keresése tehát egy alternatívája a modellek felsorolásának. A keresés haladhat előrefelé 
a kezdeti tudásbázisból kiindulva, alkalmazva a következtetési szabályokat a célmon- 
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dat levezetéséhez, vagy mehet visszafelé a célmondatból, megpróbálva megtalálni a kö- 
vetkeztetési szabályoknak olyan láncolatát, amely a kiindulási tudásbázisra alkalmazha- 
tó szabályokból indul. A fejezetben később bemutatunk két olyan algoritmuscsaládot, 
amelyek ezeket a technikákat használják. 

Az a tény, hogy a következtetés az ítéletlogikában NP-teljes, azt sugallja, hogy a leg- 
rosszabb esetet tekintve a bizonyítások keresése sem hatékonyabb a modellek felsorolá- 
sánál. Számos gyakorlati esetben azonban, a bizonyítás megtalálása sokkal hatékonyabb 
lehet, egyszerűen azért, mert képes figyelmen kívül hagyni az irreleváns állításokat, füg- 
getlenül attól, hogy hány van belőlük. Például az előző bizonyítás, amely elvezetett a 
-Ci2A 7C 4 mondathoz, nem említi az 52 1, Cr,1. C2.2 vagy a Cj 2 állításokat. Ezeket 
azért lehet figyelmen kívül hagyni, mert a C) 2 célállítás csak az Sz2-ben jelenik meg, 
az Sz2-ben szereplő egyéb állítások pedig csak az Sz2-ben és az Sz4-ben, így az Sz, Szz 
és Szs szabályoknak nincs kihatásuk a bizonyításra. Ugyanez maradna a helyzet, ha még 
millió szabályt hozzáadnánk a tudásbázishoz, miközben az igazságtábla algoritmust 
ezzel ellentétben elárasztaná a modellek exponenciális robbanása. 

A logikai rendszereknek ez a tulajdonsága valójában egy sokkal alapvetőbb jellegze- 
tességükből, a monotonitásból (monotonicity) következik. A monotonitás azt mondja 
ki, hogy a vonzatmondatok halmaza csak bővülhet, ha a tudásbázishoz információt 
adunk hozzá. !0 


ha 7Bka akkor TBABEHa 


Például feltételezzük azt, hogy a tudásbázis tartalmaz egy új / állítást. amely azt mond- 
ja ki, hogy pontosan 8 csapda van a világban. Ez a tudás segítheti az ágenst további 
konklúziók levezetésében, de nem teheti érvénytelenné egyik korábban kikövetkeztetett 
a konklúziót sem — így azt a konklúziót sem, hogy nincsen csapda az [1, 2]-ben. A mo- 
notonitás azt jelenti, hogy a következtetési szabályok bármikor alkalmazhatók, ha a 
megfelelő premisszák megtalálhatók a tudásbázisban — a szabály konklúziójának követ- 
keznie kell, függetlenül attól, hogy mi más is van még a tudásbázisban. 


Rezolúció 


Megmutattuk, hogy az eddig ismertetett következtetési szabályok helyesek, de nem 
tárgyaltuk az ezeket használó következtetési algoritmusok teljességének kérdését. 
A keresési algoritmusok, mint az iíteratívan mélyülő keresés (118. oldal) teljesek ab- 
ban az értelemben, hogy meg fogják találni az elérendő célt. Ha azonban a rendelke- 
zésre álló szabályok hiányosak, akkor a cél nem érhető el — nem létezik olyan bizo- 
nyítás, amely ezeket a szabályokat használja. Például ha kivennénk az ekvivalencia 
kiküszöbölés szabályt, az előző fejezetbeli bizonyítás nem futna végig. Ez a fejezet 
egyetlen következtetési szabályi mutat be, a rezolúciót (resolution), amelynek alkai- 
mazása, párosítva bármelyik keresési módszerrel, egy teljes következtetési algoritmust 
eredményez. 






10 / nemmonoton logikák (nonmonotonic logics), amelyek megszegik a monotorútás tulajdonságot, az 
emberi érvelésnek azt a szokványos tulajdonságát jelenítik meg, amikor valaki meggondolja magát. Ezeket a 
10.7. alfejezetben tárgyaljuk. 


ti 
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Először a rezolúciós szabály egy egyszerű változatát fogjuk használni a wumpus 
világban. Nézzük meg a 7.4. (a) ábrához vezető lépéseket: az ágens visszafordul a [2, 1]- 
ből az [1, 1]-be, és innen megy az (1, 2]-be, ahol szellőt érez, de bűzt nem. A követke- 
ző tényeket adjuk hozzá a tudásbázishoz: 


Szer 7512 

Sz12: S12 6 (Cin V C22 V Ci3) 
Ugyanazzal a folyamattal, amely az Sz1g-hez vezetett korábban, most le tudjuk vezetni, 
hogy nincs csapda a [2, 2]-ben és az [1, 3]-ban (emlékezzünk, hogy már tudjuk, hogy 
az [1, 1] csapdamentes): 

Szaz: 7022 

Sza: 7Ci3 
Az Szz-ra is alkalmazhatjuk az ekvivalencia kiküszöbölést, amelyet egy Modus Ponens 
követ az Szs-re, hogy megkapjuk azt a tényt, hogy csapda van az [t, 1], a (2, 2] vagy a 
(3, 1] négyzetekben: 


Szis: Cin V C22 V Csa 


Most következik a rezolúció szabály első alkalmazása: a -C 2 literál az Sz13-ban 
rezolvál a Ca 2 líterállal az Szj5-ben, amely ezt adja: 


Sz16: Ci V Cs 


Magyarul, ha van egy csapda az [1, 1], (2, 2], (3. 1] négyzetek egyikében, és ez a csap- 
da nem a (2, 2]-ben van, akkor ez az [1, 11-ben vagy a [3, 1]-ben van. Hasonlóan a 
-C1 literál az Szy-ben rezolvál a Ci, literállal az Szr6-ban, amiből adódik: 


Szír: Csa 
"Tehát, ha van egy csapda az (1, 1]-ben vagy a (3, 1]-ben, és ez a csapda nem az [1, 1]-ben 


van, akkor ez a [3. 1]-ben van. Ez az utolsó két következtetési lépés példa az egység- 
rezolúció (unit resolution) következtetési szabályra. 


BV. ben M 

GV.N ÉNV AV. N b 
ahol Zegy literál, €; és m pedig kiegészítő literálok (complementary líterals) (példá- 
ul az egyik negáltja a másiknak). Tehát az egységrezolúció vesz egy klózt (clause) — li- 
terálok diszjunkcióját — meg egy literált, és létrehoz egy új klózt. Vegyük észre, hogy 
egy egyedi literált tekinthetünk egy literál diszjunkciójának. amit szoktak egységklóz- 
nak (unit clause) is nevezni. 

Az egységrezolúció szabálya általánosítható teljes rezolúciós (resolution) szabállyá, 


GV..N b mV. N mp 
TEN TV GNVN ÖV MVN ma mg VT VM 


ahol 4 és m; kiegészítő líterálok. Ha csak kettő hosszúságú klózokkal foglalkozunk, ak- 
kor ezt írhatjuk: 
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BV b 26V b 
av 


Azaz a rezolúció vesz két klózt, és létrehoz egy új klózt, amely tartalmaz minden líterált 
az eredeti két klózból, kivéve a kiegészítő literálokat. Például: 


PV Pzn OPAVP2z 
Pzav-P2 


Van még egy technikai aspektusa a rezolúciós szabálynak: az eredményklóznak minden 
líterálnak csak egy példányát kel! tartalmaznia." A literálok többszörös példányainak 
kivonását faktorálás (factoring) hívják. Például ha rezolváljuk az (A V B)-t a 
(A V —B)-vel, akkor (A V A)-t kapunk, amelyet redukálhatunk egyszerűen A-ra. 

A rezolúciós szabály helyessége egyszerűen belátható, ha megvizsgáljuk az 7; literált. 
Ha I; igaz, akkor mj hamis, és így mp V...V mj. 4 V mig V...V. m,-nek igaznak kell lennie, 
mert mj V...V m,, adott. Ha €; hamis, akkor éj V...V 61 V fa V...V d4igaz kell, hogy 
legyen, mivel (; V...V 44 adott, Így (; akár igaz, akár hamis, az egyik vagy a másik 
konklúzió áll, pontosan úgy, ahogy a szabály ezt kimondja. 

Ami még meglepőbb a rezolúciós szabállyal kapcsolatban, hogy a rezolúció alapjául 
szolgál teljes következtetési algoritmusok egy családjának. Bármely keresési algorit- 
mus, a rezolúciós szabályt alkalmazva, az ítéletlogikában képes levezetni bármilyen 
konklúziót, amely vonzata a tudásbázisnak. Egy figyelmeztetés: a rezolúció csak egy 
speciális értelemben teljes. Ha adott, hogy A igaz, akkor nem tudjuk a rezolúciót arra 
használni, hogy levezessük az A V B konzekvenciát. Azonban tudjuk arra használni a 
rezolúciót, hogy megválaszoljuk azt a kérdést, hogy A V 8 igaz-e. Ezt megcáfolási tel- 
jességnek (refutation completeness) nevezik, ami azt jelenti, hogy a rezotúció mindig 
használható arra, hogy megerősítsünk vagy megcáfoljunk egy mondatot, de nem alkal- 
mazható az igaz mondatok felsorolására. A következő két alfejezet azt magyarázza el, 
hogy a rezolúció hogyan oldja ezt meg. 


Konjunktív normál forma 


A rezolúciós szabály csak literálok diszjunkcióira alkalmazható, így úgy tűnhet, hogy ez 
csak olyan tudásbázis és lekérdezés esetében érdekes, amelyek ilyen diszjunkciókat tar- 
talmaznak. Akkor hogyan vezet ez egy teljes következtetési eljáráshoz az egész ítélet- 
kalkulus számára? A válasz az, hogy minden ítéletkalkulus mondat logikailag ekvivalens 
líterálok diszjunkcióinak konjunkcióival. Egy mondatot, amelyet literálok diszjunkciói- 
nak konjunkcióival fejezünk ki, konjunktív normál formájúnak (conjunctive normal 
form) vagy CNF formájúnak nevezünk. A későbbiekben az ís hasznos lesz, ha ennek 
egy korlátosabb családját, a --CNF mondatokat tekintjük. Egy mondat a k-CNF-be tar- 
tozik, ha pontosan k literál van a klózokban. 


(AN Ve V A DALA (GA V.V 4 b 


"1 Ha aklózt íterálok halmazának tekintjük, akkor ezt a korlátozást automatikusan figyelembe vettük. A hal- 
maz jelölést alkalmazva a klózokra a rezotúciós szabály sokkal tisztább lesz egy újabb jelölés bevezetésének árán. 


Ti 
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Ki fog derülni, hogy minden mondat transzformálható 3-CNF mondattá úgy, hogy azo- 
nos marad a modellek halmaza. 

Ahelyett hogy bizonyítanánk ezeket a kijelentéseket (lásd 7.10. feladat), leírunk egy 
egyszerű konvertáló eljárást. Az eljárást az Sz, szabály, az Sa 6 (Ci2 V C24) mondat 
CNF-re konvertálásával illusztráljuk. A lépések a következők: 


1. Küszöböljük ki a 5 összekötőjelet, helyettesítve az a 6 8-t(a 5 8) A (3 5 a)-vel: 
(S (Ci2 VC) A UCR V Ca Sr) 

2. Kiküszöböljük az — összekötőjelet, kicserélve a — $-t -a V §-ra: 
CSuVC2V ODA GC (CI VOZDV Sr 


3. A CNF megkívánja, hogy a — csak literálokra vonatkozzon, így most , a-t beljebb 
mozgatjuk" a következő 7.11. ábrán felírt ekvivalenciák ismételt alkalmazásával: 


-6wza kettős negáció kiküszöbölés 
-(aA B E(Cav-b) De Morgan 
(av B) -(-a A -6) De Morgan 


A példában csak az utolsó szabály alkalmazására van szükségünk: 
CSa V Ci2 V Ca A (CC12A CD VS 


4. Most van egy mondatunk, amelyben egymásba ágyazott A és V operátorok van- 
nak alkalmazva a literálokra. A 7.11. ábrán bevezetett disztributívitás szabályt al- 
kalmazzuk a V operátorokra az A felett mindenhol, ahol lehetséges. 


CSa V Ci2 V ODA GCI2V Sr) A Ca V Si) 


Az eredeti mondat most már CNF-ben van, három klóz konjunkciójaként. Bár sokkal 
nehezebb olvasni ezt a formát, de használható a rezolúciós eljárás bemeneteként. 


A rezolúció algoritmus 


A rezolúción alapuló következtetési eljárások az ellentmondásokra vezető bizonyítások 
elvén működnek, ahogy azt a 7.4. alfejezet végén tárgyaltuk. Tehát annak megmutatá- 
sához, hogy TB F a, azt mutatjuk meg, hogy a (7B A —a) kielégíthetetlen. Ezt az el- 
lentmondás bizonyításával végezzük el. 

A rezolúció algoritmust mutatja a 7.12. ábra. Először a (7B A —a)-t konvertáljuk 
CNF formára. Majd a rezolúciós szabályt alkalmazzuk a létrejövő klózokra. Minden 
egyes párt, amely kiegészítő literálokat tartalmaz, rezolválunk, hogy egy új klózt hoz- 
zunk létre, amelyet hozzáadunk a halmazhoz, ha még nem volt jelen. A folyamat addig 
folytatódik, amíg a következő két dolog közül valamelyik meg nem történik: 





" nincs több új klóz, amit hozzá lehet adni, ilyen esetben a nem vonzza maga után 6-t. 
" a rezolúció alkalmazása egy üres klózra vezet, amely esetben c-nak vonzata 3. 


Az üres klóz - egy diszjunkt nélküli diszjunkció — ekvivalens a Hamis értékkel, mert a 
diszjunkció akkor igaz csak, ha legalább az egyik diszjunkt igaz. Úgy is beláthatjuk, 
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function IK-REZOLVÁLÁS(ZB, a) returns igaz vagy hamis 
input: 7B, a tudásbázis, egy ítéletkalkulus mondat 
a, a lekérdezés. egy ítéletkalkulus mondat 


klózok — a TB A —a mondatot reprezentáló CNF formájú klózok halmaza 
új) 
loop do 
for each C, C; in klózok do 
rezolvensek — IK-REZOLVÁLÁS(C;, Cj) 
if rezotvensek tartalmazzák az üres klózt then return igaz 
új — új U rezolvensek 
át új C klózok then return hamis 
Klózok — klózok UJ új 











7.12. ábra. Egy egyszerű rezolúciós algoritmus az ítéletkalkutushoz. Az IK-REZOLVÁLÁS a két bemenetként 
megkapott állítás rezolválásából származó összes lehetséges klóz halmazát adja vissza. 


hogy az üres klóz ellentmondást reprezentál, hogy megfigyeljük azt, hogy az üres klóz 
két kiegészítő egységklóz, mint amilyen az S és -5, rezolválásából származik. 

Alkalmazzuk a rezolúciós eljárást egy nagyon egyszerű következtetésre a wumpus 
világban. Amikor az ágens az [1,1]-ben van, akkor nincs szellő, tehát nincs csapda 
a szomszédos négyzetekben. Az ennek megfelelő tudásbázis: 


TB — Sza A 524 — (Spa 6 (Ci.2 V. Ca) A Sr 


és mi bizonyítani szeretnénk a-t, ami mondjuk -C) 2. Amikor konvertáljuk a (TB A —c)-t 
CNF formára, akkor a 7.13. ábra felső részén látható klózokat kapjuk. Az ábra második 
sora mutatja az összes klózt, amit az első sor párjainak rezolválásából kaptunk. És akkor, 
amikor a CJ.2-t rezolváljuk -Cj 2-vel megkapjuk az üres klózt, amit egy kis négyzet je- 
löl. A 7.13. ábra megvizsgálása azt mutatja, hogy számos rezolúciós lépés felesleges. 
Például az S1.1 V. -Sj1 V €.2 ekvivalens az Igaz V €4.2-vel, ami ekvivalens az Igaz- 
zal. Levezetni, hogy az [gaz az igaz, nem igazán hasznos. Így bármely olyan klóz, 
amelyben két kiegészítő klóz szerepel. figyelmen kívül hagyható. 














Pa] 
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7.13. ábra. Az IK-REZOLÚCIÓ algoritmus részleges alkalmazása egy egyszerű wumpus világbeli követ- 
keztetésre. A felső sor első négy klóza alapján származtatjuk a —P).2-t. 


A rezolúció teljessége 


Hogy befejezzük a rezolúció tárgyalását, most megmutatjuk, hogy az IK-REZOLÚCIÓ 
algoritmus teljes. Ahhoz, hogy ezt megtehessük, hasznos bevezetni az S klózok halma- 
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zának rezolúciós lezártját (resolution closure), RC(5)-t, ami az összes olyan klóz hal- 
maza, amely levezethető a rezolúció ismételt alkalmazásaival az S halmazbeli elemek- 
ből és ezek leszármazottaiból. Az IK-REzoLúció a rezolúciós lezárás halmaz elemeit 
sorolja fel a kiózok változóban. Könnyű belátni, hogy RC(S)-nek végesnek kell lennie, 
mert véges sok különböző klózt lehetséges konstruálni az P), ..., Pa szimbólumokból, ame- 
lyek elemei S-nek. (Vegyük észre, hogy ez nem volna igaz a faktorálási lépés nélkül, amely 
megszünteti a literálok többszöröződését.) Így az IK-REzoLúció mindig terminálódik. 

Az ítéletlogikában a rezolúció teljességi tételét alap rezolúciós tételnek (ground 
resolution theorem) nevezzük. 

Ha klózok egy halmaza kielégíthetetlen, akkor ezeknek a klózoknak a rezolúciós 
lezártja tartalmazza az üres klózt. 

A tételt az ellentétjének demonstrálásával bizonyítjuk: ha az RC(S) lezártja nem tar- 
talmaz üres halmazt, akkor S kielégíthető. Valójában egy modellt konstruálunk 5§-nek a 
megfelelő P), ..., P, igazság értékekkel. A konstrukciós eljárás a következő: 





Minden i-re 1-től k-ig, 

" — Ha létezik egy klóz RC(5)-ben, amely tartalmazza a -P); literált úgy, hogy min- 
den más literál hamis a választott Pj, ..., P; , hozzárendelés szerint, akkor ren- 
deljünk hamis értéket P;-hez. 

s — Egyébként rendeljünk igaz értéket P;-hez. 


Az maradt hátra, hogy megmutassuk, hogy ez a P)j, ..., P, hozzárendelés modellje 
§-nek, feltéve, hogy RC(5S) zárt a rezolúcióra, és nem tartalmazza az üres klózt. Ennek 
bizonyítását meghagyjuk feladatnak. 


Előre- és hátrafelé láncolás 


A rezolúciót a teljesség tulajdonsága igen fontos következtetési módszerré teszi. Számos 
gyakorlati esetben azonban, a rezolúció teljes erejére nincs szükség. A valósvilág-beli 
tudásbázisok gyakran a klózoknak csak egy, Horn-klózoknak (Horn clause) nevezett 
korlátosabb fajtáját tartalmazzák. A Horn-klóz literálok olyan diszjunkciója, amelyek 
közül legfeljebb egy pozitív. Például a (-Pj V Szellő V 511) klóz, ahol Pj a jelenti, 
hogy az ágens pozíciója az [1, I], egy Horn-klóz, míg az (Sj.1 V C1.2 V €2,1) nem az. 

A korlátozás, hogy csak egy pozitív literál lehet, egy kissé önkényesnek és érdekte- 
lennek tűnhet, de valójában nagyon fontos, három ok miatt is: 





1. Minden Horn-klóz felírható egy implikációként is, amelynek premisszája pozitív 
literálok konjunkciója, és konklúziója egyetlen pozitív literál (lásd 7.12. feladat). 
Például a (Pi. v Szellő V S1.1) Horn-klóz átírható a (P) 4 A Szellő) — S, 1 ímpli- 
kációra. Ebben az utóbbi formájában sokkal könnyebb olvasni a mondatot: azt 
mondja ki, hogyha az ágens az [1, 1]-ben van, és szellő érzékelhető ott, akkor 
az [1.1] szellős. Számos területen az emberek számára könnyű a tudást ilyen mon- 
datok formájában olvasni és leírni. 

A Horn-klózokat. mint amilyen az előbbi, vagyis amelyben pontosan egy pozitív 
literál van, határozott klózoknak (definite clauses) nevezik. A pozitív literál a fej 
(head), míg a negatív literálok alkotják a klóz testét (body). Egy negatív literálok 
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nélküli határozott klóz egyszerűen kijelent egy adott állítást, amit gyakran tény- 
nek (fact) neveznek. A határozott klózok formálják a logikai programozás 
(logic programming) alapját, amelyet a 9. fejezetben tárgyalunk. Egy pozitív li- 
terálok nélküli Horn-klóz felírható, mint egy olyan implikáció, amelynek a konk- 
lúziója a Hamis literál. Például a (2W) , V. -W).2) klóz — a wumpus nem lehet 
mind az [1,1], mind az [1,2] mezőben, ekvivalens a Win A W) 2 — Hamis mon- 
dattal. Az ilyen mondatokat integritás kényszereknek (integrity constraints) 
nevezzük az adatbázis-kezelés területén, ahol adathibák jelzésére használják. 
A következőkben bemutatásra kerülő algoritmusokban az egyszerűség kedvéért 
feltételezzük, hogy a tudásbázis csak határozott klózokat tartalmaz, és nincsenek 
benne integritáskényszerek. Azt mondjuk, hogy ezek a tudásbázisok Horn-formá- 
ban vannak. 

2. A Horn-klózokon történő következtetés történhet az előrefelé láncolás (forward 
chaining) vagy a hátrafelé láncolás (backward chaining) algoritmusokkal, ame- 
lyeket a következőkben elmagyarázunk. Mindkét algoritmus igen természetes, a kö- 
vetkeztetési lépések nyilvánvalóak és egyszerűen követhetőek az emberek számára. 

3. A maga után vonzás kérdésének eldöntéséhez szükséges idő lineárisan függ a tu- 
dásbázis méretétől. 





function IK-EL-VONZATX(7B, 9) returns igaz vagy hamis 
ínputs: 7B, a tudásbázis, ítétetkalkulus Horn-kiózok halmaza 
4, a lekérdezés, egy ítéletkalkulus szimbólum 
lokális változók: számláló, egy tábla, klózokkal indexelve, kezdetben a premisszák száma 
következmények, egy tábla, szimbólumokkal indexelve, kezdetben minden 
elem hamis 
agenda, szimbólumok listája. kezdetben azok a 7B-beli szimbólumok, amelyekről 
ismerjük, hogy igazak 


"while agenda nem üres do 
Pp — Etere(agenda) 
if p — g then return ígaz 
unless következmények (p) do 
következmények (pl — igaz 
for each c Horn-klóz, amelyben a p premissza szerepel do 
csökkent számláló [c] 
if számláló (c) — 0 then 
HozzáaD(Fes[c), agenda) 
return hamis 











7.14. ábra. Előrefelé láncolás algoritmus az ítéletkalkulus számára. Az agenda tartalmazza azokat a 
szimbólumokat, amelyek ismerten igazak, de még nem , dolgozták fel" őket. A számot tábla követi, hogy 
az egyes implikációknak hány premisszája ismeretlen. Ha az agendárót egy új p szimbólumot feldol- 
gozunk, minden olyan implikáció számlálója csökken eggyel, amelynek premnisszájában p megjelenik. 
(Ez megoldható konstans időben, ha a 7B megfelelően indexelt.) Ha a számláló eléri a nullát, azaz az 
implikáció minden premisszája ismert, akkor az implikáció konklúzióját hozzá lehet adni az agendához. 
Végül szükségünk van arra, hogy kövessük melyik szimbólumot dolgoztuk már fel; egy kikövetkeztetett 
szimbólumot nem kell hozzáadni az agendához, ha azt már korábban sikeresen feldolgoztuk. Így elkerül- 
hető a redundáns munka, és megakadályozza a végtelen ciklusok kialakulását, amelyet olyan implikációk 
okozhatnak, minta P 5 0és0 5 P. 
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Ez az utolsó tény egy kellemes meglepetés. Azt jelenti, hogy a logikai következtetés na- 
gyon olcsó számos, a gyakorlatban előforduló ítéletkalkulus tudásbázis esetében. 

Az IK-EL-VONZATATB, 9) előrefelé láncolási algoritmus meghatározza, hogy egy 
4 ítéletkalkulus szimbólum — a lekérdezés — vonzata-e egy Horn-klózokat tartalmazó 
tudásbázisnak. Az algoritmus a tudásbázisban található ismert tényekből (pozitív li- 
terálok) indul ki. Ha egy implikáció minden premisszája ismert, akkor a konklúzióját 
hozzáadjuk az ismert tények halmazához. Például, ha ismert a Pj 4, és a Szellő és a 
(Pia A Szellő) 5 Si. a tudásbázisban van, akkor SJ r-t hozzáadhatjuk ehhez. Ez a fo- 
lyamat folytatódik, amíg vagy a g lekérdezést hozzá tudjuk adni az ismert tények hal- 
mazához, vagy már nem tudunk további következtetést végezni. A részletes algoritmust 
a 7.14. ábra mutatja, a legfontosabb tulajdonság, amire emlékeznünk kell. hogy ez líne- 
áris időben fut. 

Az algoritmust a legjobban úgy érthetjük meg, ha megnézünk egy példát és egy 
hozzá tartozó ábrát. A 7.15. (a) ábra egy egyszerű Horn-klózokból álló tudásbázist 
mutat be, amely az A és B ismert tényeket tartalmazza. A 7.15. (b) ábra ugyanezt a 
tudásbázist egy ÉS-VAGY gráfként (AND-OR graph) ábrázolja. Az ÉS-VAGY 
gráfokban a konjunkciókat ívekkel összefogott kapcsolatok — minden egyes kapcso- 
latot bizonyítani kell — jelölik, míg a diszjunkciókat ívek nélkül összefutó kapcsola- 
tok - elég valamelyik kapcsolatot bizonyítani — jelölik. Könnyű áttekinteni, hogyan 
is működik az előrefelé láncolás a gráfon. Az ismert levelek (itt A és B) adottak, és 
a következtetés addig halad felfelé a gráfon, amíg lehetséges. Bárhol megjelenik egy 
konjunkció a folyamatban, a továbbterjesztés megáll addig, amíg az összes konjunkt 
ismertté nem válik, majd ezután halad tovább. Javasoljuk az olvasónak; hogy vegye 
át részletesen a példát. 

Könnyű belátni, hogy az előrefelé láncolás helyes: minden következtetés valójában 
a Modus Ponens egy alkalmazása. Az előrefelé láncolás teljes is: minden vonzat atomi 
mondatot vezet le. A legegyszerűbben úgy érthetjük meg ezt, ha a kikövetkeztetett álla- 
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7.15. ábra. (a) Egyszerű Horn-klózokból álló tudásbázis. (b) Ugyanez a tudásbázis ÉS-VAGY gráfként. 
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pot tábla végső állapotát tekintjük (miután az algoritmus elért egy fix pontot (fixed 
Point), ahol már újabb következtetés nem lehetséges). A tábla igaz értéket tartalmaz 
minden, a folyamat során kikövetkeztetett szimbólumra, és hamis értéket a többi szim- 
bólumra. A táblát úgy tekinthetjük, mint egy logikai modellt, ráadásul minden határo- 
zott klóz az eredeti TB-ben igaz ebben a modellben. Ennek belátására feltételezzük 
az ellenkezőjét, nevezetesen, hogy valamely aj A ... A ap b klóz hamis a modellben. 
Ez azt jelenti, hogy aj A ... A ay-nak igaznak, b-nek hamisnak kell lennie a modell- 
ben. Ez viszont ellentmond annak a feltételezésünknek, hogy az algoritmus elérte a fix 
pontot! Így levonhatjuk azt a következtetést, hogy a kikövetkeztetett atomi mondatok 
halmaza a fix pontban az eredeti 7B egy modelljét definiálja. Ezenkívül, bármely g 
atomi mondatnak, amely vonzata a 7B-nek, igaznak kell lennie ennek minden modell- 
jében, így ebben az említett modellben is. Ennélfogva az algoritmusnak ki kell követ- 
keztetnie minden g vonzat mondatot. 

Az előrefelé láncolás egy példája az általános adatvezéreltnek (data-driven) neve- 
zett következtetési elvnek, amely olyan következtetéseket jelent, ahol a figyelem fóku- 
sza kezdetben az ismert adatokon van. Ez a megközelítés alkalmazható az ágenseknél 
a bejövő érzetekből történő következtetések levezetésére, gyakran anélkül is, hogy 
valamilyen kérdés lebegne a szemünk előtt. Például a wumpus ágens KIIJELENT-heti az 
érzeteit a tudásbázisnak, felhasználva egy inkrementális előrefelé következtető algorit- 
must, amelyben új tényeket lehet felvenni egy előjegyzési listára, hogy további követ- 
keztetés inicializálódjon. A mindennapi életben, jelentős számban fordul elő adatvezé- 
relt következtetés, amikor új információk érkeznek. Például ha bent vagyok a szobában 
és hallom, hogy elkezd esni, akkor felmerülhet bennem, hogy a tervezett kirándulás 
elmarad. Ugyanakkor az valószínűleg nem fog megfordulni a fejemben, hogy a szom- 
széd kertjében a legnagyobb rózsa tizenhetedik szírma nedves lesz. Az emberek óvatos 
kontroll alatt tartják az előrefelé láncolást. nehogy elárasszák őket az irreleváns követ- 
kezmények. 

A visszafelé láncolás algoritmus, ahogy azt a neve is sugallja, visszafelé működik 
a lekérdezésből indulva. Ha a g lekérdezésről tudjuk, hogy igaz, akkor nem szükséges 
további munka. Egyébként az algoritmus megtalál minden olyan implikációt a tudásbá- 
zisban, amelynek a következménye g. Ha valamelyik ilyen implikációnak az összes 
Ppremisszáját be lehet bizonyítani (visszafelé láncolással), akkor g igaz. Amikor a 7.15. 
ábrán a 0 lekérdezésre alkalmazzuk a módszert, akkor ez az ábrán követve vissza, lefe- 
lé működik, addig, amíg el nem éri az ismert tények halmazát, ami a bizonyítás alapja. 
A részletes algoritmust meghagyjuk feladatnak, és mint az előrefelé láncolásnál, egy 
hatékony implementáció itt is lineáris időben működik. 

A visszafelé láncolás a célorientált következtetés (goal-oriented reasoning) egy 
formája. Hasznos-e megválaszolni olyan kérdéseket, mint hogy ..Mit tegyek most?", 
vagy hogy , Hol vannak a kulcsaim?". Gyakran a visszafelé láncolás költsége sokkal 
kisebb, mint a tudásbázis méretétől lineárisan függő költség, mert a folyamat csak rele- 
váns tényeket érint. Általánosságban, egy ágensnek meg kell osztania a munkát az elő- 
refelé és hátrafelé láncolás között, korlátozva az előrefelé következtetés alkalmazását 
azokra a tényekre, amelyek valószínűleg relevánsak azon lekérdezésekhez, amelyeket 
az ágens visszafelé láncolással fog megoldani. 
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Ebben a szakaszban az ítéletkalkulus következtetés két hatékony családját írjuk le, ame- 
lyek a modellellenőrzésen alapulnak: az egyik megközelítés a visszalépéses keresésen 
alapul, a másik a hegymászó keresésen. Ezek az algoritmusok az ítéletkalkulus , tech- 
nológiájának" részei. Ez a szakasz átlapozható a fejezet első olvasásakor. 

Az algoritmusok, amelyeket leírunk, a kielégíthetőséget ellenőrzik. Már megfigyeltük 
a kapcsolatot egy logikai mondatot kielégítő modell megtalálása és egy kényszerkielé- 
gítési probléma megoldásának megtalálása között, így talán nem meglepő, hogy a két 
algoritmus család igen hasonlít az 5.2. alfejezetben bemutatott visszalépéses algoritmu- 
sokra és az 5.3. alfejezet lokális keresési algoritmusaira. Ezek az algoritmusok azonban 
rendkívül fontosak saját maguk jogán is, mert számos kombinatorikai probléma a szá- 
míitástechnikában visszavezethető egy ítéletkalkulus mondat kielégíthetőségének ellen- 
őrzésére. A kielégíthetőségi algoritmusok terén elért bármilyen haladás általánosságban 
is óriási hatással van a képességeinkre a komplexitás kezelésében. 


Egy teljes visszalépéses algoritmus 


Az első algoritmus, amit megnézünk Martin Davis és Hilary Putnam (1960) jelentős 
konferenciacikke alapján, az úgynevezett Davis-Putnam-algoritmus. Ez az algorit- 
mus valójában egy változata annak, amelyet Davis, Logemann és Loveland (1962) pub- 
likált, így DPLL-nek fogjuk hívni szerzőik neveinek kezdőbetűi alapján. A DPLL 
bemenetként egy konjunktív normál formájú mondatot vesz — a klózok egy halmazát. 
Mint a VISSSZALÉPÉSES-KERESÉS vagy az IK-VONZAT?, ez is alapvetően rekurzív, mély- 
ségi felsorolását végzi a lehetséges modelleknek. Az algoritmus három továbbfejlesztést 
tartalmaz az IK-VONZAT? egyszerű sémájához képest: 


, Korai leállás: Az algoritmus észreveszi, ha egy mondat már biztos igaz vagy hamis, 
még részben elkészült modell alapján is. Egy klóz igaz, ha bármelyik literál igaz, 
még akkor is, ha a többi literálnak még nincs igazság értéke. Ennélfogva a monda- 
tot mint egészet igaznak ítélhetjük, még mielőtt a modell teljes volna. Például az 
(A V B) A (A V €) igaz, ha A igaz, függetlenül 8 és C értékétől. Hasonlóan, egy mon- 
dat hamis, ha bármelyik klóz hamis, ami akkor fordul elő, ha ennek a klóznak minden 
literálja hamis. Ismételten, ez a modell teljessé válásánál sokkal korábban is előfordul- 
hat. A korai leállás a keresési tér egész részfáinak átvizsgálását kerüli el. 

a Tiszta szimbólum heurisztika: Egy tiszta szimbólum (pure symbol) egy olyan 
szimbólum, amely mindig ugyanolyan , előjellel" szerepel minden klózban. Például 
a következő három mondatban, (A V -8), (-B V -C) és az A szimbólum tiszta, 
mivel csak a pozitív literálja jelenik meg, a B tiszta, mivel csak a negatív literálja je- 
lenik meg, és C nem tiszta. Könnyű belátni, hogyha egy mondatnak van modellje, 
akkor létezik tiszta szimbólumokat tartalmazó modeilje is, amelyben a tiszta szim- 
bólumok értéke úgy van megválasztva, hogy literáljai igazak legyenek, hiszen így 
egyetlen klózt sem teszünk hamissá. Vegyük észre, hogy egy szimbólum tisztaság 
tulajdonságának meghatározásakor az algoritmus figyelmen kívül hagyhatja azokat 
a klózokat, amelyekről már tudjuk, hogy igazak a modell eddigi konstruálása alapján. 
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Például ha a modellünk tartalmazza a B — hamis hozzárendelést, akkor a (-8B v -C) 
klóz már igaz, és C tisztává válik, mert csak a (C V A)-ban jelenik meg. 

" Egységklóz heurisztika: Az egységklózt már definiáltuk korábban, mint egy olyan 
klózt, amelynek egy literálja van. A DPLL esetében, ez azt jelenti, hogy egy kívé- 
telével minden literál hamis értéket kapott a modellben. Például ha a modell tartal- 
mazza a B — hamis hozzárendelést, akkor a (B V -C) egység klózzá válik, mivel 
ekvivalens a (Hamis V —C)-vel, azaz a 2C-vel. Természetesen ahhoz, hogy ez a 
kióz ígaz legyen, C-nek hamis értéket kell adni. Az egységklóz heurisztika elvégzi 
ezeket a hozzárendeléseket, mielőtt elágazna a maradékon. Egy fontos konzekven- 
ciája ennek a heurisztikának, hogy bármely. már a tudásbázisban található líterálra 
vonatkozó (cáfolat általi) bizonyítási kísérlet azonnal sikeres lesz (7.16. feladat). 
Vegyük észre azt is, hogy értéket adva egy egységklózhoz újabb egységklózt hoz- 
hatunk létre. Például amikor C-nek hamis értéket adunk, akkor a (C V A) egy- 
ségklózzá válik, ami az igaz A-hoz való hozzárendelését eredményezi. Ezt az 
egymást követő" kikényszerített hozzárendelések sorozatát egységterjesztésnek 
(unit propagation) nevezik. Hasonlít a folyamat a Horn-klózokkal történő előre- 
felé láncolásra, és valóban, abban az esetben ha a CNF formájú kifejezés csak 
Horn-klózokat tartalmaz, akkor a DPLL lényegében lemásolja az előrefelé lánco- 
lást (lásd 7.17. feladat). 








A DPLL algoritmust mutatja a 7.16. ábra. Az ábrán a lényeges elemeket tartalmazó vá- 
Zat adtuk meg, ami bemutatja magát a keresési folyamatot. Nem szerepel az adatstruk- 
túra leírása, amelyet fenn kell tartani, hogy a keresési lépéseket hatékonyan lehessen el- 








function DPLL-KIELÉGÍTHETŐSÉG?(5) returns igaz vagy hamis 
inputs: s, egy ítéletkalkulus mondat 


klózok — az s mondat CNF formájú klőzainak halmaza 
szimbólumok 5— az s mondat szimbólumainak listája 
return DPLL(klózok, szimbólunok, ()) 





function DPLL(Xlózok, szimbólumok, modelf) returns igaz vagy hamis 


if minden klóz a klózok halmazban igaz a model! modellben then return igaz 
if néhány klóz a klózok halmazban hamis a modef! modellben then return hamis 
P. érték — TISZTA-SZIMBÓLUM-KERESÉS(któzok, szimbólumok, modell 
if P nem nulla then return DPLL(któzok, szünbólumok-P, KIEGÉSZIT(P, érték, modelf) 
P, érték — EGYSÉG-KLÓZ-KERESÉS(któzok, modell) 
if P nem nulla then return DPLL(klózok, szimbólumok-P, KIEGÉSZÍT(P, érték, modell) 
P 6 ELső(szimbólumok); maradék — MARADÉK(szimbólumok); 
return DPLL(4Iózok, maradék, KIEGÉSZÍKP, igaz, modelt)) or 
DPLLAKlózok, maradék, KIEGÉSZIP, hamis, modett)) 











7.16. ábra. A DPLL algoritmus ítéletkalkulus mondatok kielégíthetőségének ellenőrzése. A TISZTA- 
SZIMBÓLUM-KERESÉS és az EGYSÉG-KLóz-KEResés eljárásokat a szövegben elmagyaráztuk; mindkettő 
egy szimbólummal vagy nullával tér vissza, és a szimbólumhoz hozzárendelendő igazságértékkel. Mint 
az IT-VOnzaT? eljárás, ez is részleges modelleken dolgozik. 
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végezni, sem azoknak a trükköknek a leírása, amelyeket a teljesítmény fokozása céljá- 
ból az alapalgoritmushoz hozzá lehet adni: kióztanulás. változó választási heurisztika és a 
véletlenszerű újraindítások technikája. Ha ezeket ís beépítjük az algoritmusba. akkor a 
DPLL az egyik leggyorsabb kielégíthetőségi algoritmus, antikvitása ellenére is. A CHAFF 
implementáció millió változós hardververifikációs problémák megoldására szolgált. 


Lokális keresés algoritmus 


Számos lokális keresés algoritmust láttunk már a könyvben. beleértve a HEGYMÁSZÓ 
algoritmust (155. oldal) és a SZIMULÁLT-LEHŰTÉS-t ( 158. oldal). Ezek az algoritmusok 
alkalmazhatók közvetlenül is kielégíthetőségi problémákra, feltéve, hogy megfelelő 
kiértékelő függvényt választunk. Mivel a cél egy olyan hozzárendelés megtalálása, 
amely kielégít minden klózt, megfelel számunkra egy olyan kiértékelő függvény 
választása, amely a kielégítetlen kiózok számát számolja. Valóban, ez pontosan az a 
mérték, amit a MIN-KONFLIKTUS algoritmus használt kényszerkielégítési problémáknál 
(197. oldal). Minden ilyen algoritmus a teljes hozzárendelések terében végez lépéseket, 
cserélgetve egy-egy lépésben egy-egy szimbólum igazságértékét. A tér rendszerint számos 
lokális minimumot tartalmaz, amelyekből a meneküléshez a véletlenszerű lépések külön- 
féle formái szükségesek. Az utóbbi években nagyon sokat foglalkoztak azzal a kérdéssel, 
hogy hogyan lehet egy jó egyensúlyt találni a mohóság és a véletlenszerűség között. 

Az egyik legegyszerűbb és leghatékonyabb algoritmus, amely ezen munkák között 
felbukkant a WALKSAT (7.17. ábra). Minden iterációban az algoritmus vesz egy kielé- 
gítetlen klózt és egy szimbólumot a kiózból, amelynek értékét ellenkezőre cseréli. 
Az értéket cserélő szimbólum kiválasztása a következő két módszer közül — véletlen- 
szerűen választva — az egyikkel történik: (1) a ..min-konfliktus" lépés, amely minímali- 
zálja a kielégítetlen klózokat az új állapotban, és a (2) ,,véletlen-bejárás", amely vélet- 
lenszerűen választja a szimbólumot. 

Működik-e egyáltalán a WALKSAT? Az egyértelmű, hogy ha visszaad egy modellt, 
akkor a bemeneti mondat valóban kielégíthető. Mi van akkor, ha kudarccal tér vissza? 





function WALKSAT(Kklózok, p. max. csere) returns egy kielégítő modell vagy kudarc 
inputs:  klózok, ítéletkalkulus klózok halmaza 
D, a véletlen lépés" valószínűségének értéke, általában 0,5 körüli 
max csere, a megengedett cserék száma, mielőtt feladná az algoritmus 


modell — igazjhamis értékek véletlen hozzárendelései a kiózok szimbólumaihoz 
fori — I to max csere do 
4 model! kielégíti klózok then return model! 
klózok — véletlenszerűen választott klóz a kiózok elemei közül, amely hamis a modetl-ben 
with probability p érték csere egy véletlenszerűen választott kfóz-ban a modell-ben 
€lse bármelyik szimbólum a kióz-ban, amely maximalizálja a kielégített klózok számát 
return kudarc 














7.17. ábra. A WALKSAT algontmus, kielégíthetőségének ellenőrzése véletlenszerűen cserélgetetett vál- 
tozó énékekkel. Számos változata ismert az algoritmusnak. 
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Sajnos ebben az esetben nem tudjuk megmondani, hogy a mondat kielégíthetetlen vagy 
az algoritmus számára több időt kellene hagyni a keresésre. Megpróbálhatjuk beállítani 
a max csere értékét végtelenre. Erre az esetre könnyű megmutatni, hogy a WALKSAT 
végül vissza fog adni egy modellt (ha létezik ilyen), feltéve, hogy a p valószínűségre 
igaz ap 5 0. Ez azért van így, mert mindig létezik egy olyan cserélési sorozat, amely 
elvezet egy kielégítő hozzárendeléshez, és előbb-utóbb a véletlen bejárás lépések elő 
fogják állítani ezt a sorozatot. Persze ha a max csere végtelen, és a mondat kielégíthe- 
tetlen, akkor az algoritmus soha nem fog leállni! 

Ezek az eredmények azt sugallják, hogy a lokális keresési algoritmusok, mint a 
WALKSAT, akkor a leginkább hasznosak, ha feltételezhetjük, hogy létezik megoldás — 
mint például a 3. és 5. fejezetben tárgyalt problémáknak általában van megoldásuk. 
Viszont a lokális keresés nem képes detektálni a kielégíthetetlenséget, amely szükséges 
a maga után vonzás kérdésének az eldöntéséhez. Például egy lokális keresést alkalma- 
zó ágens nem tudja megbízhatóan bizonyítani, hogy egy négyzet biztonságos a wumpus 
világban. Ehelyett azt tudja mondani, hogy , Egy órája gondolkodom a kérdésen, és 
nem tudtam olyan lehetséges világot találni, amiben a négyzet nem biztonságos." Ha a 
lokális keresés algoritmus általában igazán gyors egy modell megtalálásában, ha létezik 
ilyen, akkor az ágenst tekinthetjük igazolhatónak, feltételezve, hogy a kudarc a kielé- 
gíthetetlenséget jelzi. Ez természetesen nem azonos egy bizonyítással, és az ágensnek 
kétszer ís meg kell gondolnia, mielőtt erre bízza az életét. 


Nehéz kielégíthetőségi problémák 


Most megnézzük, hogyan is teljesít a DPLL és a WALKSAT a gyakorlatban. Minket 
elsősorban a nehéz problémák érdekelnek, mert a könnyű problémák megoldhatóak 
bármely régi algoritmussal is. Az 5. fejezetben láttunk néhány meglepő felfedezést 
bizonyosfajta problémákkal kapcsolatban. Például az n-királynő probléma — amely 
igen kemény feladat volt a visszalépéses keresés számára — triviálisan egyszerűnek 
bizonyult az olyan lokális keresési módszerek számára, mint például a min-konfliktus. 
Ennek az az oka, hogy a megoldások nagyon sűrűn oszlanak el a hozzárendelések 
terében, és bármely kezdeti hozzárendeléshez garantáltan találhatunk egy megoldást 
a közelben. Tehát az n-királynő könnyű probléma, mert alulhatározott (under- 
constrained). 

Amikor konjunktív normál formában levő kielégíthetőségi problémákat tekintünk, 
alulhatározott probléma az, amelyben viszonylag kevés a változókat korlátozó klóz sze- 
repel. Például itt van egy véletlenszerűen létrehozott!? 3-CNF mondat öt szimbólummal 
és öt klózzal: 


CDV-BVOJA(GBV-AV-CJA(-CV BV E) 
N(EV-DVBYA(BVEV-€) 


A 32 lehetséges hozzárendelésből 16 modellje a mondatnak, így átlagosan csak két vé- 
letlenszerű találgatásra van szükség egy modell megtalálásához. 


12 Minden klóz három véletlenszerűen kiválasztott szimbólumot tartalmaz, amelyek 5096 valószínűséggel 
negáltak. 
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Akkor melyek a nehéz problémák? Feltételezhető, hogyha növeljük a klózok számát, 
miközben a szimbólumok számát rögzítve tartjuk, a problémát erősebben határozottá 
tesszük, és a megoldás megtalálása egyre nehezebbé válik. Legyen m a klózok száma 
és n a szimbólumok száma. A 7.18. (a) ábra mutatja annak a valószínűségét, hogy egy 
véletlenszerűen választott 3-CNF mondat kielégíthető-e a klóz/szimbólum arány (min) 
függvényében rögzített n — 50 mellett. Ahogy vártuk, kis min aránynál a valószínűség 
közel van 1-hez, és nagy m/n aránynál közel van a 0-hoz. A valószínűség viszonylag 
élesen esik le az min — 4.3 értéknél. Azok a CNF mondatok, amelyek közel vannak 
ehhez a kritikus ponthoz (critical point), , alig kielégíthetőnek" vagy , alig kielégíthe- 
tetlennek" jellemezhetők. Ez volna az, ahol a nehéz problémák vannak? 

A 7.18. (b) ábra mutatja a DPLL és a WALKSAT futási időit ennek a pontnak a kör- 
nyezetében, csak a kielégíthető problémákat véve figyelembe. Három dolog tiszta: elő- 
ször is, a kritikus pont körüli problémák sokkal nehezebbek, mint a többi probléma. Má- 
sodszor, a DPLL igen hatékony még a legnehezebb problémákra is — átlagosan éhány 
ezer lépést tesz, összehasonlítva az igazságtábla felsorolás 259 az 10" számú lépésigényé- 
vel. Harmadszor, a WALKSAT a teljes tartományban sokkal gyorsabb, mint a DPLL. 

Természetesen ezek az eredmények csak a véletlenszerűen generált problémákra 
vonatkoznak. A valós problémáknak nem feltétlenül hasonló a struktúrájuk — a pozi- 
tív és negatív állítások aránya, a klózok közti kapcsolatok sűrűsége, és egyéb más 
vonatkozások — mint a véletlen problémáknak. Mégis, a gyakorlatban a WALKSAT és 
az ehhez kapcsolódó, hasonló algoritmusok nagyon jók valós problémák megoldásá- 
ban is — gyakran ugyanolyan jók, mint az adott feladatra készített legjobb speciális 
célú algoritmus. Több ezer szimbólumot és milliónyi kiózt tartalmazó problémákat 
megoldókkal szokás kezelni, mint amilyen a CHAFF. Ezek a megfigyelések azt sugall- 
ják, hogy a min-konfliktus és a véletlen bejárás algoritmusok valamilyen kombinációja 
általános célú képességet biztosít a legtöbb szituáció elemzéséhez, ahol kombinatorikai 
következtetés szükséges. 









DPLL —r— 
WALKSAT ——-strer 


Píkielégíthető) 
§..§£ § B 
Futási 

8888 


o 
o 


b.! 2 § 4 § 67 8 4 AE: NEE Zaltb. SRE. TRE ENEK  Sölbk SZEBB 5 
min klózíszimbólum arány min klózíszimbólum arány 


(a) 6 


7.18. ábra. (a) A grafikon a klóziszimbólum arány függvényében annak valószínűségét mutatja, hogy 
n. — 50 mondat közül véletlenszerűen választott 3-CNF mondat kielégíthető-e. (b) A grafikon a DPLL és 
a WALKSAT algoritmusok futási időinek középértékét mutatja 100 kielégíthető 3-CNF mondaton n — 50 
mellett, a kritikus mr arány melletti szűk sávban. 
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7.7. ÍTÉLETLOGIKÁT ALKALMAZÓ ÁGENSEK 


Ebben a szakaszban, összeszedünk mindent, amit eddig tanultunk, hogy olyan ágenseket 
konstmáljunk, amelyek az ítéletlogika felhasználásával működnek. Kétfajta ágenst fogunk 
megvizsgálni: olyat, amely következtetési algoritmust és egy tudásbázist használ, mint a 
7.1. ábra általános tudásbázisú ágense, és olyat, amely a logikai kifejezések kiértékelését 
közvetlenül, áramköröket alkalmazva végzi. Mindkétfajta ágenst a wurapus világban fog- 
juk demonstrálni, és látni fogjuk. hogy mindkettő komoly hátrányoktól szenved. 


Csapdák és wumpusok megtalálása logikai következtetés 
felhasználásával 


Kezdjünk egy ágenssel, amely képes logikusan érvelni a csapdák és wumpusok helyével 
És a biztonságos négyzetekkel kapcsolatban. A feladat megoldása a tudásbázis felírásá- 
vat kezdődik, amely reprezentálja a wumpus világ . fizikáját". Az ágens tudja, hogy az 
[I, 1] nem tartalmaz se csapdát, se wumpust, azaz Ci a és —W) 4. Az ágens minden [x, y] 
négyzetre ismer egy mondatot, ami azt jelenti ki, hogy a szellő honnan ered: 


Say 67 (Coyai V Cyr V Cry V Ca) (71) 


Az ágens minden [x, yI négyzetre ismer egy mondatot, ami azt jelenti ki, hogy a bűz ho- 
gyan ered: 


Bye Wyatt V. Wan V. Wagi V W1) 02 


Végül tudja, hogy pontosan egy wumpus van. Ezt két részben fejezzük ki. Először ki 
kelt jelentenünk, hogy legalább egy wumpus van: 


Wi1 V.Wi2 V...V Wa3 V Wa 


Ezután azt kell mondanunk, hogy legfeljebb egy wumpus van. Az egyik lehetséges 
módja ennek, hogy minden két mezőre kijelentjük, hogy a két mező egyikének wumpus- 
mentesnek kell lennie. Ha n négyzet van, akkor r(n — 1)/2 mondatot kapunk, olyanokat 
mint a -Wj 1 V —W.2. Egy 4 x 4-es világ esetében, így összesen 64 különböző szim- 
bólumot tartalmazó 155 mondattal kezdünk. 

Az ágensprogram, amelyet a 7.19. ábra mutat, KIJELENTI a tudásbázisnak az összes 
szellő és bűz érzetet. (Ezenkívül frissíti néhány hagyományos változójának értékét is, 
amelyek azt őrzik, hogy az ágens merre van most és merre járt korábban — erre később 
még visszatérünk). Ezután a program kiválasztja, hogy melyik cellát nézze meg a pere- 
men lévők közül — olyan négyzetek közül, amelyek szomszédosak valamelyik megláto- 
gatottal. Egy peremen lévő [x, y] cella bizonyíthatóan biztonságos, ha a (—€;j A 2W;, 1) 
mondat vonzata a tudásbázisnak. A , második legjobb dolog", ha egy cella lehetséges, 
hogy biztonságos, amikor az ágens nem tudja bizonyítani. hogy ott egy csapda vagy egy 
wumpus van - azaz, hogy a (C; ; V W; j) nem vonzat. 

A KÉRDEZ eljárásban levő maga után vonzás számítása implementálható a fejezetben 
korábban bemutatott a módszerek közül bármelyikkel. Az IT-VONZAT? (7.10. ábra) 
nyilván nem praktikus, mivel fel kellene sorolni a 264 sort. A DPLL (7.16. ábra) 
néhány milliszekundum alatt végrehajtja a kívánt következtetést, leginkább az egység- 
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function IK-WuMpPus-ÁGEns(érzet) returns egy cselekvés 
inputs: érzet, egy lista, [bűz, szellő, ragyogás] 
static: 7B, egy tudásbázis, kezdetben a wumpus világ , fizikájár" tartalmazza 
Xx, y. orientáció, az ágens pozíciója (kezdetben 1, 1) és orientációja (kezdetben jobbra) 
meglátogatott, egy tömb, meglátogatott négyzetek megmutatása, kezdetben hamis 
cselekvés, az ágens által végrehajtott utolsó cselekvés, kezdetben nulla 
terv, egy cselekvéssorozat. kezdetben üres 


frissít x, y, orlentáció, meglátogatott a végrehajtott cselekvés alapján 
át bűz then KDELENT(TB, B, ,) else KIJELENT(TB, —B, )) 
1£ szellő then KIJELENT(TB, 5, ,) else KDELENT(7B, —5, ,) 
it ragyogás then cselekvés — megragad 
else íf terv nem üres then cselekvés — ELSŐ(terv) 
else if valamely szélső [í, jl négyzetre, KÉRDEZKZB, (-C; j A 2W; j) igaz or 
valamely szélső [/. j) négyzetre, KÉRDEZ(ZB, (Ci; j V W;) hamis then do 
cselekvés 5— At-GRÁF-KERESÉS(ÚTVONAL-PROBLÉMA([x, y], orientáció, ((i, jl. meglátogatotn) 
cselekvés — ELső(terv) 
else cselekvés — véletlen választott lépés 
return cselekvés 








77.19. ábra. Egy wumpusvilág-beli ágens programja, amely ítéletkalkulust használ a csapdák, a wum- 
"pusok és a biztonságos négyzetek azonosítására. Az ÚTVONAL-PROBLÉMA szubrutin létrehoz egy keresési 
problémát, aminek megoldása egy cselekvéssorozat, amely elvezet az [x, y] négyzetből az [í, jl-be, és csak 
korábban már látogatott négyzeteken vezet keresztül. 


propagáció heurisztikának köszönhetően. A WALKSAT szintén használható, a teljesség 
hiányából származó gyengeségeivel. A wumpus világokban, a modell megtalálásának 
kudarca, 10 000 cserét feltételezve, praktikusan megfelel a kielégíthetetlenségnek, így 
nem valószínű, hogy hiba fordulhatna elő a teljesség hiánya miatt. 

Az IK-WUMFPUS-ÁGENS igen jól működik kisméretű wumpus világban. Azonban 
mégis van valami erősen nem megnyugtató az ágens tudásbázisával kapcsolatban. A TB 
tartalmazza a fizikai leírást a (7.1) és (7.2) alakú egyenletek formájában minden egyes 
négyzetre. Minél nagyobb a környezet, annál nagyobb kezdeti tudásbázisra van szük- 
ség. Sokkal inkább azt szeretnénk, hogy csak két mondatunk lenne, amelyek kimond- 
ják, hogy hogyan is keletkezhet a szellő vagy a bűz bármely kockában. Ez mát túl van 
az ítéletkalkulus kifejezési képességén. A következő fejezetben látni fogunk egy na- 
gyobb kifejezőerővel rendelkező logikai nyelvet, amelyben egyszerű lesz ilyen monda- 
tot kijelenteni. 


A hely és az irány nyomkövetése 


A 7.19. ábra ágensprogramja , csal", mert a helyzetének nyomkövetését a tudásbázison 
kívül oldja meg, ahelyett hogy logikai következtetést végezne. Hogy , helyesen" old- 
juk meg a nyomkövetést, szükségünk lesz az elhelyezkedéssel kapcsolatos állításokra. 


13 A figyelmes olvasó észreveszi, hogy ez megengedte számunkra azt, hogy ügyeskedjünk a nyers érzet, 
mint a Szellő, és a helyspecifikus állítás, mint az 5). , közötti kapcsolattal. 
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Első hallásra hajlamosak lehetünk felvenni egy /f) , szimbólumot, ami azt reprezentál- 
ná, hogy az ágens az [1, 1]-ben van. Így a kezdeti tudásbázis ilyen mondatokat tartal- 
mazhatna: 


Hi A Arccaljobbra A Halad — Ha 


Azonnal láthatjuk, hogy ez nem fog működni. Ha az ágens kiindul az [1, 1]-ből arccal 
jobbra és halad abban az irányban, akkor a tudásbázisból következni fog a fj j (az ere- 
deti elhelyezkedés) és a /f? , (az új elhelyezkedés). Mégsem lehet azonban mindkét ál- 
lítás igaz! A probléma az, hogy az elhelyezkedés állításoknak két különböző időpontra 
kell vonatkozniuk. Szükségünk van egy HI fi szimbólumra, ami azt jelentené, hogy az 
ágens az [1, 1]-ben van az 1 időpontban, és egy Hz szimbólumra, ami azt, hogy az 
ágens a [2. 1]-ben van a 2 időpontban és így tovább. Az irány és az cselekvés állítások- 
nak szintén függeniük kel! az időtől. Így a helyes mondatok: 


HL A ArccalJobbra! A Halad" 2 HZ 
ArccalJobbra! A FordulBalra! 2 Arccal Felfelé? 


és így tovább. Az látható, hogy igen ügyesnek kell lennünk egy teljes és helyes tudás- 
bázis felépítéséhez, hogy mindent nyomon kövessünk a wumpus világban; ennek teljes 
tárgyalását elhalasztjuk a 10. fejezetig. A lényeg, amire itt rá akartunk mutatni, hogy a 
kezdeti tudásbázis tartalmazni fog olyan mondatokat. mint az előző két példa, minden 
t időpontra és minden helyre is. Ami azt jelenti, hogy minden t időpontra és [x,y] hely- 
re a tudásbázis tartalmaz egy következő formájú mondatot: 


H y A ArccalJobbra! A Haladt — Hete (7.3) 


Még akkor is, ha felső korlátot szabunk a megengedett lépések számának — 100-at 
talán — mondatok tízezreihez jutunk. Ugyanez a probléma merül fel, ha minden idő- 
lépéshez is hozzáadunk mondatokat, , ahogy szükséges". A klózoknak ez az elburján- 
zása olvashatatlanná teszi számunkra a tudásbázist, de a gyors ítéletkalkulus meg- 
oldók még így is könnyen tudják kezelni a 4 x 4-es wumpus világot (korlátaikat 
a 100 x 100-as méret körül érik el). Az áramkörre alapuló ágens, amit a következő 
alfejezet mutat be, részleges megoldást kínál a klózok elburjánzásának problémájára, 
de a teljes megoldásra várnunk kell, míg nem alkalmazzuk az elsőrendű logikát majd 
a 8. fejezetben. 


Az áramkörön alapuló ágens 


Az áramkörön alapuló ágens (circuit-based agent) a reflexív ágens egy állapottal 
rendelkező speciális fajtája, mint ahogy ezt a 2. fejezetben definiáltuk. Az érzetek egy 
sorrendi áramkör (seguential circuit) bemenetei, amely sorrendi áramkör egy kapuk- 
ból (gates) álló hálózatból, amelyek mindegyike egy logikai kapcsolatot valósít meg, 
és regiszterekből (registers) épül fel, amelyek mindegyike az egyes állítások igazság- 
értékeit tárolja. Az áramkör kimenetei olyan regiszterek, melyek cselekvéseknek felelnek 
meg — például a Megragad kimenet igaz-ra van állítva, ha az ágens meg akar ragadni 
valamit. Ha a Csillogás bemenetet közvetlenül összekötjük a Megragad kimenettel, ak- 
kor az ágens meg fogja ragadni a célt bármikor, ha látja (lásd 7.20. ábra). 
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Szettő [1] Halad 


Bűz BalraFordul 
JobbraFordul 
Ütközés Megragad 


a TOZO 
Sikoly [9] 


A 


7.20. ábra. Egy áramköralapú, wumpusvilág-beli ágens egy része, a bemeneteket és a kimeneteket mu- 
tatva, az arany megragadását megvalósító áramkör, és az áramkör, amely meghatározza, hogy a wumpus 
€l-e. A regisztereket négyzet jelöli, és a késleltetőket kis háromszögek mutatják. 














Csillogás 



























Az áramköröket az adatfolyamok (dataflow) mintájára értékeljük ki, minden időlé- 
pésben beállítjuk a bemenetet, és a jeleket végigterjesztjük a hálózaton. Ha egy kapu- 
nak minden bemenete rendelkezésre áll, létrehoz egy kimenetet. Ez a folyamat közeli 
kapcsolatban van az előrefelé láncolással és az ÉS-VAGY gráfokkal, mint amilyen a 
7.15. (b) ábrán látható. 

Az előző szakaszban azt állítottuk, hogy az áramkörön alapuló ágens az időt kielégi- 
tőbb módon kezeli, mint az ítéletkalkulus következtetés alapú ágens. Ez azért lehet így, 
mert egy regiszterben tárolt változó értéke adja meg a megfelelő ítéletkalkulus szimbó- 
lumnak az igazságértékét a pillanatnyi t időpontban, ahelyett hogy másolatok léteznének 
minden egyes időlépéshez. Például lehetne egy Élve regiszterünk, amelynek igaz értéket 
kelt tartalmaznia, ha a wumpus életben van, és hamis-at, ha halott. Ez a regiszter az Élve" 
ítéletkalkulus szimbólumnak felel meg, így minden egyes időpillanatban egy különböző 
ítéletállításra vonatkozik. Az ágens belső állapotai — például a memóriája — megőrizhe- 
tőek a regiszterek kimenetének egy késleltető soron (delay line) keresztül történő visz- 
szacsatolásával. Ez a regiszter az előző lépéshez tartozó értéket szolgáltatja. A 7.20. ábra 
egy példát mutat. Az Élve értékét a Sikoly negáltjának és az Élve késleltetett értékének 
a konjunkciója adja. Állításokban megfogalmazva ez a hálózat az Élve fogalomra meg- 
valósítja a következő ekvivalenciát: 


Élve" a -Sikoly" A Élve"! (14) 


amely mondat azt mondja ki, hogy a wumpous a £ időpontban akkor és csakis akkor él, 
ha nem észleltünk sikolyt a r időpillanatban (egy 1 — 1 időpontbeli sikoly alapján) és élt 
at—l időpillanatban. Feltételezzük, hogy az áramkörben az Élve regiszter igazra van 
inicializálva. Így az Éfve igaz marad mindaddig, amíg nincs egy sikoly, amikor is 
hamissá válik és a későbbiekben hamis marad. Ez pont az, amit mi akarunk. 

Az ágens helyzete nagyon hasonló módon kezelhető, mint a wumpus halála. Szüksé- 
günk van egy H,, , regiszterre minden x-hez és y-hoz, és ennek az értéke igaz kell, hogy 
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7.21. ábra. Egy áramkör, amely meghatározza, hogy az ágens az [1, 1]-ben van-e. Minden pozíció és 
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legyen. amikor az ágens az [x, y]-ban van. Az áramkör, amelyik beállítja /f, , értékét 
azonban sokkal bonyolultabb, mint az Élve áramköre. Például az ágens az [1, 1]-ben 
van a t időpontban, ha (a) az ott volt a t— 1-ben és vagy nem haladt semerre, vagy meg- 
próbálta, de falnak ütközött; vagy (b) az [1, 2]-ben volt arccal lefelé és haladt előrefe- 
lé; vagy (c) a [2, 1]-ben volt arccal balra és haladt előre: 


Hi 8 (HJA CHaladt! v Falnakütközik?)) (5) 
v (HT A (aArccalLefelé"! A Haladt-1) 
v.(HEI A (ArccalBalra""! A Haladt-h) 


A Hja hálózata a 7.21. ábrán látható. Minden elhelyezkedés regiszterhez egy hasonló 
áramkör tartozik. A 7.13. (b) feladatban azt kérjük, hogy készítsen áramkört az irányra 
vonatkozó állításokhoz. 

A 7.20. és 7.21. ábrákon levő áramkörök fenntartják az Élve és a H, yigazságértékét 
minden időpillanatban. Egy ilyen áramkör által reprezentált állítások szokatlanok azon- 
ban abban az értelemben, hogy a helyes igazságértékeiket minden pillanatban meg tud- 
juk határozni. Tekintsük az előző helyett az 54 4 állítást: a [4, 4) négyzet szellős. Habár 
az állításnak az igazságértéke rögzítve van valamilyen értéken, az ágens nem ismerhe- 
ti az igazságértéket mindaddig, amíg meg nem látogatja a [4, 4] mezőt (vagy ki nem 
következteti, hogy van egy szomszédos csapda). Az ítéletlogikát és az elsőrendű logi- 
kát igaz, hamis és ismeretlen értékű állítások automatikus reprezentálására tervezték, de 
az áramköröket nem: az 54 4 regiszternek tartalmaznia kell valamely értéket, vagy igaz 
vagy hamis értéket, még mielőtt az igazságot feltárják. A regiszterbeli érték lehet hely- 
telen, és ez helytelen irányba is vezetheti az ágenst. Más szavakkal, szükségünk volna 
háromféle lehetséges állapot reprezentálására (S4 4 ismerten igaz, ismerten hamis vagy 
nem ismert), és csak egy bítünk van arra, hogy megoldjuk ezt. 

A megoldás erre a problémára az, hogy használjunk két bitet egy helyett. AZ §4 4-et 
reprezentálja két regiszter, amelyeket K(S4 4)-nek és K(-54 4)-nek nevezünk, ahol K je- 
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löli azt, hogy ,ismert". (Emlékezzünk, hogy ezek még mindig csak összetett nevekkel 
rendelkező szimbólumok, még akkor is, ha strukturált kifejezésnek tűnnek!) Ha mind 
K(S4 4) és K(C-S4 4) hamis, akkor ez azt jelenti, hogy az S4 4 igazságértéke nem ismert. 
(Ha mindkettő igaz, akkor hiba van a tudásbázisban!) Ebben a reprezentációban bármi- 
kor is használnánk az 54 4-et a hálózat valamely részében, a K(54 a)-et használjuk helyet- 
te; és bármikor használnánk az —54 4-et, akkor a K(-54 4)-et használjuk. Általánosságban, 
minden potenciális határozatlan állítást két tudásállítással (knowledge propositions) 
reprezentálunk, kijelentve, hogy a vonatkozó ál! ismerten igaz vagy ismerten hamis. 

Hamarosan látni fogunk egy példát arra, hogyan kell alkalmaznunk a tudásállításo- 
kat. Először is, szükségünk van annak kidolgozására, hogy hogyan határozzuk meg 
maguknak a tudásállításoknak az igazságértékét. Vegyük észre, hogy miközben az 
54.4-nek rögzített igazságértéke volt. a K(S4 4) és K(-5S4 4) változik, miközben az ágens 
egyre többet tud meg a világról. Például a K(S4 4) hamis értékről indul, és igazzá vá- 
lik, amint az 54 4-től meghatározható, hogy igaz - azaz, amikor az ágens a [4, 4]-be 
lép, és detektálja a szellőt. Majd igaz marad ezután. Így megállapítható, hogy 


K(S4)! a KiSagtrv (Ha A Szellő) (7.6) 


Hasonló egyenlet írható fel K(-5S, a)"-re is. 

Most, hogy az ágensnek van már ismerete a szellős négyzetekről, foglalkozhat 
a csapdákkal is. Egy csapda hiánya az adott négyzetben akkor és csakis akkor határoz- 
ható meg, ha valamelyik szomszédos négyzetéről ismert, hogy nem szellős. Például ha 
létezik 


KC) e K(oSza)V KC-S43)" G.7) 


Egy csapda adott négyzetben való jelenlétének a meghatározása sokkal nehezebb — 
szellőnek kell lennie egy szomszédos négyzetben, de olyan szellőnek, amely nem egy 
másik csapda miatt keletkezett: 


K(Cg9" 8 (K(SzTA KC-C2 a)" A K(-C33)) (7.8) 
V. (K(S42)"A KIOC4DT A K(-C33)?) 


Miközben egy kicsit zavaros a csapdák jelenlétének és hiányának bizonyítása az áram- 
körök használata esetében, az áramkör konstans számú kaput használ minden egyes 
négyzethez. Ez a tulajdonság alapvetően fontos ahhoz, hogy olyan áramkörön alapuló 
ágenst építsünk, amelynek bonyolultsága kezelhető módon nő a probléma méretével. 
Ez valójában magának a wumpous világnak a jellemzője; azt mondjuk, hogy egy környe- 
zet lokalitás (locality) tulajdonságot mutat fel, ha igaz, hogy bármelyik vizsgálandó 
állítás igazságának meghatározásához csak egy konstans számú másik állítás megvizs- 
gálása szükséges. A lokalitás tulajdonság nagyon érzékeny a környezet pontos , fiziká- 
jára". Például az aknakereső tárgyterület (7.11. feladat) nemlokális, mert az akna egy 
adott négyzetbeli létezésének eldöntése igényelheti, hogy akármilyen távol levő négy- 
zetet is megnézzünk. Nemlokális tárgyterületekre az áramkörre alapuló ágens alkalma- 
zás nem mindig praktikus. 

Van egy másik probléma is, amely mellett eddig óvatosan elmentünk: a hurokmen- 
tesség (acyclicity) kérdése. Az áramkört hurokmentesnek tekintjük. ha minden olyan 
ág, amely egy regiszter kimenetét visszacsatolja a bemenetére, tartalmaz legalább egy 
közbülső késleltető elemet. Megköveteljük, hogy minden áramkör hurokmentes legyen, 
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mivel a hurkokat tartalmazó áramkörök, mint fizikai eszközök, nem működnek! 
Az ilyen áramkör instabil oszcillációba kerülhet határozatlan értékeket eredményezve. 
Példaként a hurkot tartalmazó áramkörökre, tekintsük a (7.6) egyenletnek a következő 
kibővítését: 

KS" e KS V (Haag! A Szellő!) V.K(Csg" V K(Caa)" G9) 


A hozzáadott diszjunktok, a K(C3 4)" és a K(C4 3)" lehetővé teszik az ágens számára, 
hogy a szellő jelenlétét meghatározza a szomszédos négyzetekben levő csapdák je- 
lenlétéből, ami teljesen ésszerűnek tűnik. Így viszont sajnos a szellő tulajdonság függ 
a szomszédos csapdáktól, és a csapdák függenek a szomszédos négyzetek szellő 
tulajdonságától, ahogy azt a (7.8) egyenlet leírja. Ezáltal a teljes áramkör tartalmaz- 
na hurkot. 

A nehézség nem az, hogy a (7.9) egyenlet nem helyes. A probléma inkább az, 
hogy az egyenletek által reprezentált függőségek összekapcsolása nem oldható fel az 
igazságértékek propagálásának egyszerű mechanizmusával a vizsgált logikai áram- 
körökben. A (7.6) egyenletet alkalmazó hurokmentes verzió, amely a szellősséget a 
közvetlen megfigyelésekből határozza meg, nem teljes abban az értelemben, hogy 
bizonyos pontokon az áramköralapú ágens kevesebbet tud, mint a teljes következte- 
tési eljárást alkalmazó következtetésalapú ágens. Például ha van szellő az [1, 1]- 
ben, a következtetésalapú ágens képes arra a megállapításra jutni, hogy van egy szel- 
lő a [2, 2]-ben, míg a (7.6) egyenletet használó, hurokmentes áramkörre alapuló 
ágens erre nem képes. Lehetséges építeni egy teljes áramkört — végül is, szekvenciá- 
lis áramkörök képesek emulálni bármilyen digitális számítógépet -, de ez jelentősen 
bonyolultabb volna. 





Összehasonlítás 


A következtetésalapú és az áramkörön alapuló ágensek a deklaratív és procedurális 
megközelítés szélsőséges esetei az ágens tervezésében. Számos szempont szerint össze- 
hasonlíthatjuk őket: 


s Tömörség. Az áramkörön alapuló ágensnek, ellentétben a következtetésalapú ágens- 
sel, nincs szüksége a , tudásának" önálló másolataira minden időlépésben. Ehelyett, 
mindig csak a pillanatnyi és a megelőző időlépésre hivatkozik. A , fizika" leírásához 
mindkét ágensnek szüksége van minden egyes négyzetre vonatkozó másolatokra 
(mondatok vagy áramkörök formájában), és így nem könnyű nagyobb környezete- 
ket leírni. Azokban a környezetekben, ahol számos objektum összetett kapcsolatait 
kell leírni, a kijelentések száma eláraszt bármilyen ítéletkalkulus ágenst. Ezek a kör- 
nyezetek már igénylik az elsőrendű logika kifejezőerejét (lásd 8. fejezet). Mindkét 
típusú ítéletkalkulus ágens rosszul alkalmazható egy biztonságos négyzettel szom- 
szédos helyre vezető útvonal megtalálásának kifejezésére vagy megoldására. (Emiatt 
az IK-WUMPUS-ÁGENS keresési algoritmusokat alkalmaz.) 

s Számítási hatékonyság. A legrosszabb esetben a következtetés időigénye exponenciá- 
lisan függ a szimbólumok számától, míg az áramkör futtatása az áramkör méretétől 
lineárisan függő időt igényel (vagy a mélységtől lineárisan függő időt, ha fizikai esz- 
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közként megvalósítjuk). Láthattuk azonban, hogy a gyakorlatban a DPLL igen gyorsan 
elvégezte a szükséges következtetéseket. 

. Teljesség. Azt sugalituk korábban, hogy az áramköralapú ágens lehet, hogy nem tel- 
jes a ciklusmentességgel kapcsolatos kortátozás miatt. A teljesség hiányának okai 
azonban még alapvetőbbek. Először is, emlékezzünk, hogy az áramkör a méretével 
lineárisan arányos időben oldja meg a feladatot. Ez azt jelenti, hogy bizonyos környe- 
zetek esetében egy teljes áramkörnek (egy olyannak, amely minden meghatározható 
állításhoz kiszámítja az igazságértéket) exponenciálisan nagyobbnak kell lennie, mint 
a következtetésalapú ágens tudásbázisának. Egyébként lenne módszerünk arra, hogy 
hogyan oldjuk meg az ítéletkalkulus vonzat problémáját kisebb mint exponenciális 
idő alatt, ami nagyon valószínűtlen. A második érv az ágens belső állapotainak a jel- 
lege. A következtetésalapú ágens emlékezik minden érzetre, és implicit vagy expli- 
cit módon ismer minden mondatot, ami az érzetekből és a kezdeti adatbázisból 
következik. Például ha adott 5j., és ismeri a Cj.2 V C2,y állítást, abból 2.2 követ- 
kezik. Ezzel szemben az áramköralapú ágens elfelejt minden korábbi érzetet és csak 
a regiszterekben tárolt egyedi állításokra emlékszik. Ekképpen az első érzet után a 
€C1,2 vagy a C2 a önmagában ismeretlen marad, és így semmilyen következtetés nem 
vonható le 52 2-re vonatkozóan. 

", A létrehozás egyszerűsége. Ez egy nagyon fontos kérdés, amelyet nehéz pontosan 
megítélni. A könyv szerzője számára a , fizika" leírása bizonyára sokkal egyszerűbb 
deklaratív úton, miközben kisméretű, hurokmentes, majdnem teljes áramkörök terve- 
zése a csapdák megtalálására igen nehéznek bizonyult. 





Összefoglalva, úgy tűnik, hogy létezik kompromisszum a számítási hatékonyság, 
a tömörség, a teljesség és a könnyű létrehozás között. Ha az érzetek és a cselekvések 
közötti kapcsolat egyszerű — mint a Ragyogás vagy a Megragad közötti kapcsolat 
esetében - az áramkör optimálisnak tűnik. Ennél bonyotultabb kapcsolatok esetében 
a deklaratív megközelítés jobb lehet. Egy olyan területen, mint a sakk például, a dek- 
laratív szabályok tömörek és könnyen kódolhatók (legalábbis az elsőrendű logikában), 
de a tábla állapotaiból a lépéseket közvetlenül számító hálózat elképzelhetetlenül 
hatalmas lenne. 

Eltérő dolgokat látunk ezekkel a megközelítésekkel kapcsolatban az állatok világában. 
Az egyszerű idegrendszerrel rendelkező kisebb állatok valószínűleg hálózatalapúak, míg 
a magasabb rendű állatok úgy tűnik, hogy explicit reprezentációkon következtetéseket 
végeznek. Ez lényegesen bonyolultabb ágensfunkciók számítását teszi lehetővé számuk- 
ra. Az emberek szintén rendelkeznek áramkörökkel, amelyek a reflexeket valósítják 
meg, és talán képesek lefordítani (compile) deklaratív ismereteket áramkörökké, ami- 
kor bizonyos következtetések rutinná válnak. Ily módon egy hibrid ágens (hybrid 
agent) tervezése (lásd 2. fejezet) lehet a legjobb mindkét világ számára. 


14 valójában minden olyan következtetés. amely megvalósítható egy áramkörrel, megoldható Imeáris időben 
a DPLL-lei, Ez azért van így, mert egy áramkör kiértékelése hasonlít az előrefelé láncoláshoz, amely emulálható 
DPLL-lel az egység propagáció szabály alkalmazásával, 
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Bevezettük a tudásbázisú ágens ötletét, és megmutattuk, hogy hogyan tudunk olyan logi- 
kát definiálni, amellyel az ágens képes következtetni a világról. A legfontosabb pontok 
a következők: 


s  Azintelligens ágensnek szüksége van tudásra a világról, hogy jó döntéseket hozhasson. 

s A tudást az ágens egy tudásbázisban (knowledge base) egy tudásreprezentációs 
nyelv (knowledge represantion language) mondatainak (sentences) formájában 
tárolja. 

s Egy tudásbázisú ágenst a tudásbázis és a következtetési mechanizmus alkotja. Mű- 
ködésének lényege, hogy a tudásbázisában a világot leíró mondatokat tárol és követ- 
keztetési mechanizmust alkalmaz új mondatok következtetésére, majd felhasználja 
ezeket cselekvések meghatározására. 

s Egy reprezentációs nyelvet szintaxisa (syntax) és szemantikája (semantics) definiál. 
A szintaxis a mondatok struktúráját határozza meg, a szemantika a mondatok igazságát 
(truth) határozza meg minden lehetséges világban (world) vagy modellben (model), 

§ A mondatok közötti vonzat (entailment) kapcsolatnak alapvetően fontos szerepe 
van a következtetés megértésében. Egy a mondat maga után vonz egy másik ő mon- 
datot, ha 8 igaz minden világban, ahol a igaz. Ezzel ekvivalens definíciók az 
a 5 A mondat érvényességét (validity) és a a A -$ mondat kielégíthetetlenségét 
(unsatisfiability) meghatározó definíciók. 

s A következtetés az a folyamat, amivel új mondatok vezethetők le régiekből. A helyes 
(sound) következtetési algoritmusok csak vonzat mondatokat vezetnek le; a teljes 
(complete) algoritmus az összes következményt levezeti. 

s" Az ítéletkalkulus (propositional logic) egy nagyon egyszerű nyelv, amely ítélet- 
szimbólumokból (proposition symbols) és logikai összekötőjelekből (logical 
connectives) áll. Képes kezelni olyan állításokat, amelyekről tudjuk, hogy igazak, 
tudjuk, hogy hamisak, vagy teljesen ismeretlen az igazságértékük. 

s Ha adott egy ítéletkalkulus szimbólumszótár, akkor a lehetséges modellek száma 
véges, így a vonzatok ellenőrzése történhet a modellek felsorolásával is. Hatékony 
ítéletkalkulus modeMlellenőrző (model checking) algoritmusok többek között visz- 
szalépéses vagy lokális keresési eljárásokat alkalmaznak, amelyekkel gyakran nagy- 
méretű problémákat is nagyon gyorsan meg tudnak oldani. 

s A következtetési szabályok (inference rules) helyes következtetési minták, ame- 
lyeket felhasználhatunk bizonyítások megtalálásához. A rezolúció (resolution) 
szabály teljes következtetési algoritmust biztosít olyan tudásbázisokhoz, amelyek 
konjunktív normál formában (conjunctive normal form) vannak kifejezve. 
Az előrefelé láncolás (forward chaining) és a hátrafelé láncolás (backward 
chaining) igen természetes érvelési algoritmusok Horn-formában (Horn form) 
adott tudásbázisokon. 

s Kétfajta ágenst lehet építeni az ítéletkalkulus alkalmazására: a következtetésalapú 
ágens (inference-based agent) következtetési algoritmusokat használ a világ ese- 
ményeinek követésére, és képes rejtett jellemzőket is levezetni. míg az áramkörön 
alapuló ágens (circuit-based agent) az állításokat regiszterek bítjeiként reprezen- 
tálja, és jelek logikai áramkörökben történő terjesztésével végzi ezek frissítését. 
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. Az ítéletkalkulus meglehetősen hatékony bizonyos feladatokra egy ágensben 
alkalmazva, de kezelhetetlen nemkorlátos méretű környezetekben, mivel hiányzik 
a megfelelő kifejező erő az idő, a tér és az objektumok közötti kapcsolatok általá- 
nos mintáinak leírására. 


Irodalmi és történeti megjegyzések 


John McCarthy cikke a , Programs with Common Sense" (McCarthy, 1958, 1968) tette 
híressé az ágens fogalmát, egy olyan programét, amely az érzetek és cselekvések össze- 
kapcsolására logikai következtetést használ. A cikk kitűzte a deklarativizmus zászlóját, 
megmutatva, hogy szoftverek írásának igen elegáns módszere az, ha a szükséges isme- 
reteket közöljük az ágenssel. Allen Newell cikke (1982) a , The Knowledge Level" 
tárgyalja azt a megközelítést, hogy racionális ágensek leírhatók és elemezhetők egy 
absztrakt szinten, ami az általuk birtokolt tudást és nem azt a programot definiálja, amit 
futtatnak. A mesterséges intelligencia deklaratív és procedurális megközelítéseit hason- 
lítja össze Boden (Boden, 1977). A vitát, mások mellett Brooks (Brooks. 1991) és 
Nilsson (Nilsson, 1991) írásai élesztették fel újra. 

Magának a logikának az eredete az ősi görög filozófiában és matematikában található. 
Számos logikai alapelv — a mondatok szintaktikus struktúrájának összekötése az igaz 
vagy hamis jellegükkel, a jelentésükkel, a bennük megjelenő argumentumok érvényessé- 
gével — elszórt helyeken megtalálható Platón műveiben. Arisztotelész készítette az első 
ismert, rendszerezett munkát a logikáról. Munkáját diákjai gyűjtötték össze halála után, 
i. e. 322-ben az Organon c. tanulmányban. Arisztotelész szillogizmusai (syllogisms) 
olyan logikai állítások voltak, amelyeket ma következtetési szabályoknak neveznénk. 
Habár a szillogizmus tartalmazott elemeket, mind a propozíciós, mind az elsőrendű 10- 
gikából, a rendszer, mint egész, igen gyengének számít a modern kívánalmak szerint. 
Nem tette lehetővé tetszőleges komplexitású mondatok létrehozását a következtetési 
mintákban, mint a modern ítéletlogika. 

A hasonló Megara és sztoikus iskolák (az i. e. 5. században indultak, és több száz 
éven keresztül működtek) vezették be az implikációt és más alapvető szerkezeteket, 
amelyeket ma is használunk a modern ítéletlogikában. Logikai összekötőjelek definiálá- 
sára vezette be az igazságtábla használatát Philón és Megara. A sztoikusok öt alapvető 
következtetési szabályt használtak, amelyeket igazolás nélkül érvényesnek tartottak, 
köztük azt a szabályt, amelyet ma Modus Ponensnek nevezzünk. Számos szabályt 
vezettek le ebből az ötből, felhasználva többek között a dedukció elméletének alapelvét 
(267. oldal), és sokkal tisztábban használták a bizonyítás fogalmát, mint azt ÁriSZtote- 
lész tette. A sztoikusok azt állították, hogy az ő logikájuk teljes abban az értelemben, 
hogy tartalmaz minden érvényes következtetést. de ami fennmaradt munkájukból, az 
túlságosan töredékes ahhoz, hogy elemezhető legyen. A Megara és a sztoikus logikák 
történetének, már amennyire ezek ismertek, jó beszámolóját készítette el Benson Mates 
(Mates, 1953). 

Wilhelm Leibniztől (1646-1716) származik a mesterséges formális nyelvi minták 
létrehozásának ötlete a logikai kapcsolatok tisztázásának és a logikai következtetés egy 
tisztán formális és mechanikus folyamattá való egyszerűsítése céljából. Leibniz saját 
matematikai logikája azonban igencsak tökéletlen volt, és rá inkább ezeknek a gondo- 
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latoknak mint célkitűzéseknek a bevezetéséért és nem e célok megvalósítására tett kí- 
sérletei miatt emlékezünk. 

George Boole vezette be első igazán átfogó és működőképes formális logikai alapú 
rendszert a The Mathematical Analysis of Logic c. könyvében (Boole, 1847). Boole lo- 
gikájának modellje közel állt a valós számok algebrájáéhoz, és elsődleges következte- 
tési módszerként a logikailag ekvivalens mondatok helyettesítését használta. Bár Boole 
rendszere csak töredéke volt a teljes ítéletkalkulusnak, elég közel volt ahhoz, hogy a 19. 
század szerzői Boole-t követve hamar kítöltsék a hiányzó részeket. Schröder definiálta 
(Schröder, 1877) a konjunktív normál formát, míg a Horn-formát sokkal később Alfred 
Hor (Hom. 1951) vezette be. A modern ítéletkalkulus (és elsőrendű logika) első átfogó 
bemutatása Gottlob Frege Begriffschrift (Az írás fogalma vagy Fogalmi jelölés) c. 
könyvében (Frege, 1879) található. 

Az első mechanikai eszközt, amely logikai következtetést végzett, Stanhope harmadik 
grófja (1753-1816) készítette. A Stanhope Demonstrator képes volt szillogizmusokat 
kezelni és bizonyos valószínűségi következtetéseket végezni. Wiliam Stanley Jevons — 
egyike azoknak, akik továbbfejlesztették és kiegészítették Boole munkáját — 1869-ben a 
Boole-logikán alapuló következtetések végrehajtására megépítette a , logical pianó"-ját. 
Ezeknek és más korai következtetésre készített mechanikus eszközöknek szórakoztató 
és tanulságos története Martin Gardner (Gardner, 1968) munkájában olvasható. Az első 
logikai következtetést végző, publikált számítógépes program a , Logic Theorist" volt, 
amelyet Newell, Shaw és Simon (Newell, Shaw és Simon, 1957) készítettek. Ezt a prog- 
ramot az emberi gondolkodás modellezésére szánták a szerzők. Bár Martin Davis (Davis, 
1957) tervezett egy programot, ami bizonyíthatóan 1954-ben készült, de a Logic Theorist 
eredményeit korábban publikálták. Mind Davis 1954-es programja, mind a Logic Theorist 
részben ad hoc módszerekre épült. amelyek nem voltak jelentős hatással a későbbi auto- 
matikus dedukciós rendszerekre. 

Az igazságtábláknak, mint az ítéletkalkulus nyelvében az érvényességnek vagy a 
mondat kielégíthetetlenségének a tesztjét egymástól függetlenül Ludwig Wittgenstein 
(1922) és Emil Post (1921) vezették be. A harmincas években jelentős haladást értek el 
az elsőrendű logika következtetési módszereinek terén. Nevezetesen, Gödel megmutat- 
ta (Gödel, 1930), hogy az elsőrendű logikában történő következtetésre egy teljes eljá- 
rást lehet kapni az ítéletlogikára történő redukcióval, felhasználva Herbrand elméletét 
(Herbrand, 1930). A 9. fejezetben újra áttekintjük ennek történetét, itt most a lényeges 
Pont az, hogy a hatvanas években, a hatékony ítéletkalkulus algoritmusok fejlesztésében 
a matematikusok érdeklődését jelentős mértékben motiválta az a cél, hogy hatékony 
tételbizonyítót készítsenek az elsőrendű logika számára. A Davis-Putnam-algoritmus 
(Davis és Putnam, 1960) volt az első hatásos algoritmus az ítéletkalkulus rezolúció 
megvalósítására, de a legtöbb esetben ez is sokkal kevésbé hatékony, mint a DPLL 
visszalépéses algoritmus, amelyet két évvel később mutattak be (1962). A teljes rezo- 
lúciós szabály és a rezolúció teljességének bizonyítása J. A. Robinson (Robinson, 1965) 
nagyhatású tanulmányában jelent meg, ami azt is megmutatta, hogyan lehet elsőrendű 
logikai következtetést végezni ítéletkalkulus technikák igénybevétele nélkül. 

Stephen Cook (Cook, 1971) mutatta meg, hogy a kielégíthetőség eldöntése az ítélet- 
logikában NP-teljes. Mivel a vonzat meghatározása ekvivalens a kielégíthetetlenség eldön- 
tésével, ez ís NP-teljes. Az ítéletlogika számos részhalmaza ismert, amelyről tudnuk, hogy 
bennük a kielégíthetőség problémája polinomiális időben megoldható. A Horn-klózok az 
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egyik ilyen rézhalmaz. A Horn-klózokon működő, lineáris időben futó előreláncolási 
algoritmust Dowlingnak és Galliernek (Dowling és Gallier, 1984) köszönhetjük, akik 
az algoritmusokat egy adatfolyam-eljárásként írták le, hasonlóan a jelek terjedéséhez az 
áramkörökben. A kielégíthetőség ellenőrzése alapvető módszerré vált a problémák NP- 
teljességének vizsgálatában; például Kaye (Kaye, 2000), megmutatta, hogy az Aknake- 
reső játék (lásd 7.11. feladat) NP-teljes. 

Számos szerző próbálkozott lokális keresési algoritmusokat használni a kielégíthetőség 
eldöntésére a nyolcvanas években. Minden ilyen algoritmus a kielégíthetetlen klózok 
számának minimalizálásának elvén (Hansen és Jaumard, 1990) alapult. Különlegesen 
hatékony algoritmust fejlesztett ki Gu (Gu, 1989), és tőle függetlenül Selman és társai 
(Selman és társai, 1992), amelyet ez utóbbi szerzők GSAT-nak neveztek el, és megmu- 
tatták, hogy az algoritmus képes nehéz problémák széles körét igen gyorsan megolda- 
ni. A WALKSAT algoritmust, amelyet ebben a fejezetben bemutattunk, szintén Selma 
és társai publikálták (1996). 

A , fázisátmenet" létezését a véletlen k-SAT problémák kielégíthetőségében először 
Simon és Dubois (Simon és Dubois, 1989) figyelték meg. Crawford és Auton tapasztala- 
ti eredményei (Crawford és Auton, 1993) azt sejtették, hogy nagyméretű, véletlenszerű 
3-SAT problémák esetén ez az átmenet a 4,24-es klóz/változó arány környékén van. 
Cikkük szintén bemutat egy hatékony DPLL megvalósítást. Bayardo és Schrag leírt egy 
másik, kényszer-kielégítési technikákat alkalmazó hatékony DPLL megvalósítást (Ba- 
yardo és Schrag, 1997). Moskewicz és társai publikálták a CHAFF algoritmust (Moske- 
wicz és társai, 2001), amely millió változós hardververifikációs problémákat képes 
megoldani, és amely megnyerte a SAT 2002 versenyt. Li és Anbulagan gyors probléma- 
megoldókat lehetővé tevő egységpropagáción alapuló heurisztikákat tárgyalt (Li és 
Anbulagan, 1997). Checseman és társai (1991) számos hasonló problémáról adtak ada- 
tokat, és megfogalmazták azt a feltevést, hogy minden NP-teljes problémának van álla- 
potátmenete (Cheeseman és társai, 1991). Kirkpatrick és Selman módszereket mutattak 
arra (Kirkpatrick és Selman, 1994), hogy a statisztikus fizika technikáit hogyan lehet 
alkalmazni a fázisátmenetek pontos , alakjának" jobb megértéséhez. Az átmenetek helyé- 
nek meghatározására vonatkozó elméleti vizsgálatok igen gyengék: az egyetlen, amit 
sikerült bizonyítani, hogy az átmenet a [3.003 4,598] tartományba esik a véletlen 
3-SAT problémáknál. Cook és Mitchell kiváló áttekintést készítettek ezekről és számos 
más kielégíthetőséggel kapcsolatos téma eredményeiről (Cook és Mitchell, 1997). 

Korai elméleti kutatások megmutatták, hogy a DPLL átlagos komplexitása polino- 
miális a problémák egy bizonyos természetes eloszlású köreire. Ez a potenciálisan érde- 
kes tény kevésbé izgalmassá vált, miután Franco és Paull megmutatták, hogy ugyan- 
ezek a problémák konstans időben megoldhatók egyszerűen találgatással, ahol véletlen 
hozzárendelésekkel dolgozunk (Franco és Paull, 1983). A véletlen generáló módszer, 
amelyet a fejezetben bemutattunk, sokkal nehezebb problémákat hoz létre. Az ilyen, a 
problémákon lokális kereséssel elért tapasztalati sikerek által motiválva, Koutsoupias 
és Papadimitriou megmutatta, hogy egy egyszerű hegymászó algoritmussal nagyon 
gyorsan megoldható szinte minden kielégíthetőségi probléma péktány (Koutsoupias és 
Papadimitriou, 1992), ami azt sugallja, hogy a nehéz problémák ritkák. Mi több, 
Schöning bejelentett (Schönig, 1999) egy véletlen elemeket tartalmazó GSAT válto- 
zatot, amelynek a legrosszabb esetre számított várható futási ideje 3-SAT problémá- 
kon 1,333" — ami még mindig exponenciális, de lényegesen gyorsabb, mint a korábbi 
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legrosszabb esetkorlátok. A kielégíthetőségi algoritmusok ma is igen aktív területét 
képezik a kutatásoknak; Du és társai cikkgyűjteménye (Du és társai, 1999) jó kiindu- 
lási pontot jelent. 

Az áramköralapú ágensek gondolata visszavezethető McCulloch és Pitts nagyhatású 
cikkére (McCulloch és Pitts, 1943), amely a neurális hálózatok témakör kezdetét jelen- 
tette. Népszerű vélekedésekkel szemben a cikk valójában logikai áramköralapú ágens- 
terveknek az agyban történő megvalósításával foglalkozott. Azonban az áramköralapú 
ágens kis figyelmet kapott a mesterséges intelligenciában. A leginkább megjegyzendő 
kivétel Stan Rosenschein munkája (Rosenschein, 1985; Kaelbling és Rosenschein, 
1990), aki módszert dolgozott ki áramköralapú ágensek lefordítására a feladat környe- 
zetének deklaratív leírására. A regiszterekben tárolt állítások frissítésének módszere kö- 
zeli kapcsolatban van a Reiter általi az elsőrendű logikára kifejlesztett követő állapot 
axiómához (successor-state axiom) (Reiter, 1991). Rod Brooks munkája (1986, 1989) 
demonstrálta az áramköralapú megvalósítások hatékonyságát robotok vezérlésére — a 
25. fejezetben foglalkozunk ezzel a témával. Brooks amellett érvelt (Brooks, 1991), 
hogy az áramköralapú ágensen kívül más nem is szükséges a mesterséges intelligen- 
ciához — mivel más módszerek nehézkesek, drágák és szükségtelenek. A mi nézetünk 
szerint, egyik módszer sem elégséges önmagában. 

A wumpus világot Gregory Yob (Yob, 1975) találta ki. Némi iróniával, Yob azért 
fejlesztette ki, mert unta azokat a játékokat, amelyeket egy rácson játszanak: az eredeti 
wumpus világ dodekaéder alakú volt, mi helyeztük vissza a régi unalmas négyzetrácsba. 
Michael Genesereth javasolta először, hogy a wumpus világot az ágensek tesztkörnye- 
zeteként alkalmazzuk. 


Feladatok 


7.A.  Írjale a wumpus világot a 2. fejezetben felsorolt feladatkörnyezetek tulajdonsá- 
gainak felhasználásával. 


7.2. Tegyük fel, hogy az ágens eljutott a 7.4. (a) ábra szerinti állapotba, úgy, hogy 
nem érzett semmit az [1, 1]-ben, szellőt érzett az [2, 11-ben és bűzt az [1, 2]-ben, 
és most vizsgálja az [1, 3], [2. 2] és (3. II négyzetek tartalmát. Ezek bármelyike 
tartalmazhat csapdát, és legfeljebb az egyik tartalmazhatja a wumpust. A 7.5. 
ábra példáját követve hozza létre a lehetséges világokat (32 ilyet keli találnia). 
Jelölje meg azokat a világokat, amelyekben a 7B igaz, és azokat, amelyekben 
a következő mondatok igazak: 

az — , Nincsen csapda a [2, 2]-ben" 
az — , Az [1.31-ban wumpus van" 
Mutassa meg ezenkívül, hogy 7BF az és TBE az. 


7.3. — Tekintsük azt a problémát, hogy hogyan dönthető el egy ítéletkalkulus mondat 
igazsága egy adott modellben. 

(a) Írjon egy IK-IGAZX(s, m) rekurzív programot, amely akkor és csakis akkor 

ad vissza igazat, ha az s mondat igaz az m modellben (ahol m minden 
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74. 


7.5. 


7.6. 


7.7. 


7.8. 


(b) 


(2 
(da) 


(e) 
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s szimbólumhoz egy igazságértéket rendel). Az algoritmusnak a mondat 
méretével lineárisan változó időben kell futnia. (Használhatja ennek a függ- 
vénynek egy változatát az online kódtárból.) 

Adjon három példát olyan mondatokra, amelyekről meghatározható, hogy 
igazak vagy hamisak egy részleges modellben, amely nem specifikálja 
minden szimbólum igazságértékét. 

Mutassa meg, hogy egy részleges modellben egy mondat igazságértéke 
(ha van ilyen) általánosságban nem határozható meg hatékonyan. 
Módosítsa az IK-IGAZ? algoritmust úgy, hogy néha részleges modell alap- 
ján is meg tudjon határozni igazságértékeket és közben tartsa meg a függ- 
vény igazságértékét és lineáris futási idejét. Adjon meg három példát olyan 
mondatokra, amelyek igazságértékét a részleges modellben nem állapítja 
meg az algoritmus. 

Vizsgálja meg, hogy a módosított algoritmus hatékonyabbá teszi-e az IT- 
VONZAT? eljárást. 


Bizonyítsa be a következő állításokat: 


(a) 
b 
(c) 
(d) 
(e) 


a akkor és csakis akkor érvényes, ha Igaz Fa. 

Bármilyen a-ra HamisF a. 

a HF B akkor és csakis akkor, ha az (a — 6) mondat érvényes. 

a zs 8 akkor és csakis akkor, ha az (a 6 ő) mondat érvényes. 

a k B akkor és csakis akkor, ha az (a A -) mondat kielégíthetetlen. 


"Vegyünk egy szótárat, amelyben csak négy ítéletkalkulus állítás létezik, az A, B, 
C és D. Hány modellje létezik a következő mondatoknak? 


(a) 
(b 
(c) 


(AABYV(BAC) 
AVB 
ASBSC 


Definiáltunk 4 bináris logikai összekötőjelet. 


(a) 
(b) 
(0) 


Léteznek-e még továbbiak, amelyek hasznosak lehetnek? 
Hány bináris összekötőjel lehetséges? 
Miért nem túlságosan hasznos közülük néhány? 


Egy szabadon választott módszer felhasználásával igazolja a 7.11. ábra ekviva- 
lenciáit. 


Vizsgálja meg a következő mondatokat, és döntse el mindegyikre, hogy érvé- 
nyesek. kielégíthetetlenek, vagy egyik sem. Igazolja a döntését igazságtáblával, 
vagy felhasználva a 7.11. ábra ekvivalencia szabályait. Van-e olyan. amit elsőre 


eltévesztett? 

(a) Füst s Füst 

(b) Füst Tűz 

(c) (Füst 5 Tűz) o (oFüst 5 Tűz) 


4 
(e) 


Füst V Tűz V -Tűz 
((Füst A Hőség) — Tűz) e (Füst 5 Tűz) V (Hőség 5 Tűz) 
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7.9. 


7.10. 


7.11. 


7.12. 


(£) (Füst G Tűz) 5 ((Füst A Hőség) — Tűz) 
(g) Nagy V Hallgatag V (Nagy - Hallgatag) 
(h) (Wagy A Hallgatag) v Hallgatag 


(Barwise és Etchemendy, 1993 alapján) Be tudja-e bizonyítani, hogy az unikornis 

mitikus, ha adottak az alábbiak? Mit mondhatunk a mágikusságról? Van-e szarva? 
Ha az unikornis mitikus, akkor halhatatlan, de ha nem halhatatlan, akkor 
egy halandó emlős. Ha az unikornis vagy halhatatlan, vagy emlős, akkor 
van szarva. Az unikornis mágikus állat, ha van szarva. 


Minden logikai mondat logikailag ekvivalens azzal az állítással, hogy minden 
lehetséges világ, amelyben hamis volna, nem az eset. Felhasználva ezt a megfi- 
gyelést, bizonyítsa be, hogy minden mondat átírható konjugált normált formára. 


Az ismert számítógépes játék, az Aknakereső igen hasonló a wumpus világhoz. 

Az aknakereső világ egy N négyzetet tartalmazó négyzetes rács, amelyek közül 

M elszórtan elhelyezkedő négyzet láthatatlan aknát takar. Minden négyzetet 

megpróbálhat az ágens, de azonnali halállal lakol, ha ott egy aknát talál. Az Ak- 

nakereső játék minden kipróbált négyzetben felfedi, hogy hány közvetlenül 
vagy átlósan szomszédos négyzetben van akna, ezzel mutatva az aknák jelenté- 
tét. A cél az, hogy minden aknát nem tartalmazó négyzetet megpróbáljunk. 

(a) Legyen X; igaz akkor és csakis akkor, ha az [i, j] tartalmaz egy aknát. Írja 
le az X; szimbólum logikai kombinációját tartalmazó mondattal azt a kije- 
lentést, hogy pontosan két akna szomszédos az (1, 1]-gyel. 

(b) Általánosítsa az (a)-beli kijelentést megmutatva, hogy hogyan hozható lét- 
re konjugált normál formájú mondat annak kifejezésére, hogy az n SZom- 
szédos négyzetből k négyzet tartalmaz aknát. 

(c) Magyarázza meg pontosan, hogy hogyan használhat egy ágens DPLL algo- 
ritmust annak bizonyítására, hogy egy adott négyzet tartalmaz (vagy nem 
tartalmaz) aknát, figyelmen kívül hagyva azt a globális korlátot, hogy pon- 
tosan M akna van összesen. 

(d) Tegyük fel, hogy a globális korlát a (b) feladatrészben megfogalmazott 
módon van létrehozva. Hogyan függ a klózok száma M-től és N-től? Java- 
soljon egy módosítást a DPLL algoritmushoz, amellyel a globális korlátot 
nem kell explicit módon reprezentálni. 

(e) Van-e olyan a (c) feladatrészben definiált eljárás által előállított következ- 
mény, amely érvénytelenné válna, ha figyelembe vennénk a globális kény- 
szert? 

(f) Mutasson példát olyan lehetséges konfigurációkra, amelyek távoli függő- 
ségeket idéznek elő, olyanokat, ahol egy ki nem próbált négyzet tartalma 
távoli négyzetek tartalmáról ad információt. (Segítség: vizsgáljon meg egy 
N x 1-es táblát] 


Ez a feladat a klózok és az implikációs mondatok közötti kapcsolatot vizsgálja. 
(a) Mutassa meg, hogy a (-Pj V...V —P,, V 0) klóz logikailag ekvivalens 
a (Pp A...A Pn 2 0) implikációs mondattal. 
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7.13. 


7.14. 


7.15. 


7.16. 


7.17. 


7. LOGIKAI ÁGENSEK 


(b) Mutassa meg, minden klóz (függetlenül a pozitív literálok számától) fet- 
írható (Pj A ... A B) — (A1 V...V 0.) alakban, ahol P-k és 0-k ítéletkal- 
kulus szimbólumok. Az ilyen mondatokat tartalmazó tudásbázist implikatív 
normál formájúnak (implicative normal form) vagy Kowalski formájú- 
nak (Kowalski form) nevezzük. 

(0) Írja le a teljes rezolúciós szabályt implikatív normál formájú mondatokra. 


Ebben a feladatban tervezze tovább az áramkörön alapuló wumpus ágenst. 

(a) Írjon egy a (7.4) egyenlethez hasonló egyenletet a Nyíl kijelentéshez, 
amelynek igaznak kell lennie, amikor az ágensnek még van nyíla. 

(b) Ismételje meg az (a) feladatot egy ArccalJobbra kijelentésre, ahol használ- 
ja fel a (7.5) egyenletet modellként. 

(c) Készítsen változatokat a (7.7) és (7.8) egyenletekre a wumpus megtalálásá- 
hoz, és rajzolja fel az áramkört. 


Elemezze, hogy mit is jelent az optimális viselkedés a wumpus világban! Mutassa 
meg, hogy az IT-WUMPUS-ÁGENS definíciója nem optimális, és tegyen javaslatot 
a fejlesztésére! 


Bővítse ki az IT-WUMPUS-ÁGENS-t úgy, hogy képes legyen folyamatosan követ- 
ni a releváns tényeket a tudásbázisban! 


Mennyi ideig tart a DPLL számára a bizonyítása, ahol a egy literális, amelyet 
már tartalmaz a TB? Adjon magyarázatot! 


Kövesse a DPLL viselkedését a 7.15. ábrán leírt tudásbázison, amikor 0-t pró- 
báljuk meg bizonyítani, és hasonlítsa össze ezt a működést az előrefelé láncolá- 
si algoritmussal. 


8. ELSŐRENDŰ LOGIKA 


Ebben a fejezeteben a világ objektumait és ezek kapcsolatait vizsgáljuk meg, és meg- 
próbálunk érvelni ezek felhasználásával. 


A 7. fejezetben megmutattuk, hogy egy tudásbázisú ágens hogyan képes reprezentálni 
az őt körülvevő világot, és hogyan vezeti le a végrehajtandó cselekvéseket, Reprezentá- 
ciós nyelvként az ítéletkalkulust alkalmaztuk, mert ez elégséges volt a logika és a tudás- 
bázisú ágensek alapvető tulajdonságainak leírásához. Sajnos az ítéletkalkulus nyelveze- 
te túlságosan korlátos ahhoz, hogy összetett környezetekről szerzett tudást megfelelő 
módon reprezentáljon. Ebben a fejezetben az elsőrendű logikát! (first-order logic) 
vizsgáljuk, amelynek kifejezőereje elégséges ahhoz, hogy a józan ésszel felfogható 
tudásunk nagy részét reprezentálja. Ezenkívül az elsőrendű logika sok más reprezentá- 
ciós nyelvet magában foglal, vagy alapját képezi, és hosszú évtizedek óta vizsgálatok 
tárgya. A 8.1. alfejezetben a reprezentációs nyelvek általános bemutatásával kezdünk; 
a 8.2. alfejezetben az elsőrendű logika szintaxisát és szemantikáját tárgyaljuk; a 8.3. és 
8.4. alfejezet leírja az elsőrendű logika használatát egyszerű reprezentációk esetén. 


8.1. MÉG EGYSZER A REPREZENTÁCIÓRÓL 


Ebben az alfejezetben a reprezentációs nyelvek természetét vizsgáljuk. Megállapításaink 
be fogják mutatni az elsőrendű logika fejlesztésének szükségességét, ami egy lényege- 
sen nagyobb kifejezőerővel rendelkező nyelv, mint a 7. fejezetben bemutatott ítéletkal- 
kulus. Megnézzük majd, hogy az ítéletkalkulus és másfajta nyelvek mire képesek, és mi- 
re nem, A kérdést itt csak felületesen tárgyaljuk, néhány bekezdésbe sűrítve évszázadok 
gondolatait, kísérletezéseit és kudarcait. 

A programnyelvek — mint például a C4--, a Java vagy a Lisp — a használatban lévő 
formális nyelvek messze legnagyobb csoportját alkotják. A programok önmagukban, 
szó szerinti értelemben, csak számítási folyamatokat reprezentálnak. A programokon 
belüli adatstruktúrák tényeket reprezentálhatnak; például egy program használhatja a 
4 x 4-es négyzetrács-elrendezést a wumpus világ elemeinek reprezentálásához. Így te- 
hát az a programnyelvi állítás, hogy Világ(2, 2] — Csapda viszonylag természetes 
módja annak a kijelentésnek, hogy van egy csapda a [2. 2] négyzetben. (Az ilyesfajta 
reprezentációkat ad hoc jellegűnek vélhetjük; az adatbázisrendszereket pontosan azért 
fejlesztették ki. hogy általánosabb, tárgyterület-független módját biztosítsák a tények 


! Elsőrendű predikátumkaikulusnak (first-order predicate calculus) is szokták nevezni, és néha 
ERPK-nak rövidítik. 
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tárolásának és visszakeresésének.) A programnyelvek hiányossága, hogy nem rendel- 
keznek általános mechanizmussal arra, hogy tényeket más tényekből levezessenek; az 
adatstruktúra minden frissítése egy tárgyterület-specifikus eljárás segítségével történik, 
amelynek részleteit a programozó vezeti le a tárgyterületről meglévő ismereti alapján. 
Ez a procedurális (procedural) megközelítés szembeállítható az ítéletkalkulus dekla- 
ratív (declarative) természetével, amelyben a tudás és az interferencia különálló fogal- 
mak, a következtetés pedig teljes mértékben tárgyterületfüggő. 

A programok adatstruktúráinak (és így az adatbázisoknak ís) a másik hátránya annak 
a képességnek a hiánya, hogy egyszerűen lehessen kijelenteni például azt, hogy ..Van 
egy lyuk a [2. 2]-ben vagy a [3, 1]-ben", vagy azt, hogy , Ha a wumpus az [1, 11-ben 
van, akkor nincs a [2, 2]-ben". A programok egyetlen értéket tudnak tárolni minden 
változóhoz, néhány rendszer lehetővé teszi azt is, hogy az érték , ismeretlen" legyen, de 
hiányzik belőlük a részinformációk kezeléséhez szükséges kifejezőerő. 

Az ítéletkalkulus egy deklaratív nyelv, mivel szemantikája mondatok és a lehetséges 
világok közötti igazságrelációkon alapul. Elégséges a kifejezőereje ahhoz is, hogy rész- 
információkat kezeljen, diszjunkciók vagy negációk használatával. Az ítéletkalkulus- 
nak ezeken kívül egy harmadik tulajdonsága is van, ami kívánatos a reprezentatív nyel- 
vek esetében, nevezetesen a kompozíciós képesség (composítionality). Egy kompo- 
zíciós nyelvnél a mondat jelentése a mondatrészek jelentésének a függvénye. Például, 
a ,.Bi4 A Bi.2" kapcsolatban van a ..Bj 4" és a ,.Bi 2" jelentésével. Nagyon furcsa lenne, 
ha a Bi 4" azt jelentené, hogy az [1, 4]-es négyzet büdös, és a , Bi 2" azt jelentené, hogy 
az (1, 2]-es négyzet büdös, de a ,.By 4 A Bi.2" már azt jelentené, hogy Franciaország és 
Lengyelország döntetlent játszott a múlt heti jégkorong-selejtező mérkőzésen. Egyér- 
telmű tehát, hogy a kompozíciós képesség hiánya nagyban megnehezíti a következtető 
rendszerek működését. 

Mint azt a 7. fejezetben láttuk, az ítéletkalkulusnak nincs elégséges kifejezőereje egy 
sok objektumos környezet tömör leírásához. Például kénytelenek voltunk minden egyes 
négyzetnél önálló szabályt írni a csapdákra és a szellőkre: 


S11 8 (Ci2 V Cap) 


Magyarul, ezzel szemben, eléggé egyszerűnek tűnik egyszer s mindenkorra kijelenteni, 
hogy , A lyukas négyzetek mellett lévők szellősek." A természetes nyelvek szintaxisa 
és szemantikája lehetővé teszik a környezet tömör és összefogott leírását. 

Első látásra úgy tűnik, hogy a természetes nyelvek (mint az angol vagy a magyar) való- 
ban nagyon kifejezők. Képesek voltunk csaknem a teljes könyvet természetes nyelven 
megírni, és csak alkalmankéni kellett áttérnünk más nyelvekre (beleértve a logikát, a ma- 
tematikát és a diagramok nyelvét). Nagy múltú hagyomány a nyelvészetben és a nyelvek 
filozófiájában, hogy a természetes nyelvet elsősorban deklaratív tudásreprezentációs 
nyelvnek tekintjük, és megpróbáljuk rögzíteni ennek formális szemantikáját. Ha egy ilyen 
kutatás sikeres lenne, nagy előrelépést jelenthetne a mesterséges intelligencia számára, 
mert egy természetes nyelvet (vagy annak valamilyen származékát) használhatnánk a tu- 
dásreprezentációhoz vagy a következtető rendszerekben. 

A modern megközelítés szerint a természetes nyelv kissé más célt szolgál, nevezete- 
sen a nyelv a kommunikáció (communication), és nem annyira a tiszta reprezentáció 
eszköze. Amikor egy beszélő rámutat valamire, és azt mondja: , Nézd!" a hallgató meg- 
tudja azt, hogy mondjuk, Superman végre megjelent a háztetők felett. Mégsem szeretnénk 
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azt kijelenteni, hogy a , Nézd!" mondatban benne foglaltatik ez a tény is. A mondat jelen- 
tése mind magától a mondattól, mind attól a szövegkörnyezettől (context) függ, amely- 
ben a mondat elhangzott. Nyilvánvalóan nem várható, hogy csupán a , Nézd!" mondatot 
az adatbázisban tárolva visszaadható ennek a jelentése a szövegkörnyezet ismerete nél- 
kül — amiből az a kérdés következik, hogy hogyan tudjuk magát a szövegkörnyezetet 
reprezentálni. A természetes nyelvekből is hiányzik a kompozíciós képesség — egy 
olyan mondat jelentése, mint az , És akkor meglátta", függhet az előtte álló és az utána 
következő mondatok által alkotott szövegkörnyezettől. Végül pedig a természetes nyel- 
vek egyik gyenge pontja a többértelműség (ambiguity), ami nehézségeket okozhatna 
a következtetésben. Amint azt Pinker megállapítja (Pinker, 1995): , Mikor az emberek 
az égre gondolnak, bizonyára nem zavarja meg őket. hogy vajon az égboltról van-e szó, 
vagy valamiről, ami lángol — és ha egy szó két gondolatot ís megjeleníthet, akkor a gon- 
dolatok nem feleltethetők meg szavaknak." 

Azt a megközelítést követjük, hogy építünk az ítéletkalkulus alapjaira felhasználva, 
hogy ez egy deklaratív, kompozíciós szemantika, ami független a szövegkörnyezettől, 
és egyértelmű. Majd ezekre az alapokra egy még kifejezőbb logikát építünk azáltal, 
hogy felhasználunk a természetes nyelveknél alkalmazott reprezentációs megoldásokat, 
miközben igyekszünk elkerülni ennek a hátrányait. A természetes nyelv szintaxisát 
vizsgálva a legegyszerűbben azonosítható összetevők a főnevek és a főnévi kifejezések, 
amelyek objektumokra (objects) utalnak (négyzetek, lyukak, wumpusok), valamint az 
igék és az igei kifejezés, amelyek az objektumok között fennálló relációkra (relations) 
utalnak (szellős, szomszédos, kilő). Ezeknek a relációknak egy része függvény (function) 
— azaz olyan relációk, amelyeknek csak egyetlen , értékük" van egy adott , bemenethez". 
Könnyen találhatunk példákat objektumokra, relációkra és függvényekre: 


s . Objektumok: emberek, házak, számok, elméletek, Ronald McDonald, színek, base- 
ballmeccs, háborúk, évszázadok... 

s  Relációk: lehetnek unáris relációk vagy tulajdonságok (properties), úgymint piros, 
kerek, színlelt, elsőrendű, többemeletes. .., vagy általánosabb /1-elemű relációk, úgymint 
testvére, nagyobb, belsejében, része, színe, utána történt, birtokol, kettő között van. .. 

" . Függvények: apja, legjobb barátja, harmadik hivatali ideje, eggyel több mint, kezdete. . . 


"Valójában minden állítás elképzelhető úgy, mint ami objektumokra, relációkra és függ- 
vényekre vonatkozik. Íme néhány példa: 


s , Egy plusz kettő egyenlő hárommal." 
Objektumok: egy, kettő, három, egy meg kettő; Reláció: egyenlő; Függvény: plusz. 
(,. Egy plusz kettő a neve annak az objektumnak, amelyet úgy kapunk, hogy a , plusz" 
függvényt alkalmazzuk az ..egy" és ..kettő" objektumokra. A három egy másik neve 
ugyanennek az objektumnak.) 

s. ,A wumpus helyével szomszédos négyzetek büdösek." 
Objektumok: wumpus, négyzetek; Tulajdonság: büdös; Reláció: szomszédos. 

a ,A gonosz János király uralkodott Angliában 1200-ban." 
Objektumok: János, Anglia, 1200; Reláció: uralkodott; Tulajdonságok: gonosz, király. 


Az elsőrendű logika (first order logic) nyelvezete, amelynek a szintaxisát és szeman- 
tikáját a következő alfejezetben adjuk meg, objektumok és relációk köré épül. Az első- 
rendű logika azért olyan fontos a matematika, a filozófia és a mesterséges intelligencia 
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számára, mert ezeket a területeket — amelyek valójában az emberi lét mindennapjait ír- 
ják le — tekinthetjük úgy, mint amelyek objektumokkal és a köztük lévő relációkkal dol- 
goznak. Az elsőrendű logika ezenkívül tényeket közölhet az univerzum néhány vagy 
összes objektumárói. Ez lehetővé teszi, hogy általános szabályokat vagy törvényszerű- 
ségeket tudjunk megfogalmazni, mint például azt az állítást, hogy , A wumpus helyével 
szomszédos négyzetek büdösek." 

Az elsődleges különbség az ítéletlogika és az elsőrendű logika között az egyes nyel- 
vek ontológiai meghatározottságában (ontological commitment) rejlik, abban, hogy 
mit feltételez a nyelv a valóság természetéről. 


A gondolat nyelve 


A filozófusok és a pszichológusok sokat töprengtek azon, hogy az emberek és más élőlények hogyan 
jelenítik meg a tudást. Egyértelmű, hogy a természetes nyelv fejlődése fontos szerepet játszott abban, 
hogy az emberekben kifejlődött ez a képesség. Másrészt, számos pszichológiai eredmény azt sugall- 
ja, hogy az emberek nem alkalmazzák közvetlenül a nyelvet a belső reprezentációkboz. Például a két 
mondat közül melyikkel kezdtík a 8.1. alfejezete? 


, Amelyben a világ objektumait és ezek kapcsolatait vizsgáljuk meg..." 
Ebben az alfejezetben a reprezentációs nyelvek természetét vizsgáljuk..." 





Wanner (1974) úgy találta, hogy a kísérlet alanyai véletlenszerűen — körülbelül 5096-os gyakoriság- 
gal — jól választottak, de inkább az elolvasott szöveg tartalmára emlékeztek, több mint 9090-os biz- 
tonsággal, Ez azt sugallja, hogy az emberek a szavakat úgy dolgozzák fel. hogy egy nem verbális 
reprezentációra alakítják át, amit emlékezetnek (memory) nevezünk. 

Továbbra is nagyon érdekes kérdés, hogy mi a pontos mechanizmusa annak, ahogyan a nyelv le- 
hetővé teszi és formálja a gondolatok reprezentációját az emberekben. A híres Sapir-Whorf- 
hipotézis szerint az általunk beszélt nyelv nagymértékben befolyásolja gondolkodásunk és döntése- 
ínk mikéntjét, különösen abban. ahogy kategóriarendszereket állítunk fel, amelyet felhasználva aztán 
felosztjuk a világot különböző fajta objektumokra. Whorf szerint (Whorf, 1956), azáltal, hogy az 
eszkimóknak számos szavuk van a hóra, másképpen is érzékelik a havat, mint más nyelvek beszé- 
tői. Néhány nyelvész vitatja ennek az állításnak a tényszerűségét — Pullum úgy érvel (Pullum, 1990), 
hogy az inuitoknak, a yupiknak és más rokon nyelvet beszélőknek ugyanannyi szavuk van a hóval 
rokonítható fogalmakra, mint az angoloknak — vannak azonban olyanok ís, akik támogatják az állí- 
tást (Fortescue, 1984). Vitathatatlanul igaznak tűnik, hogy az olyan embercsoportok, amelyeknek 
több ismeretük van a világnak egy bizonyos részéről, sokkal részletesebb szókinccsel rendelkeznek 
erre a részre vonatkozóan — például a gyakorló rovarszakértők az általunk bogaraknak nevezett 
lényeket fajok százezreire osztják fel, és sokról ezek közül személyes ismeretekkel rendelkeznek. 
(Az evolúciós biológus J. B. S. Haldane meg is állapította, hogy a Teremtő , Bogarak iránti mérték- 
telen szeretete" különös.) Mi több, a tapasztalt síclőknek rengeteg szavuk van a hóra — porhó, latyak, 
tört krumpli, aludttej, kukorica, cukor, aszfalt, kordbársony, pehely, trutymó és így tovább -, és ezek 
olyan különbségeket mutatnak, amelyek ismeretlenek egy kívülálló számára. Az ok-okozati viszony 
iránya azonban ismeretlen — kérdés, hogy a síelők csak azért ismerik fel a különbségeket, mert meg- 
tanulják a szavakat, vagy a különbségek keletkeznek először a személyes tapasztalat alapján, és eze- 
ket címkézik fel aztán a közösségben már ismert fogalmakkal. Ez a kérdés különösen a gyermekek 
fejlődésének tanulmányozása szempontjából fontos. Egyelőre kevés ismeretünk van arról, hogy 
milyen méntékben fonódik egymásba a nyelvtanulás és a gondolkodás elsajátítása. Például egy olyan 
fogalom nevének ismerete, mint például az agglegény, megkönnyíti-e bonyolultabb, erre épülő fogal- 
mak előállítását és használatát, amelyek tartalmazzák ezt a nevet — partiképes agglegény? 
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Az ítéletlogika feltételezi például, hogy a definiált tények fennállnak vagy nem áll- 
nak fenn a világban. Minden ténynek két állapota lehet: igaz vagy hamis.? Az elsőren- 
dű logika bonyolultabb feltételezésekre épít, nevezetesen, hogy a világ objektumokból 
épül fel, amelyek között relációk léteznek, amelyek vagy fennállnak, vagy nem. A spe- 
ciális célú logikák további ontológiai hozzárendeléseket tesznek; például a temporális 
logika (temporal logic) feltételezi, hogy a tények csak bizonyos időben állnak fenn, és 
hogy ezek az idők — amelyek lehetnek időpontok és időtartamok is — rendezhetők. Így 
ezek a speciális célú logikák az objektumok egy bizonyos fajtájához (és az azokhoz 
tartozó axiómákhoz) , első osztályú" státust rendelnek a logikán belül, ahelyett hogy 
egyszerűen meghatároznák őket a tudásbázison belül. A magasabb rendű logika 
(higher-order logic) úgy tekint az elsőrendű logikában relációknak és függvényeknek 
nevezettekre, mintha azok maguk is objektumok lennének. Ez lehetővé teszi, hogy min- 
den relációról állításokat alkossunk — például arra, ha valaki azt szeretné meghatározni, 
mit jelent, hogy egy reláció tranzitív. Eltérően más speciális célú logikáktól a magasabb 
rendű logika egyértelműen nagyobb kifejezőerővel rendelkezik, mint az elsőrendű logi- 
ka, abban az értelemben, hogy néhány magasabb rendű logikai állítás nem írható le 
véges számú elsőrendű logikai állítással. 

Egy logika jellemezhető még az ismeretelméleti megállapításaival (epistemological 
commitments) is — az egyes tényekhez megengedett tudásállapotokkal. Mind az ítélet- 
kalkulusban, mind az elsőrendű logikában egy állítás egy tényt reprezentál, és az ágens 
vagy elhiszi. hogy az állítás igaz, vagy hamisnak véli, vagy nincs róla véleménye. Ezek- 
ben a logikákban tehát a tudásnak három lehetséges állapota van, bármely állítást is 
tekintjük. Ezzel szemben azok a rendszerek, amelyek a valószínűség-elméletet (pro- 
bability theory) használják, tartalmazhatnak egy hiedelemfokozatot, ami a 0-tól (teljes 
hitetlenség) az 1-ig tart (teljes elfogadás)? Például, egy valószínűsíthető wumpusvilág- 
beli ágens hiheti, hogy a wumpus az [1, 3]-ban van, 0,75-ös valószínűséggel. Az öt 
különböző logikai rendszer ontológiai és ismeretelméleti megállapításait a 8.1. táblázat- 
ban foglaltuk össze. 











Nyelv Ontológiai meghatározottság Ismeretelméleti hozzárendelések 
(ami a világban létezik) (amit az ágens elhisz a tényekről) 

Ítéletlogika Tények Igaz/hamisfismeretlen 

Elsőrendű logika Tények, objektumok, relációk Igaz/hamisfismeretten 

Temporális logika] Tények, objektumok, relációk, idők (  Igaz/hamisfismeretlen 

Valószínűség-elmélet [ Tények Hiedelemfokozat € (0. 1] 

Fuzzy logika Tények igazsági fokkal € (0, I] Ismert intervallumérték. 

















8.1. táblázat. Formális nyelvek, valamint azok ontológiai és ismeretelméleti hozzárendelései 


2 Ezzel szemben a fuzzy logikában (fuzzy logic) definiált az igazság foka (degree of truth), ami egy 
0 és 1 közötti érték. Például az a mondat, hogy , Bécs egy nagy város" a mi világunkban csak 0,6 fokig 
lehet igaz. 

3 Fontos, hogy ne keverjük össze a valószínűiség-számításban alkalmazott hiedelemfokozatot a fuzzy 
logikában reprezentált igazsági fokozattal. Létezik néhány olyan bizonytalanságot kezelő rendszer, 
amely megenged határozatlanságot (a hiedelem fokát) az igazsági fokozatokkal kapcsolatban. 
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A következő alfejezetben elkezdjük az elsőrendű logika részletes tárgyalását. Ahogy 
egy fizikát tanuló diáknak valamilyen szinten rendelkeznie kell matematikai ismeretek- 
kel, a mesterséges intelligenciát tanulmányozóknak is el kell sajátítaniuk bizonyos jár- 
tasságot a logikai jelölési rendszerek használatában. Másrészt az is nagyon fontos, hogy 
ne bonyolódjunk bele a logikai jelölési rendszerek sajátosságaiba — hiszen számos 
különböző változat létezik. A lényeges az, hogy tudatában legyünk annak, hogy a nyelv 
miként könnyíti meg tömör reprezentációk létrehozását, és hogy a szemantika miként 
vezet el helyes következtetési folyamatokhoz. 


8.2. AZ ELSŐRENDŰ LOGIKA SZINTAXISA 
ÉS SZEMANTIKÁJA 


Az alfejezetet azzal kezdjük, hogy pontosabban meghatározzuk azt a módot, amellyel 
az elsőrendű logikában előforduló lehetséges világok leírják az objektumokra és relá- 
ciókra tett ontológiai megállapításokat. Ezután bemutatjuk a nyelv különböző elemeit, 
és ahogyan haladunk, megmagyarázzuk ezek szemantikáját. 


Az elsőrendű logika modelljei 


Emlékezzünk arra a 7. fejezetből, hogy a logikai nyelvek modelljei azok a formális 
struktúrák, amelyek a vizsgálat tárgyát képező lehetséges világokat alkotják. Az ítélet- 
kalkulus modelljei csupán az ítéletszimbólumok igazságértékeinek halmazai. Az első- 
rendű logika modelljei ennél érdekesebbek. Először is. ezek tartalmaznak objektumokat! 
A modell tárgyterülete (domain) azoknak az objektumoknak a halmaza. amelyeket a 
tárgyterület tartalmaz; ezeket az objektumokat szoktuk a tárgyterület elemeinek 
(domain elements) nevezni. A 8.2. ábra bemutat egy modellt öt objektummal: Oroszlán- 
szívű Richárd, Anglia királya 1189-től 1199-ig; öccse, gonosz János király, aki 1199-től 
1215-ig uralkodott; Richárd és János bal lába; végül egy korona. 

A modellben található objektumok többféle relációban lehetnek egymással. A 8.2. 
ábrán Richárd és János testvérek. Formálisan. egy reláció csak egymással kapcsolatban 
lévő objektumok m-eseinek (tuple) halmaza. (Egy n-es az objektumok egy rögzített sor- 
rendben felsorolt gyűjteménye, amely objektumokat a () zárójelpár vesz körbe.) Így te- 
hát ebben a modellben a testvérreláció a következő halmaz: 


(Oroszlánszívű Richárd, János király), (János király, Oroszlánszívű Richárd) ) (8.1) 


(Itt magyarul neveztük meg az objektumokat, de képzeletben be lehetne helyettesíteni 
a neveket például képekkel is.) A korona János király fején van, tehát a , fején" reláció- 
hoz csak egy n-es tartozik (a korona, János király). 

A , testvér" és a , fején" relációk bináris relációk — ez azt jelenti. hogy két objektum 
között állítanak fel kapcsolatot. A modell ezenkívül egyelemű, unáris relációkat vagy 
tulajdonságokat is tartalmaz: A , személy" tulajdonság egyaránt ígaz Richárdra és Já- 
nosra; a , király" tulajdonság csak Jánosra igaz (feltehetően azért, mert Richárd ekkor 
már halott volt); míg a , korona" tulajdonság csak a koronára igaz. 
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testvér 


8.2. ábra. Egy öt objektumot - két bináris relációt, három egyelemű relációt (címkékkel jelezve az ob- 
jektumokon) és egy egyargumentumú függvényt, bal láb — tartalmazó modell 


A kapcsolatok egyes típusai leginkább függvényeknek tekinthetők, ahol egy adott 
objektumnak pontosan csak egy másik objektummal kell ilyen kapcsolatban lennie. 
Például minden egyes személynek egy bal lába van, tehát a modellben található egy 
abal láb" függvény, ami a következő leképezéseket teszi lehetővé: 


(Oroszlánszívű Richárd) — Richárd bal lába 
(János király) — János bal lába (8.2) 


Pontosabban megfogalmazva, az elsőrendű logika modelljei totális függvényeket 
(total functions) kívánnak meg, ami azt jelenti, hogy minden bemeneti -eshez tartoz- 
nia kell egy értéknek. Így tehát a koronához tartoznia kell egy bal lábnak, és ennek így 
kell lennie minden bal láb esetében. Létezik erre a problémára egy technikai megoldás, 
amely egy hozzáadott , láthatatlan" objektumot vezet be: egy bal lábat rendel minden- 
hez, amelynek nincs bal lába, beleértve önmagát is. Szerencsére, amíg valaki nem tesz 
kijelentéseket a bal lábakról vagy olyan dolgokról. amelyeknek nincs bal lábuk, ezek- 
nek a technikai problémáknak nincs jelentőségük. 


Szimbólumok és interpretációk 


Most pedig nézzük a nyelv szintaxisát. A türelmetlen olvasó teljes leírást talál az első- 
rendű logika formális nyelvtanáról a 8.3. ábrán. 

Az elsőrendű logika alapvető szintaktikai elemei az objektumokat, relációkat és 
függvényeket megjelenítő szimbólumok. A szimbólumoknak tehát három típusa létezik: 
konstansszimbólumok (constant symbols), amelyek az objektumokat jelölik; predi- 
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kátumszimbólumok ípredicate symbols), amelyek a relációkat jelenítik meg; és a 
függvényszimbólumok (function symbols), amelyekkel függvényekre hivatkozha- 
tunk. Azt a konvenciót fogjuk követni, hogy a szimbólumok mind nagybetűvel kezdőd- 
nek. Például használhatjuk a Richárd és János konstansszimbólumokat; a Testvér, 
Fején, Személy, Király és Korona predikátumszimbólumokat, valamint a BalLáb függ- 
vényszimbólumot. Úgy, mint az ítéletszimbólumoknál, a nevek megválasztása itt is 
teljes mértékben a felhasználóra van bízva. Minden egyes predikátum- és függvény- 
szimbólum együtt jár egy számossággal (arity), ami behatárolja a paraméterek számát. 





Mondat —  AtomiMondat 
( Mondat Összekötőjel Mondat ) 
Kvantor Változó... Mondat 


—- Mondat 
AromiMondat —  Predikátum(Term....) ] Term — Term 


Term — Függvény(Term,...) 


I  Konstans 
l Változó 
Összekörőjel - 5 ]alvie 
Kvantor 6 V]3 
Konstans — A ]Xi I János ] ... 


Változó — alxIs1... 
Predikátum — — Mielőtt ) Színes Esik ] ... 
Függvény — — Anya I BalLába  ... 











8.3. ábra. Az elsőrendű logika (egyenlőséggel kiegészített) szintaxisa Backus-Naur-forma jelöléseivel. 
(Lásd az 1112. oldalt, ha ez a jelölés ismeretlen.) A szintaxis szigorú a zárójelezés tekintetében: a záró- 
jelekről és az operátori elsőbbségről a 259. oldalon szereplő megjegyzések ugyanúgy vonatkoznak az 
elsőrendű logikára is. 


A szemantika a mondatokat a modellekhez kapcsolja, és képesnek kell lennie az igaz- 
ság meghatározására. Hogy ez megtörténjen, szükségünk van egy interpretációra, 
amely pontosan megjelöli, hogy mely objektumok, relációk és függvények felelnek 
meg a konstans-, predikátum- és függvényszimbólumoknak. Egy lehetséges interpretá- 
ció — amit szándékolt interpretációnak (intended interpretation) nevezünk — a mi 
esetünkben a következő: 





a Richárd Oroszlánszívű Richárdra, míg János a gonosz János királyra vonatkozik. 

s A Testvér a testvéri kapcsolatra vonatkozik, ami a (8.1) egyenletben megadott n-es 
halmazban látható; a Fején arra a , fején" relációra vonatkozik, ami a korona és 
János király között áll fenn: a Személy. Király és Korona pedig arra az objektum- 
halmazra vonatkoznak, amelyek személyek, királyok és koronák. 

s A BalLáb azt a , bal láb" függvényt jelenti, aminek a leképezését a (8.2) egyenlet- 
ben adtuk meg. 
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Sok más lehetséges interpretáció is létezik, ami ezeknek a szimbólumoknak a modell- 
hez való kapcsolatát írja le. Például egy lehetséges interpretációban Richárd jelenti a 
koronát és János a János király bal lábát. A modell öt objektumot tartalmaz, így 25 lehet- 
séges interpretáció adható meg csak a Richárd és a János konstansszimbólumokhoz. 

Figyeljük meg, hogy nem minden objektumnak van arra szüksége, hogy elnevezzék 
— például a szándékolt interpretáció nem nevezi meg a koronát vagy a lábakat. Az is 
lehetséges, hogy egy objektumnak több neve legyen; létezik olyan interpretáció, amely- 
ben a Richárd és a János is a koronára vonatkozik. Ha ez a lehetőség zavaró, emlékez- 
zünk arra, hogy az ítéletlogikában teljességgel elfogadható egy olyan modell, amelyben 
a Felhős és a Napos egyaránt igaz. A tudásbázis feladata az, hogy kizárja azokat a mo- 
delleket, amelyek ellentmondásban vannak ismereteinkkel. 

Bármely mondat igazságát egy modell és a mondat szimbólumainak az interpretáció- 
ja határozza meg. Így tehát a vonzat, az érvényesség és más jellemzők az összes lehet- 
séges modell és az összes lehetséges interpretáció termjeinek felhasználásával vannak 
meghatározva. Fontos megjegyezni, hogy a tárgyterület elemek száma minden egyes 
modellben korlátlan lehet — a tárgyterület elemei például lehetnek egész vagy valós 
számok. Ebből következően, a lehetséges modellek száma korlátlan, mint ahogy az in- 
terpretációk száma is. A maga után vonzásnak az összes lehetséges modell felsorolá- 
sával történő vizsgálata, ami az ítéletlogikában működik, nem lehetséges az elsőrendű 
logikában. Még ha az objektumok száma korlátos is, a kombinációk száma nagyon 
nagy lehet. A példánkban szereplő objektumokkal hozzávetőlegesen 10? a kombinációk 
száma, egy öt objektummal rendelkező tárgyterületben (lásd 8.5. feladat). 


Termek 


Egy term (term) egy objektumra vonatkozó logikai kifejezés. A konstansszimbólumok 
tehát termek, de nem mindig kényelmes önálló szimbólumot alkalmazni minden egyes 
objektum megnevezésénél. Magyarul inkább a , János király bal lába" kifejezést hasz- 
náljuk, mintsem nevet adjunk a lábának. Ezért használunk függvényszímbólumokat: 
a konstansszimbólumok használata helyett inkább a BalLálXJános)-t alkalmazzuk. Álta- 
lános esetben egy összetett term egy függvényszimbólumból áll, amelyet a függvény- 
szimbólum argumentumainak zárójelezett listája követ. Fontos megjegyezni, hogy egy 
összetett term nem más, mint egy bonyolult formájú név, és nem egy , értéket visszaadó 
szubrutin hívás". Nem egy BalLáb szubrutinról van szó, amely bemenetként megkap egy 
személyt, és visszaad egy lábat. Tudunk következtetni a bal lábakkal kapcsolatban (pl. 
kiindulva az általános szabályból, hogy mindenkinek van egy bal lába, és ebből levezet- 
hető, hogy Jánosnak is lennie kell) anélkül, hogy valaha is megadnánk a BalLáb definí- 
cióját. Ez is olyasmi, amit nem tehetünk meg a programozási nyelvek szubrutinjaival.§ 


4 A x.kifejezések (X-expressions) hasznos jelölést biztosítanak, amelyek az új függvényszimbólumo- 
kat futási időben hozzák létre. Például a függvény, amely négyzetre emeli a számokat, leírható úgy, hogy 
(Ax x x x), és alkalmazható az argumentumokra, akár bármely más függvényszimbólum. Egy A-kifejezést 
úgy is meghatározhatunk és használhatunk, mint egy predikátumszimbólumot (lásd 22. fejezet). A Lambda 
operátor a Lispben pontosan ugyanezt a szerepet játssza. Vegyük észre, hogy a A használata ilyen módon 
nem növeli meg az elsőrendű logika formális kifejezőerejét, mert az a mondat, ami tartalmaz egy X- 
kifejezést, átírható úgy, hogy hozzácsatoljuk a paramétereket, ami egy ugyanolyan mondatot eredményez. 
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A termek formális szemantikája nyilvánvaló. Tekintsük az f(ty, ..., tn) termet. Az f 
függvényszímbólum a modellben található valamely függvényre (nevezzük F-nek) 
vonatkozik; az argumentum termek a tárgyterületben fellelhető objektumokra vonat- 
koznak (nevezzük őket dj, ..., d,-nek); és a term egészében arra az objektumra vonat- 
kozik, ami a dj, ..., d, -re alkalmazott F függvény értéke. Például tételezzük fel, hogy 
ha a BalLáb függvényszimbólum a (8.2) egyenletben mutatott függvényre vonatkozik, 
és a János vonatkozik János királyra, akkor a BalLálX János) János király bal lábát jelöli. 
Ezen a módon az interpretáció rögzíti minden termnek a referenciáit. 


Atomi mondatok 


Most, hogy vannak objektumokra vonatkozó termeink és relációkra vonatkozó prediká- 
tumszimbólumaink, összerakhatjuk őket, hogy tényeket kifejező atomi mondatokat 
(atomic sentences) állítsunk elő. Egy atomi mondatot egy predikátumszimbólum és az 
azt követő zárójelezett listában található termek listája alkot. Például a 


Testvér(Richárd, János) 


azt jelenti egy korábban megadott. szándékolt interpretáció szerint, hogy Oroszlánszívű 
Richárd testvére János királynak.5 Az atomi mondatoknak is lehetnek összetett termek 
az argumentumai. Így tehát a 


Házas(Apja( Richárd), AnyjatJános)) 


azt jelenti, hogy Oroszlánszívű Richárd apja feleségül vette János király anyját (ismét 
csak egy alkalmas interpretációban). 

Egy atomi mondat igaz (true) egy adott modellben, egy adott interpretáció mellett, 
ha a reláció, amire a predikátumszimbólum vonatkozik, fennáll az argumentumok által 
jelölt objektumok között. 


Összetett mondatok 


Összetett mondatok létrehozásához használhatunk logikai összekötőjeleket (logical 
connectives) úgy, mint az ítéletkalkulusban. A logikai kötőszavakkal formált monda- 
tok szemantikája azonos az ítéletkalkulusban látott szemantikával. Íme négy mondat, 
amelyek igazak a 8.2. ábra modelljében, a szándékolt interpretációnk szerint. 


-Testvér(BalLálK Richárd), János) 
Testvér(Richárd, János) A Testvér(János, Richárd) 
KirályXRichárd) N Király(János) 

-Király(Richárd) 5 Király( János) 


5 Rendszerint követjük az argumentumok rendezésének koönvencióját, amely szerint a P(x)-t úgy ér- 
telmezzük, hogy az ,.x az y-nak a P-je". 
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Kvantorok 


Ha egyszer létrehoztunk egy objektumokat is tartalmazó logikát, természetes, hogy 
objektumok egész gyűjteményeire vonatkozó tulajdonságokat is ki akarunk fejezni 
anélkül, hogy az objektumokat nevük felhasználásával fel kellene sorolni. Ezt a kvan- 
torok (guantifiers) alkalmazása teszi lehetővé. Az elsőrendű logika két standard kvan- 


tort tartalmaz, amelyeket univerzális és egzisztenciális kvantoroknak nevezünk. 


Univerzális kvantor (v) 


Emlékezzünk vissza arra, hogy a 7. fejezetben milyen nehézségeink voltak általános sza- 
bályok ítéletlogikában történő megfogalmazásával. Az olyan szabályok, mint az , A wum- 
pus mellett található négyzetek büdösek" vagy a , Minden király személy" adják meg a 
savát-borsát az elsőrendű logikának. Az első szabállyal a 8.3. alfejezetben fogunk foglal- 
kozni. A második szabály, , Minden király személy", az elsőrendű logikában így írható le: 


Vx Király(x) 5 Személytx) 


A V-t általában , Minden ...re"-nek olvassuk ki. A mondat tehát azt jelenti: . Minden 
X-re, ha x egy király, akkor x egy személy." Az x szimbólum neve változó (variable). 
A konvenció alapján a változókat kisbetűvel írjuk. Egy változó önmagában egy term, 
és mint olyan, szerepelhet egy függvény argumentumaként — például: BalLáb(x). Egy 
változó nélküli termet alaptermnek (ground term) nevezünk. 

Egyszerűen a vx P mondat, ahol a P egy tetszőleges logikai kifejezés, azt mondja ki, 
hogy a P igaz minden x objektumra. Pontosabban, vx P igaz egy adott modellre az in- 
terpretáción belül, ha P igaz minden lehetséges kiterjesztett interpretációban (extended 
interpretations), amelyet az adott interpretáció felhasználásával hozunk létre, ahol minden 
egyes kiterjesztett interpretáció meghatároz egy tárgyterületelemet, amire az x vonatkozik. 

Ez bonyolultnak hangzik, de valójában csak egy óvatos módja annak, hogy megálla- 
pítsuk az univerzális kvantorok intuitív jelentését. Tekintsük a 8.2. ábrát és a hozzá tar- 
tozó szándékolt interpretációt. Ötféle módon tudjuk kiterjeszteni az interpretációt: 


x — Oroszlánszívű Richárd 
x — János király 

x o Richárd bal lába 

x — János bal lába 

x — a korona 


A Vvx Király(x) 5 Személy(x) univerzális kvantort alkalmazó mondat igaz az eredeti 
interpretációban, ha a Király(x) — Személy(x) mondat igaz mind az öt kiterjesztett 
interpretációra. Eszerint az univerzális kvantorral ellátott mondat egyenértékű a követ- 
kező öt mondattal: 


Oroszlánszívű Richárd egy király 5 Oroszlánszívű Richárd egy személy 
János király egy király 5 János király egy személy 

Richárd bal lába egy király — Richárd bal lába egy személy 

János bal lába egy király — János bal lába egy személy 

A korona egy király — a korona egy személy 


308 8. ELSŐRENDŰ LOGIKA 


Nézzük meg alaposan ezt az állításhalmazt. Mivel a mi modellünkben János király az 
egyetlen király, a második mondat kijelenti, hogy ő egy személy, ahogy azt reméltük is. 
De mi a helyzet a többi négy mondattal, amelyek azért szerepelnek, hogy állításokat fo- 
galmazzanak meg lábakról és koronákról? Része ez annak a jelentésnek, hogy , Minden 
király személy"? Valójában, a többi négy állítás is igaz a modellben, de egyáltalán nem 
állítanak semmit a lábak, koronák vagy akár Richárd személyes tulajdonságairól. Ez 
azért van, mert ezen objektumok egyike sem király. Ha megnézzük a (—) összekötőjel 
igazságtábláját (7.8. ábra), láthatjuk, hogy az implikáció igaz, amikor a premisszája ha- 
mis — tekintet nélkül a konklúzió igazságtartalmára. Így tehát az univerzális kvantorral 
ellátott mondat kijelentése egyenértékű azzal, hogy egyedi implikációk teljes listáját de- 
finiáljuk. Végül is egy szabály konklúzióját adjuk meg azokra az objektumokra, amelyek 
premisszája igaz, de nem mondunk egyáltalán semmit azokról az egyedekről, akikre 
nézve a premissza hamis. Így az implikáció igazságtáblájának sorai tökéletesnek bízo- 
nyulnak univerzális kvantorokat tartalmazó általános szabályok megírásához. 

Gyakori hiba, amelyet még figyelmes olvasók is elkövetnek, akik pedig már többször 
is elolvasták ezt a bekezdést, hogy konjunkciót használnak implikáció helyett. A 


Vx Király(x) A Személy) 
mondat egyenértékű lenne azzal az állítással, hogy 


Oroszlánszívű Richárd egy király A Oroszlánszívű Richárd egy személy 
János király egy király A János király egy személy 
Richárd bal lába egy király A Richárd bal lába egy személy 


és így tovább. Nyilvánvaló, hogy ez nem azt jelenti, mint amit szeretnénk elérni. 


Egzisztenciális kvantorok (3) 


Az univerzális kvantor állításokat fogalmaz meg minden objektumról. Hasonlóan, az 
egzisztenciális kvantor felhasználásához állításokat tehetünk az univerzum néhány 
objektumáról anélkül, hogy megneveznénk azokat. Azt az állítást tehát, hogy János 
királynak koronája van, így is leírhatjuk: 


3x Korona(x) A Fején(x, János) 


Az 3x kiolvasása , Létezik egy olyan x..." vagy , Néhány x-re..." . 

Érthetően fogalmazva, az 1x P mondat azt jelenti. hogy a P legalább egy x objektum- 
ra igaz. Pontosabban az 3x P igaz egy adott modellben, egy adott interpretáción belül, 
ha a P igaz legalább egy kiterjesztett interpretációban, amely az x-et a tartomány egy 
eleméhez rendeli. A mi példánkban ez azt jelenti, hogy a következő állítások közül leg- 
alább egy igaz: 


Oroszlánszívű Richárd egy korona A Oroszlánszívű Richárd János fején van 
János király egy korona A János király János fején van 

Richárd bal lába egy korona A Richárd bal lába János fején van 

János bal lába egy korona A János bai lába János fején van 

A korona egy korona A a korona János fején van 
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Az ötödik állítás igaz a modellben, így az eredeti egzisztenciális kvantorral ellátott 
mondat igaz a modellben. Vegyük észre, hogy definíciónk szerint a mondat igaz lenne 
egy olyan modellben is, ahol János király két koronát visel. Ez teljes mértékben kon- 
zisztens az eredeti mondattal, miszerint , János királynak korona van a fején."6 

Mint ahogy természetesnek tűnik az — használata összekötőjelnek a V használata- 
kor, az A az a természetes összekötőjel, amit az 3-vel használunk. Az A használata fő 
összekötőjelként az 4-val túlságosan is erős állításokhoz vezetett az előző alfejezetben 
tárgyalt példában; a — használata az 3-vel igazából nagyon gyenge állításhoz vezet: 


3x Korona(x) 5. Fején(x, János) 
A felszínen ez a mondatunk elfogadható átírásának tűnik. A szemantikát alkalmazva 
látjuk, hogy a mondat azt jelenti ki, hogy a következő állítások legalább egyike igaz: 


Oroszlánszívű Richárd egy korona — Oroszlánszívű Richárd János fején van 

János király egy korona — János király János fején van 

Richárd bal lába egy korona — Richárd bal lába János fején van 
és így tovább. Mármost, egy implikáció akkor igaz, ha a premissza és a konklúzió egy- 
aránt igaz, vagy ha a premisszája hamis. Tehát ha Oroszlánszívű Richárd nem egy 
korona, akkor az első állítás igaz, és az egzisztenciális kvantort kielégítettük. Így tehát 
egy egzisztenciális kvantort tartalmazó implikációs mondat igaz bármely olyan modell- 
ben, amely tartalmaz egy olyan objektumot, amelyre az implikáció premisszája hamis; 
következésképpen az ilyen mondatok valójában nem túl sokat mondanak. 


Egymásba ágyazott kvantorok 


Gyakran szükségünk van még összetettebb mondatok kifejezésére, amelyek több kvan- 
tort is használnak. A legegyszerűbb eset az, amikor a kvantorok azonos típusúak. Pél- 
dául , A fivérek testvérek" mondat leírható úgy, hogy: 


Vx Wy Fivér(x, y) 5 Testvértx, y) 


Az egymást követő azonos típusú kvantorokat írhatjuk úgy is, hogy egy kvantort alkal- 
mazunk az összes változóra. Például hogy azt állítsuk, a testvérség egy szimmetrikus 
kapcsolat, ezt írhatjuk: 


Vx, y Testvértx, y) 6 Testvérfy, x) 


Más esetekben kevert jelöléssel van dolgunk. A , mindenki szeret valakit" azt jelenti, 
hogy minden személyhez tartozik valaki, akit a személy szeret: 


Vx 3y Szeret(x, y) 
Másrészt, hogy azt állítsuk: , Van valaki, akit mindenki szeret", ezt írjuk: 
3y Vx Szeretx, y) 
5 Létezik az egzisztenciális kvantornak egy variánsa, amelyet 31-gyel vagy 3!-Iel jelölünk, és ami azt 


jelenti, hogy , Létezik pontosan egy...". Ugyanez a jelentés kifejezhető egyenlőségállításokkal is, mint 
azt a 8.2. alfejezetben bemutattuk. 
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A kvantorok sorrendje tehát nagyon fontos. Még világosabbá válik, ha zárójeleket is 
alkalmazunk. A Vx (dy Szeret(x, y)) azt jelenti, hogy mindenkinek van egy bizonyos 
tulajdonsága, nevezetesen, az a tulajdonság, hogy mindenki szeret valakit. Másrészt, a 
Jx(Vy Szeret(x, y)) azt jelenti, hogy a világban valakinek van egy bizonyos tulajdon- 
sága, méghozzá az, hogy mindenki szereti őt. 

Zavart okozhat, ha két kvantort használunk ugyanazzal a változó névvel. Tekintsük 
a következő mondatot: 


Vx [Korona(x) V (dx Fivér(Richárd, x))1 


Itt az x a Fivér(Richárd, x)-ben egzisztenciális kvantorral van ellátva. Az a szabály, 
hogy a változó ahhoz a legbelső kvantorhoz tartozik, ami a változót megemlíti, és utá- 
na a változó nem tárgya semmilyen kvantor alárendelésnek." 

A másik módja a megoldásnak: Ax Fivér(Richárd, x), ahol ez egy Richárdról szóló 
mondat (hogy neki van egy fivére), és nem pedig az x-ről. Így tehát annak nem lesz ha- 
tása, ha kívül elé teszünk egy V.x-et. Éppen így írhattuk volna azt is, hogy Jz Fívér(Ri- 
chárd, 7). Mivel ez tévesztés forrása lehet, ezért mindig különböző változókat fogunk 
használni. 


Az V és az 3 kapcsolata 


A két kvantor valójában szoros kapcsolatban áll egymással a negáción keresztül. Ha va- 
laki azt mondja, hogy mindenki utálja a paszternákot, akkor egyúttal azt ís mondja, 
hogy nem létezik olyan valaki, aki szereti azt, és fordítva: 


Vx —Szereti(x, Paszternák) egyenértékű azzal, hogy -3x Szereti(x, Paszternák) 


Egy lépéssel tovább is mehetünk. A , Mindenki szereti a fagylaltot" mondat azt jelen- 
ti, hogy nincs olyan, aki ne szeretné a fagylaltot: 


Vx Szereti(x, Fagylalt) egyenértékű azzal, hogy —dx Szereti(x, Fagylalt) 


Mivel az V igazából egy konjunkció minden univerzumbeli objektum felett, az 3 pedig 
egy diszjunkció ugyanezen objektumok felett, ezért nem meglepő, hogy eleget tesznek 
a De Morgan-szabályoknak. A kvantorral és a kvantor nélkül álló mondatokra vonatko- 
26 De Morgan-szabályok a következők: 








Vx-Pz--iP -IIA-0 sz -(PVO 
-Wx P.z 3x -P -(PAO) z -Pv-e 

VxP E -3xk-P PAD -6Pv-0) 
3x P z -Wx -P PVO  z (-PA-O 


7 Az azonos változónevet használó kvantorok interferenciára való képessége teszi lehetővé a kiterjesz- 
tett interpretációk kissé barokkos mechanizmusát a kvantorral ellátott mondatok szemantikájában. Az in- 
tuitíve legegyértelműbb megközelítése az objektumok helyettesítésének az x minden előfordulásánál 
nem működik a példánkban, mert az x-et a Fivér(Richárd, x)-ben , foglyul ejtené" a behelyettesítés. A ki- 
terjesztett interpretációk ezt pontosabban oldják meg, mert a belső kvantor hozzákapcsolása az x termhez 
kioltja a külső kvantor hatását. 
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Így valójában nincs szükségünk egyszerre mind az V-ra, mind az 3-re, mint ahogy nincs 
szükség egyszerre mind az A-ra és az V-ra sem. Mégis, mivel az olvashatóság fonto- 
sabb, mint a takarékosság, használni fogjuk mindkét kvantort. 


Egyenlőség 


Az elsőrendű logika a predikátumok és termek korábban leírt használatán kívül még 
egy lehetőséget nyújt atomi mondatok készítésére. Alkalmazbatjuk az egyenlőségszim- 
bólumot (eguality symbol) állítások készítésére is annak kifejezésére, hogy két term 
ugyanarra az objektumra vonatkozik. Például az 


Apja(János) — Henrik 


azt mondja ki, hogy az Apja(János) által hivatkozott objektum és a Henrik által hívat- 
kozott objektum azonos. Mivel az interpretáció rögzíti bármely term referenciáit, egy 
egyenlőségi állítás igazságának megállapításához elegendő azt látni, hogy a két term 
referenciái ugyanazok az objektumok. 

Az egyenlőségszimbólumot használhatjuk arra, hogy tényeket állapítsunk meg egy adott 
függvényről, ahogy ezt megtettük az imént az Apja szimbólummal. Alkalmazhatjuk az 
egyenlőségszimbólumot negációval is, annak a kifejezésére, hogy két term nem ugyanaz 
az objektum. Ha azt akarjuk állítani, hogy Richárdnak legalább két fivére van, ezt írjuk: 


J3xy Fivértx, Richárd) A Fivérfy, Richárd) N-(x — y) 
Annak a mondatnak, hogy 
Bay Fivértx, Richárd) A Fivérfy, Richárd) 


nem ugyanaz a szándékolt jelentése. Ez a mondat például igaz a 8.2. ábrán látható 
modelire, ahol Richárdnak csak egy fivére van. Hogy ezt megértsük, figyeljük meg azt 
a kiterjesztett interpretációt, ahol mind az x, mind az y János királyhoz van rendelve. 
A —(x — y) viszont már nem eleme a modellnek. Az x z y-t néha rövidítésként hasz- 
náljuk a —(x — y) kifejezésére. 
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Most, hogy definiáltunk egy kifejező logikai nyelvet, itt az ideje, hogy megtanuljuk 
használni is. A legjobb módja ennek az, ha példákon keresztül tesszük. A logikai szin- 
taxis többféle aspektusának illusztrálására már láttunk néhány egyszerű mondatot; 
ebben az alfejezetben az egyszerű tárgyterületeknek (domain) több szisztematikus 
reprezentációját fogjuk bemutatni. A tudásreprezentációban egy tárgyterület a világ- 
nak az a része, amelyről valamilyen tudást akarunk kifejezni. 

Az elsőrendű tudásbázisokra definiálható KIJELENT/KÉRDEZ eljárások rövid leírásával 
fogunk kezdeni. Ezután megvizsgáljuk a családi kapcsolatok, a számok, a halmazok és 
a listák tárgyterületét, valamint a wumpus világot. A következő alfejezet egy még alap- 
vetőbb példát (elektronikus áramkörök) tartalmaz, míg a 10. fejezet mindent áttekint az 
univerzumban. 


312 8. ELSŐRENDŰ LOGIKA 
Kijelentések és lekérdezések az elsőrendű logikában 


A mondatokat a KUELENT használatával adjuk hozzá a tudásbázishoz, pontosan úgy, 
mint az ítéletlogikában. Ezeket a mondatokat kijelentéseknek (assertions) nevez- 
zük. Például, azt jelenthetjük ki, hogy János egy király, és hogy a királyok szemé- 
lyek: 


KIELENÜZTB, Király(János)) 
KIELENT(TB, Vx Király(x) 5 Személyíx)) 


Kérdéseket tehetünk fel a tudásbázisról a KÉRDEZ használatával. Például a: 
KERDEZ(TB, Király(János)) 


igazat ad vissza. A KÉRDEZ-zel feltett kérdéseket lekérdezéseknek (gueries) vagy cé- 
loknak (goals) nevezzük (ne tévesszük össze azokkal a célokkal, amelyek az ágensek 
kívánt állapotát írják le). Áhalánosságban, bármely lekérdezésre, ami logikusan követ- 
kezik a tudásbázisból, igenlő választ kell adni. Például ha adott a két kijelentés az elő- 
ző bekezdésben, akkor a 


KÉRDEZ(TB, Személy(János)) 


lekérdezésnek szintén azt kell visszaadnia, hogy igaz. Kvantorokat alkalmazó kérdése- 
ket is feltehetünk, úgy mint: 


KÉRDEZ(TB, 3x Személy(x)) 


Erre a lekérdezésre a válasz lehet igaz, de ez nem segít, és nem is szórakoztató. (Ez 
olyasmi, mintha a , Meg tudná mondani mennyi az idő?" kérdésre azt válaszolnánk, 
hogy , Igen".) Egy egzisztenciális változókkal ellátott lekérdezés valójában azt a kérdést 
teszi fel, hogy , Van-e olyan x, amely...", és úgy oldjuk meg, hogy megadunk egy ilyen 
x-et. Egy ilyen típusú válasz szokásos formája egy helyettesítési lista (substitution 
list) vagy lekötési lista (binding list), amely változó/term párok halmaza. Ebben az 
esetben, amikor csak két kijelentés szerepel, a válasz az (x/János) lenne. Ha több lehet- 
séges válasz van, akkor a helyettesítések listáját kapjuk vissza. 


A rokonsági tárgyterület 


Az első példában a családi kapcsolatokat, vagyis a rokonsági tárgyterületet vizsgáljuk 
meg. Ez a tárgyterület tartalmaz olyan tényeket, mint , Erzsébet Károly anyja" és 
s.Károly Vilmos apja", valamint olyan szabályokat, mint , Valakinek a nagyanyja az ő 
szülőjének az anyja". 

Egyértelmű, hogy ennek a tárgyterületnek az objektumai személyek. Két unáris pre- 
dikátumunk lesz a Férfi és a Nő. A rokonsági kapcsolatokat — szülőség, testvérség, 
házasság és így tovább — bináris predikátumokkal fogjuk ábrázolni: Szülője, Testvére, 
Fivére, Nővére, Gyereke, Lánya, Fia, Házastársa, Felesége, Férje, Nagyszülője, Uno- 
katestvére, Nagynénje és Nagybátyja. Az Anyja és Apja reprezentálására függvényeket 
fogunk alkalmazni, mivel minden személynek pontosan egy ilyen rokona van (legalább 
is a természet rendje szerint). 
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Leírhatjuk a predikátumokat és a függvényeket úgy, hogy más szimbólumokkal fe- 
jezzük ki, amit róluk tudunk. Például valakinek az anyja, az ő nőnemű szülője: 


Vin,c Anyjatc) — m 6 Nő(m) A Szülőjelm, c) 
Valakinek a férje az ő férfi házastársa: 

Vw, h Férjelh, w) 2 Férfi(h) A Házastársath, w) 
A nő és a férfi diszjunkt kategóriák: 

Vx Férfi(x) 6 -Nőtx) 
A szülője és a gyereke inverz relációk: 

Vvp, c Szülőjetp, c) 5 Gyereke(c, p) 
Egy nagyszülő a szülője valaki szülőjének: 

Vg, c Nagyszülőjelg, c) 6 3p Szülője(g, p) A Szülőjetp, c) 
Egy testvér a másik gyereke ugyanannak a szülőnek: 

Vx, y Testvére(x, y) 6 x my A 3p Szülőjetp, x) A Szülőjetp, y) 
Folytathatnánk így tovább, és a 8.11. feladatban kérni is fogjuk, hogy tegye ezt meg. 

Minden egyes ilyen mondat tekinthető a rokonsági tárgyterület egy axiómájának 
(axiom). Az axiómákat általában a tisztán matematikai tárgyterületekhez kötjük — rövi- 
den meg fogunk vizsgálni néhány axiómát számokra — de valamennyi tárgyterületben 
szükség van rájuk. Az axiómák ellátnak bennünket alapvető ténybeli információkkal, 
amelyekből hasznos következtetéseket vonhatunk le. Rokonsági axiómáink egyúttal 
definíciók (definitions) is; formájuk pedig Vx, y P(x, y) 6 ... . Az axiómák megha- 
tározzák az Anyja függvényt és a Férje, Férfi, Szülője, Nagyszülője és Testvére predi- 
kátumokat más predikátumok felhasználásával. A predikátumok alapvető halmazainál 
(Gyereke, Házastársa és Nő) a definícióinkat már nem tudjuk más predikátumokkal 
leírni. Ez természetes módja annak, ahogyan felépítjük egy tárgyterület reprezentáció- 
ját, és analóg azzal, ahogyan a szoftvereket felépítik primitív könyvtárfüggvények 
szubrutinjainak az egymást követő definícióival. Vegyük észre, hogy a predikátumpri- 
mitíveknek nincs feltétlenül egyetlen kizárólagos halmaza; éppen ilyen jól használhattuk 
volna a Szülője, Házastársa és Férfi predikátumokat. Néhány tárgyterületben, mint azt 
látni fogjuk, nincs egyértelműen meghatározható alaphalmaz. 

Nem minden a tárgyterületről szóló logikus mondat axióma. Néhány közülük tétel 
(theorem) — amelyeket az axiómák vonnak maguk után. Például vizsgáljuk meg a ki- 
jelentést, hogy a testvérség szimmetrikus: 


Wx, y Testvére(x, y) £ Testvérely, x) 


Ez vajon egy axióma vagy egy tétel? Valójában ez egy tétel, amely logikusan következik 
a testvérséget meghatározó axiómából. Ha ezt a mondatot KÉRDEZ-zük a tudásbázistól, 
akkor az eljárásnak az igaz eredményt kell visszaadnia. 

Tisztán logikai nézőpontból egy tudásbázis csak axiómákat, és nem tételeket tartal- 
maz, mert a tételek nem növelik meg a konklúziók halmazát, amelyeket a tudásbázis 
maga után vonz. Gyakorlati szempontból a tételek elengedhetetlenek az új mondatok 
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előállításánál a számítási költségek csökkentéséhez. Nélkülük egy bizonyítási rendszer- 
nek minden egyes alkalommal az első alapelvektől kellene indulnia, mintha egy fizikus- 
nak mindig újra le kellene vezetnie a számítások szabályait az összes új problémánál. 

Nem minden axióma definíció. Néhány axióma általánosabb információkat ír le egyes 
predikátumokról, anélkül hogy létrehozna egy definíciót. Valójában egyes predikátu- 
moknak nincs teljes definíciójuk, mert nem tudunk eleget róluk ahhoz, hogy teljes mér- 
tékben meghatározzuk őket. Például nem létezik egyértelmű befejezése a következő 
mondatnak: 


Vx Személy) 6 ... 


Szerencsére az elsőrendű logika lehetővé teszi számunkra, hogy használjuk a Személy 
predikátumot, anélkül hogy teljes mértékben definiálnánk. Ehelyett részleges pontosí- 
tásokat írhatunk tulajdonságokról, amelyekkel minden személy rendelkezik, és olyan 
tulajdonságokról, amelyek valamit személlyé tesznek: 


Vx Személy(x) 5... 
Vx ... 5 Személy(x) 


Az axiómák lehetnek , csak puszta tények", mint amilyenek a Férfi(Jim) és a Házas- 
társa(Jím, Laura). Az ilyen tények alkotják a speciális probléma példányok leírásait, le- 
hetővé téve speciális kérdések megválaszolását. Ilyenkor az ezekre a kérdésekre adott 
válaszok tételek lesznek, amelyek az axiómákból következnek. Gyakran előfordul, hogy 
az elvárt válasz nem kapható meg - például a Férfi(George) és a Házastársa( George, 
Laura)-ból azt vámánk, hogy kikövetkeztethetőnek kellene lennie annak, hogy Nő(Laura); 
de ez nem következik a korábban megadott axiómákból. Ez annak a jele, hogy egy axió- 
ma hiányzik. A 8.8. feladat ennek a megadását kéri. 


Számok, halmazok és listák 


A számok talán a leglátványosabb példái annak, hogy hogyan építhetünk fe! egy hatalmas 
elméletet axiómák kicsi darabjait használva. Le fogjuk írni a természetes számok (natural 
numbers), vagyis a nem negatív egész számok elméletét. Szükségünk van egy predikátum- 
ra TermSzám, amely igaz lesz minden természetes számra; szükségünk van továbbá egy 
konstansszimbőlumra, ez lesz a 0; valamint egy függvényszimbólumra, az S rekurziót leíró 
függvényre. A Peano-axiómák (Peano axioms) meghatározzák a természetes számokat és 
az összeadást.§ A természetes számoknak egy rekurzív definícióját adjuk meg: 


TermSzám(0) 
Vn TermSzámín) 5 TermSzám(S(n)) 


Ez azt jelenti, hogy a 0 egy természetes szám, és hogy minden n objektumra, ha az n 
egy természetes szám, akkor $(n) is egy természetes szám. Tehát, a természetes számok 
a 0, az 5(0) és az $(S(0)) és így tovább. Szükségünk van axiómákra ahhoz is. hogy 
lezárjuk a rekurziót leíró függvényt: 


§ A Peano-axiómák még tartalmazzák az indukció elvét is, amely inkább a másodrendű logikába tar- 
tozó állítás, mintsem az elsőrendű logikába. Ennek a megkülönböztetésnek a leírását lásd a 9. fejezetben. 
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Vn 0 - Sín) 
Vm n mzna 5(ím) z S(m 


Most meg tudjuk határozni az összeadást az utódfüggvény szempontjából: 


Vm TermSzámím) — 4- (0, m) —m 
Vim, n TermSzámím) A TermSzámín) 5 -t (S(m), n) — S(t-m, n)) 


Az első axióma azt mondja ki, hogy ha hozzáadunk egy 0-t bármely m természetes 
számhoz, akkor m-et kapunk. Figyeljük meg a ,,-t-" bináris függvényszimbólum hasz- 
nálatát a -H(z, 0) termben. A matematika jelölése szerint a termet a következőképpen 
írnánk: m -- 0, infix (infix) jelölés használatával. (Az eddigiekben az elsőrendű logi- 
kához használt jelöléseket prefixnek (prefix) nevezzük.) Azért, hogy könnyebben 
olvashatóvá tegyük a számokról szóló mondatainkat, lehetővé tesszük az infix jelölések 
használatát. Így az S(n)-t leírhatjuk úgy is. hogy n -t 1, ami által a második axióma a 
következő lesz: 


Wm, n TermSzámím) A TermSzámín) 2 (mt) tn—(m-tn ti 


Ez az axióma az utódfüggvény ismételt alkalmazásává egyszerűsíti az összeadást. 

Az infix jelölések használata példa a szintaktikus édességre (syntactic sugar), ami 
nem más, mint az alapszintaxis kiterjesztése vagy rövidítése, a szemantika megváltoz- 
tatása nélkül. Bármely mondat. amely ezt a szintaktikai édességet használja visszaala- 
kítható, egyenértékű mondatot előállítva a hagyományos elsőrendű logikában. 

Mihelyt van egy összeadás-definíciónk, magától értetődik a szorzást ismételt hozzá- 
adásokként definiálni, a hatványozást ismételt szorzásokként, meghatározni az egész 
számok osztását és maradékait, a prímszámokat és így tovább. Így tehát a teljes szám- 
elmélet (beleértve a titkosírást) felépíthető egy konstansból, egy függvényből, egy 
predikátumból és négy axiómából. 

A halmazok (sets) tárgyterületének szintén alapvető szerepe van a matematikában, 
ugyanúgy mint a hétköznapi gondolkodásban is. (Valójában a számelmélet levezet- 
hető a halmazelméletből kiindulva.) Halmazokat szeretnénk reprezentálni, beleértve 
az üres halmazt is. Szükségünk van a halmazok felépítésének egy módjára, amelyben 
vagy hozzá tudunk adni egy elemet a halmazhoz, vagy két halmaz metszetét vagy 
unióját tudjuk képezni. Meg kell tudnunk állapítani, hogy egy elem része-e egy halmaz- 
nak, és szeretnénk megkülönböztetni a halmazokat az olyan objektumoktól, amelyek 
nem halmazok. 

A halmazelmélet hagyományos szókincsét fogjuk használni szintaktikai édességként. 
Az üres halmaz egy konstans, amelynek a jele: ( ). Definiálunk egy unáris predikátu- 
mot, a Halmaz-t, amely minden halmaz esetében igaz. A bináris predikátumok az x € § 
(az x az s halmaz része) és az s; C s2 (az s; halmaz egy részhalmaza, nem feltétlenül 
valódi részhalmaza az s2-nek). A bináris függvények az sz NI 52 (két halmaz metszete), 
az s, U 52 (két halmaz uniója) és az (xls) (a halmaz az x elem s halmazhoz való csat- 
lakozásának eredménye). Az axiómák egy lehetséges sorozata a következő: 


1. Egy halmaz vagy az üres halmaz, vagy azok, amelyeket egy halmaz bővítésével hoz- 
tunk létre: 


vs Halmaz(5) 6 (s — ( D) V (Ax, sz Halmaz(s)) A s — (xls2b) 
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2. Az üres halmaznak nincs hozzáadott eleme, más szóval nincs lehetőség arra, hogy 
az ÜresHalmaz-t szétválasszunk egy kisebb halmazra és egy elemre: 


-axs (xl—() 
3. Egy halmazbeli elem újbóli hozzáadása a halmazhoz nem változtat a halmazon. 
Vx,5 xEs6 s — (xs) 


4. Egy halmaznak csak az az eleme, amit hozzáadunk. Ezt rekurzívan fejezzük ki, ki- 
mondva, hogy x akkor és csakis akkor eleme az s halmaznak, ha s azonos valamilyen 
52 halmaz y elemmel való bővítésével, ahol vagy azonos y x-szel, vagy x eleme s2-nek: 


Vx,s xes 6 [dy.s2 (s- [/loJ A r—yvx E 3 


5. Egy halmaz egy másiknak a részhalmaza, ha az összes első halmazbeli elem eleme 
a második halmaznak: 


Vsp.52 S1C528(VxxESspox€ 57) 
6. Két halmaz akkor és csakis akkor egyenlő, ha egymásnak részhalmazai: 
Vx,Sp52(ss-S)E(s4CSsA sz C sp) 


7. Egy objektum akkor és csakis akkor eleme két halmaz metszetének, ha eleme mind- 
két halmaznak: 


Vx,$p52 XEINSYS(ESJAXE 57) 


8. Egy objektum akkor és csakis akkor eleme két halmaz uniójának, ha a két halmaz 
bármelyikének az eleme: 


Vx, 552 XE(sUSDE(xEsjVx E 57) 


A listák (lists) tárgyköre nagyon hasonló a halmazok tárgyköréhez. A különbség az, 
hogy a listák rendezettek, és ugyanaz az elem több helyen is előfordulhat egy listában. 
Használhatjuk a Lisp szótárát a listákra: a Ni/ az elem nélküli listát jelölő konstans, a 
Cons, az Append, a First és a Rest függvények. A Find egy predikátum, amely azt hajt- 
ja végre a listáknál, mint az Eleme a halmazoknál. A Lisr? egy predikátum, amely csak 
a listákra igaz. Úgy, mint a halmazoknál, a listákról szóló logikai mondatokban ís szo- 
kás használni a szintaktikai édességet. Az üres lista a: ( ]J. A Cons(x, y) termet, ahot az y 
nem üres lista, úgy írjuk, hogy: [xlyI. A Cons(x, Nil) termet (egy lista, amely tartalmaz- 
Za az x elemet) úgy írjuk, hogy: [x]. Több elem listája, mint az (A, B, C], ugyanazt jelen- 
ti, mint az egymásba ágyazott term: Cons(A, Cons(B, Cons(C, Nil))). A 8.14. feladat 
tárgya az axiómák megírása a listák tárgyköréhez. 


A wumpus világ 
A 7. fejezetben megadtunk néhány ítéletlogikai axiómát a wumpus világra. Az ebben 


az alfejezetben szereplő elsőrendű logika axiómái sokkal tömörebbek lesznek, termé- 
szetes módon ábrázolva azt, amit pontosan mondani szeretnénk. 
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Emlékezzünk arra, hogy egy wumpus ágens egy öt elemből álló érzetvektort kap. 
Az ezt leíró elsőrendű logikai mondat, amelyet a tudásbázisban tárolunk, tartalmazza 
mind az érzetet, mind az időpontot amikor ez bekövetkezett, különben az ágens össze- 
keverné, hogy mikor látta azt, amit látott. Az időpontokat jelölő lépésekre egész számo- 
kat használunk. Egy tipikus érzetmondat ilyen lesz: 


ÉrzekIBűz, Szellő, Ragyogás, Nincs, Nincs), 5) 


ltt az Érzet egy bináris predikátum, míg a Bűz és a többi érzet listába rendezett kons- 
tansok. A wumpus világban lejátszódó cselekvéseket a következő logikai termekkel 
reprezentálhatjuk: 


Fordul(Jobbra), ForduKBalra), Előre, Lő, Megragad, Elereszt, Mászik 


Hogy meghatározzuk, melyik cselekvés a legjobb az adott helyzetben, az ágens prog- 
ram létrehoz egy lekérdezést, mint például: 


3a LegjobbCselekvés(a, 5) 


A KÉRDEZ-zel végrehajtjuk ezt a lekérdezést, és vissza fogunk kapni egy lekötési listát, 
mint például: (alMegragad). Az ágensprogram ezután visszaadhatja a Megragad-ot, 
mint elvégzendő cselekvést, de először a KIJELENT felhasználásával közölnie kell a saját 
tudásbázisával, hogy egy Megragad-ot hajt végre. 

A nyers érzetadatok alapján következtethetünk az aktuális állapot bizonyos tényeiről. 
Például: 


Vt, s, g, m, c Érzek(s, Szellő, g, m, c), 1) — Szellő) 
Vt, s, g, m, c Érzet((s, Ragyogás, m, c], )) 2 Ragyogásíi) 


és így tovább. A szabályok a következtetési folyamat egy triviális formáját mutatják, 
amit érzékelésnek (perception) nevezünk, és amelyet a 24. fejezetben fogunk részle- 
tesen tanulmányozni. Vegyük észre az univerzális kvantort az idő (1) felett. Az ítélet- 
logikában minden egyes időlépéshez szükségünk volt a mondatok másolatára. 

Az egyszerű , reflex" viselkedés is leírható kvantorokat alkalmazó implikációs mon- 
datokkal. Például lehet egy ilyen mondatunk: 


Vt Ragyogás(t) - LegjobbCselekvés(Megragad, 1) 


Mivel adottak az érzet és az előző bekezdésekben megismert szabályok, ez a mondat a 
kívánt konklúziót eredményezné: LegjobbCselekvés(Megragad, 5) — ami azt jelenti, hogy 
a Megragad a legjobb cselekvés, amit végrehajthatunk. Vegyük észre az egybeesést a 
7.20. ábrában az áramkörön alapuló ágensnél e szabály és a közvetlen érzet-cselekvés 
kapcsolat között. Az áramkör jellegéből következően impliciten látja el kvantorral az időt. 

Eddig ebben az alfejezetben az idővel operáló mondatok mind szinkrónok (synchronic), 
azaz egyidejűek voltak, ami azt jelenti, hogy a világ állapotának tulajdonságait vonatkoztat- 
ják ugyanannak a világállapotnak más tulajdonságaihoz. Azokat a mondatokat, amelyek 
lehetővé teszik az időbeliséget figyelembe vevő következtetést diakrónnak (diachronic) 
nevezzük. Például az ágensnek tudnia kell, hogy hogyan kombinálja a megelőző helyzeté- 
ről lévő információt azzal az információval, amely helyzetének meghatározásához szüksé- 
ges. A diakrón mondatok tárgyalását elhalasztjuk a 10. fejezetig, most csak tételezzük fel, 
hogy a helyzetre és más időfüggő predikátumokra vonatkozó következtetések megtörténtek. 
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Bemutattuk az érzeteket és a cselekvéseket, ezután itt az ideje, hogy bemutassuk ma- 
gát a környezetet. Kezdjük az objektumokkal. A négyzetek, a csapdák és a wumpus 
nyilvánvaló szereplők. Elnevezhetnénk minden egyes négyzetet — Négyzetj 2 és így 
tovább - de akkor az a tény, hogy a Négyzet 2 szomszédos a Négyzetj 3-mal, egy extra 
tényt igényelne, és minden egyes négyzetpárnál szükségünk lenne egy ilyen tényre. 
Jobb egy komplex termet használni, amelyben a sor és az oszlop egész számokként 
jelenik meg; például egyszerűen használhatjuk a lista termet: (1, 2]. Bármely két négy- 
zet szomszédossága meghatározható így: 


Vx, y, a, b. Szomszédosí[x, y], [a, b) 6 
[a,b € (fx- 1], 46— Ly], by 11. b.y- 1) 


Minden egyes csapdát elnevezhetnénk, de ez sem lenne megfelelő, méghozzá más okból: 
nincs ok arra, hogy megkülönböztetést tegyünk a csapdák között.? Sokkal egyszerűbb 
használni egy Csapda unáris predikátumot, amely igaz a csapdát tartalmazó négyzetekre. 
Végül. mivel pontosan egy wumpus van csak, ezért egy Wienpus konstans éppen úgy 
megfelelő. mintha egy unáris predikátummal jelölnénk (és a wumpus szempontjából ta- 
lán tiszteletre méltóbb is). A wumpus pontosan egy négyzetben lakik, tehát jó gondolat 
egy függvényt használni ennek a négyzetnek a megnevezésére, ami az Otthon(Wumpus). 
Ez kiküszöböli azt a számos mondatot, amelyre az ítéletlogikában szükségünk van ahhoz, 
hogy megmondjuk, pontosan egyetlen négyzet tartalmaz wumpust. (Még nehezebb hely- 
Zetet teremtene az ítéletlogika számára, ha két wumpus volna.) 

Az ágens helyzete változik az idő haladtával, amit úgy jelölünk, hogy AkkortÁgens, 
s, 2), ami azt jelenti, hogy az ágens az s négyzetnél van t időben. Mihelyt megadtuk az 
aktuális helyzetét, az ágens következtetni tud a négyzet tulajdonságaira a jelenlegi érze- 
te tulajdonságaiból. Például, ha az ágens egy négyzetnél van, és szellőt érzékel, akkor 
az a négyzet szellős: 


Vs,t AkkortÁgens, s, t) A Szellő(i) 5 Szellős(s) 


Hasznos tudni, hogy egy négyzet szellős, mert tudjuk, hogy a csapdák nem tudnak mo- 
zogni. Vegyük észre, hogy a Szellős-nek nincsen időargumentuma. 

Miután felfedeztük, mely helyek szellősek (vagy büdösek) vagy — és ez nagyon 
fontos — nem szellősek (vagy nem büdösek), az ágens ki tudja következtetni, hogy hol 
vannak a csapdák (és hogy hol van a wumpus). Kétfajta szinkrón szabály van, amely 
lehetővé teszi az ilyen következtetéseket: 


"  Diagnosztikus szabályok 
A diagnosztikus szabályok a megfigyelt hatásoktól a rejtett okokhoz vezetnek min- 
ket. A csapdák megtalálásához a legkézenfekvőbb diagnosztikai szabályok azt 
mondják ki, hogyha a négyzet szellős, akkor valamelyik szomszédos négyzet bizto- 
san tartalmaz csapdát: 


Vs Szellősís) 5 3r Szomszédosír. s) A Csapda(r) 


9 Hasonlóan, legtöbbünk nem nevezi meg a madarat, amint elszáll fejünk felett, hogy melegebb vidék- 
re költözzön télen. Egy ornitológus viszont, aki a vonulást mintákat és a túlélési arányokat szeretné tanul- 
mányozni, megnevez minden egyes madarat azáltal, hogy meggyűrűzi őket, mivel a madarakat egyenként 
kell nyomon követnie. 
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és hogyha egy négyzet nem szellős, akkor egyetlen szomszédos négyzet sem tar- 
talmaz csapdát: 


Vs —Szellős(s) — —-J3r Szomszédosír, 5) A Csapda(r) 
E kettő kombinálásával, ezt a bikondicionális mondatot kapjuk: 
Vs Szellősís) 5 3r Szomszédosír, s) A Csapda(r) (8.3) 


.  Ok-okozati szabályok 
Az ok-okozati szabályok a világban lévő okozatiság feltételezett irányát tükrözik: a 
világ néhány rejtett tulajdonsága bizonyos érzetek generálását eredményezi. Például 
egy csapda azt eredményezi, hogy az összes szomszédos négyzet szellős lesz: 


Vr Csapda(r) - WWs Szomszédosír, s) — Szellős(s)] 


és ha az adott négyzettel szomszédos négyzetek egyike sem tartalmaz csapdát, a 
négyzet nem lesz szellős: 


Vs (Vr Szomszédosír, s) 5 -Csapdatr)] — —Szellősts) 


Némi munkával meg lehet mutatni, hogy ezek a mondatok együtt logikusan egyen- 
értékűek a (8.3) egyenletben leírt ekvivalenciamondatokkal. Maga az ekvivalencia 
ís tekinthető ok-okozatinak, mert megmutatja, hogy a Szellős igazságértéke a világ 
állapota alapján határozható meg. 


Azokat a rendszereket, amelyek ok-okozati szabályokat alkalmaznak modellalapú 
következtető (modell-based reasoning) rendszereknek nevezzük, mivel az ok-okozati 
szabályok a környezet működésének modelljét alkotják. A modellalapú és a diagnoszti- 
kus következtetés közötti megkülönböztetés a mesterséges intelligencia számos terüle- 
tén fontos. Az orvosi diagnosztika egy különösen aktív területe a kutatásnak, amelyben 
a tünetek és a betegségek közötti közvetlen asszociációkon alapuló (diagnosztikai meg- 
közelítések) megközelítéseket fokozatosan felváltották az olyan módszerek, amelyek a 
betegség kialakulásának és a betegségtünetek manifesztálódásának egy explicit modell- 
jét használják. Ez a téma a 13. fejezetben újra előkerül. 

Bármelyik reprezentációs formát is használja az ágens, ha az axiómák pontosan és 
teljesen leírják a világ működésének a módját és azt a módot, ahogyan az érzetek létre- 
jönnek, akkor bármely teljes logikai következtetési eljárás az elérhető érzetek megadá- 
sa után ki fogja következtetni a világ állapotának legvalószínűbb lehetséges leírását. 
Így tehát az ágenstervező arra koncentrálhat, hogy a tudást helyesen adja meg, anélkül 
hogy sokat kellene töprengenie a következtetések folyamatain. Láttuk továbbá azt is, 
hogy az elsőrendű logika hasonlóan tömören tudja reprezentálni a wumpus világot, 
mint a 7. fejezetben megadott eredeti magyar nyelvű leírás. 


10 Az emberben van hajlandóság arra, hogy elfelejtse feírni az ehhez hasonló negatív információkat. 
Egy beszélgetés során ez a tendencia teljesen normális — furcsa lenne, ha azt mondanánk: , Van két csé- 
sze az asztalon, és nincs ott három vagy több." Még akkor is. ha a ,.Van két csésze az asztalon" szigorúan 
szólva akkor is igaz, ha három van ott. A IO. fejezetben visszatérünk erre a problémara. 
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A megelőző alfejezet bemutatta az elsőrendű logika használatát a tudás reprezentálásá- 
ra három egyszerű tárgyterületben. Ez az alfejezet a tudásbázis felépítésének általános 
folyamatát írja le — egy folyamatot, amit tudástervezésnek (knowledge engineering) 
nevezünk. A tudásmérnök egy olyan személy, aki egy bizonyos tárgyterületet vizsgál, 
megismeri, hogy mely koncepciók fontosak abban a tárgyterületben, és megalkot egy 
formális reprezentációt a tárgyterületben található objekummokra és relációkra. A tudás- 
tervezés folyamatát az elektronikus áramkör tárgyterületében fogjuk illusztrálni, amely 
már valószínűleg ismerős, így koncentrálhatunk az ezzel járó reprezentációs problé. 
mákra. Az általunk alkalmazott megközelítés speciális célú tudásbázisok kialakításá- 
hoz megfelelő, amelyek tárgyterülete alaposan körülhatárolt, és amelyek lekérdezései- 
nek az egész sorozatát előre ismerjük. Általános célú tudásbázisokat, amelyeket arra 
használunk, hogy lekérdezéseket tegyenek lehetővé az emberi tudás teljes területére vo- 
natkozóan, a 10. fejezetben tárgyaljuk majd meg. 








A tudástervezés folyamata 


A tudástervezési projektek különbözők tárgyukat, tárgykörüket és nehézségüket tekint- 
"ve, de minden ilyen projekt tartalmazza a következő lépéseket: 


1. A feladat beazonosítása. A tudásmérnöknek fel kell vázolnia a kérdések sorát, ame- 
lyekkel a tudásbázis foglalkozni fog, és a tényeknek azokat a csoportjait, amelyek 
minden egyes problémaspecifikus példányban megtalálhatók lesznek. El kell dönte- 
nie például, hogy a wumpus tudásbázisnak képesnek kell-e lennie a cselekvések ki- 
választására, vagy hogy csak az várható el, hogy a környezet elemeivel kapcsolatos 
kérdéseket válaszolja meg. Tudnia kell, hogy az érzékelőktől származó tények leír- 
ják-e a jelenlegi helyzetet. A feladat határozza meg, hogy mely tudást kell tárolni, 
hogy a problémapéldányokban a válaszokat megadhassuk az adott esetre vonatkozó- 
an. Ez a lépés analóg az ágensek tervezésénél látott TKBÉ-folyamattal, amelyről a 2. 
fejezetben írtunk. 

2. A releváns tudás összegyűjtése. A tudásmérnök vagy már szakértője a tárgyterület- 
nek, vagy együtt kell működnie igazi szakértőkkel, hogy megismerje az ő tudásukat 
— ezt a folyamatot tudásmegszerzésnek (knowledge acguisition) nevezzük. Ezen a 
szinten a tudást formálisan nem reprezentáljuk. A cél az, hogy megértsük a tudásbá- 
zis tárgykörét, amit a feladat határol be, és meg kell érteni azt is, hogy a tárgyterület 
hogyan működik a gyakorlatban. 

A wumpus világban, amelyet mesterségesen létrehozott szabályrendszer határoz 
meg, könnyű az idevonatkozó tudásbázist azonosítani. (Vegyük észre azonban, hogy 
a szomszédosság definíciója nem volt explicit megadva a wumpus világ szabályai- 
ban.) A valódi tárgyterületekben a relevancia problémája meglehetősen bonyolult 
lehet — például egy VLSI tervező szimulációs rendszernek figyelembe kell vennie 
a szórt kapacitásokat és a felületi hatásokat. 

3. Meg kell határozni a predikátumok, függvények és konstansok szótárát. Ez azt je- 
lenti, hogy a fontos tárgyterület szintű koncepciókat le kell fordítani logikai szintű 
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nevekre. Ez számos, a megközelítés jellegét tárgyaló kérdést érint. Hasonlóan, mint 
a programozási stílusnak, ennek is jelentős hatása lehet a projekt végső sikerére. 
Például ilyen kérdés, hogy a csapdákat vajon objektumok jelenítsék-e meg vagy egy 
a négyzetekre vonatkozó unáris predikátum? Az ágens iránya függvény legyen-e 
vagy predikátum? A wumpus helyzete az időtől függjön-e? Mihelyt a választás meg- 
történt, az eredmény egy szótár, amit a tárgyterület ontológiájának (ontology) nevez- 
zünk. Az ontológia fogalma egy olyan elméletet takar, ami a létezés természetét írja le. 
Meghatározza, hogy milyen dolgok léteznek, de nem határozza meg a rájuk jellem- 
ző tulajdonságokat, sem a köztük fennálló kapcsolatokat. 

4. A tárgyterületről szóló általános tudás kódolása. A tudásmérnök leírja a szótár ösz- 
szes termjéhez tartozó axiómákat. Ez lerögzíti (amennyire lehetséges) a termek je- 
lentését, és lehetővé teszi a szakértő számára a tartalom ellenőrzését. Ez a lépés 
gyakran feltárja a félreértelmezéseket vagy a hiányosságokat a szótárban, amelyeket 
a 3. lépéshez újra és újra visszatérve, iteratív eljárással javíthatunk. 

5. Az adott probléma példány leírásának kódolása. Ha az ontológia jól átgondolt, ez a 
lépés már könnyű lesz. Egyszerű atomi mondatokat kell az ontológiában már leírt fo- 
galmak példányaira megfogalmazni. Egy logikai ágens számára a problémapéldányo- 
kat az érzékelők biztosítják, amikor a , különálló" tudásbázist kiegészítik mondatok- 
kal ugyanúgy, ahogy a hagyományos programoknak bemeneti adatokat adunk meg. 

6. Lekérdezéseket fogalmazunk meg a következtetési folyamat számára és válaszokat 
vezetünk te. Itt kapjuk meg az eddigi munkánk jutalmát: működtethetjük a következ- 
tetési folyamatot az axiómákon és a problémaspecifikus tényeken, hogy megkapjuk 
a minket érdeklő tényeket. 

7. Szűrjük ki a hibákat a tudásbázisból. Sajnos az első próbálkozásra a kérdésekre kapott 
válaszok nagyon ritkán lesznek helyesek. Pontosabban, a válaszok helyesek lesznek a 
megadott tudásbázis szempontjából, feltételezve, hogy a következtetési folyamat meg- 
felelő, de a válaszok nem azok lesznek, amiket a felhasználó vár. Például ha hiányzik 
egy axióma, akkor bizonyos kérdések megválaszolhatatlanok lesznek a tudásbázis 
alapján. Ilyenkor egy hibajavítási folyamatra van szükség. A hiányzó vagy túl gyenge 
axiómák könnyen megtalálhatók úgy, hogy felfedezzük azokat a helyeket, ahol a kö- 
vetkeztetés lánca váratlanul megszakad. Például ha a tudásbázis tartalmazza az egyik, 
csapdákra vonatkozó diagnosztikus axiómát, 


Vs Szellős(s) — 3r Szomszédosír, s) A Csapda(r) 


de nem tartalmazza a másikat, akkor az ágens soha nem lesz képes bizonyítani a 
csapdák hiányát. A helytelen axiómák azonosíthatók, mivel ezek hamis állítások a 
világról. Például az a mondat, hogy: 

Vx LábakSzámatx, 4) 5 Emlős(x) 


hamis a hüllőkre, kétéltűekre vagy ami még fontosabb, az asztalokra nézve. Ennek ai 
a mondatnak a hamissága a tudásbázis többi részétől függetlenül meghatározható. 
Ezzel szemben egy tipikus programhiba ilyen: 
eltolás - pozíció 41 
Nem lehet ez alapján megmondani, hogy a mondat helyes-e anélkül, hogy megnéz- 
nénk a program többi részét. Például azt, hogy az eltolás-t a jelenlegi pozícióra 


322 8. ELSŐRENDŰ LOGIKA 


vonatkozóan használjuk-e, vagy arra, amely eggyel a jelenlegi pozíció mögött van, 
Vagy arra, hogy a pozíció értéke megváltozott egy másik állítás által, és így az el- 
tolás-t is meg kell változtatni. 
Hogy jobban megértsük ezt a hétlépéses folyamatot, alkalmazzuk most egy kiterjesztett 
példára — az elektronikus áramkörök tárgyterületére. 


Az elektronikus áramkörök tárgyterülete " 


Létrehozunk egy ontológiát és egy tudásbázist, amelynek felhasználásával képesek 
leszünk következtetéseket végezni olyan típusú digitális áramkörökről, mint amilyet a 
8.4. ábra mutat. A tudástervezés hétlépéses folyamatát fogjuk követni, 


A feladat meghatározása 


Számos következtetési feladatot lehet a digitális áramkörökkel kapcsolatban elvégezni. 
A legmagasabb szinten az áramkör funkcionalítását vizsgálhatjuk. Például szabályosan 
ad-e össze a 8.4. ábrán látható áramkör? Ha minden bemenet magas, akkor mi az Az 
kapu kimenetének állapota? Az áramkör szerkezetéről feltett kérdések is érdekesek. 
Például melyek azok a kapuk, amelyek az első bemeneti ponthoz vannak kapcsolva? 
Tartalmaz-e az áramkör visszacsatolásokat? Ebben az alfejezetben ezeket a feladatokat 
vizsgáljuk meg. Léteznek az elemzésnek részletesebb szintjei is, például amelyek az 
időzítés késleltetésével, az áramkör területével, áramfogyasztásával, működtetési költ- 
ségeivel és így tovább kapcsolatosak. Minden egyes ilyen szint vizsgálata további 
ismereteket igényel. 


A releváns tudás összegyűjtése 


Mit tudunk a digitális áramkörökről? A céljainknak megfelelően azt, hogy vezetékek- 
ből és kapukból állnak. A jelek a vezetékeken keresztül áramlanak a kapuk bemeneti 
termináljához, és minden kapu egy jelet hoz létre a kimeneti terminálon, ami aztán egy 
másik vezetéken áramlik. Ahhoz, hogy meghatározzuk, melyek is ezek a jelek, ismernünk 
kell, hogy a kapuk hogyan alakítják át bemeneti jeleiket. Négyféle kaput használunk: az 
AND, az OR és a XOR kapuknak két bemenetük van, míg a NOT kapuknak csak egy. 
Minden kapunak egy kimenete van. Az áramköröknek, hasonlóan a kapukhoz, bemene- 
teik és kimeneteik is vannak. 

Ahhoz, hogy következtetéseket végezhessünk a funkcionalitásról és az összekötteté- 
sekről, nem szükséges magukról a vezetékekről vagy ezek útvonalairól, két vezeték 






U Ez az alfejezet a digitális áramkörök meglehetősen sajátos bemutatására vállalkozik. Miközben nem 
javasoljuk. hogy valaki ez alapján ismerkedjen meg a digitális áramkörökkel, és esetleg az itt bemutatottak 
alapján próbáljon digitális áramköröket tervezni. az itt leénak mindenképpen érdekes nézőpontot tükröznek, 
és érdekes kísérletet jelentenek arra, hogy az elsőrendű logika fogalomkészletével mutassák be a digitális 
áramköröket. (A szerk.) 
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8.4. ábra. Egy C1-es digitális áramkör, amelynek az a célja, hogy egy egybites teljes összeadást végez- 
zen. Az első két bemenet az a két bit, amit össze kel! adni, míg a harmadik bemenet az átvitel. Az első 
kimenet az összeg, míg a második kimenet az átvitel a következő összeadó felé. Az áramkör két XOR, 
két AND és egy OR kaput tartalmaz. 


találkozásánál levő kereszteződéseiről tudást megfogalmazni. Csak a be- és kimenetek 
közötti összeköttetések számítanak — tehát csak azt kell kimondani, hogy egy kimenet 
össze van-e kapcsolva egy másik bemenettel, anélkül hogy meg kellene említeni a veze- 
tékeket, amik valójában összekötik őket. A tárgyterületnek sok más tényezője van, ami 
a mi vizsgálatunkban nem releváns. Ilyen például a különböző elemek mérete, formája, 
színe vagy ára. 

Ha a célunk valami más lenne, és nem a kapuszintű tervezés helyességének ellenőrzé- 
se. akkor az ontológiánk is más lenne. Például ha az érdekelne minket, hogyan lehetne a 
hibákat a hibás áramkörökben megtalálni, akkor valószínűleg jó ötlet lenne a vezetékek- 
kel is foglalkozni az ontológiában, mivel egy hibás vezeték meghamisíthatja a rajta ke- 
resztülhaladó jelet. Az időzítési hibák megtalálásához a kapuk késleltetésével kapcsolatos 
fogalmakat kellene leírni. Ha az érdekelne minket, hogy hogyan lehet egy nyereséges ter- 
méket tervezni, akkor az áramkörök költségének és sebességének a piacon jelen lévő 
egyéb termékekkel történő összehasonlíthatósága lenne fontos. 


A szótár meghatározása 


Tudjuk, hogy áramkörökről, be- és kimenetekről, jelekről és kapukról akarunk beszélni. 
A következő lépés az ezeket reprezentáló függvények, predikátumok és konstansok ki- 
választása. Az egyes kaputípusoktól fogunk indulni, és végül eljutunk az áramkörökig. 

Először is meg kell tudnunk különböztetni egy kaput a többi kaputól. Ezt úgy érjük 
el, hogy konstansokat használunk a kapuk megnevezésére: X1, X2 és így tovább. Habár 
minden kapu a maga egyedi módján kapcsolódik az áramkörhöz, a viselkedése — vagyis 
az a mód, ahogyan átalakítja a bemeneti jeleket kimeneti jelekké — csakis a típusától 
függ. Egy kapu típusának jelölésére!? egy függvényt használhatunk. Például írhatjuk. 


12 Vegyük észre, hogy megfelelő betűkkel kezdődő neveket használtunk — Aj, Xi és így tovább — 
pusztán azért, hogy könnyebben olvashatóvá tegyük a példát. A tudásbázisnak még így is tartalmaznia 
kell a kapuk típusára vonatkozó információkat. 


324 8. ELSŐRENDŰ LOGIKA 


hogy Típus(Xy) — XOR. Ez hozzárendeli az XOR konstansi egy bizonyos kaputípushoz. 
A többi konstans nevei: OR, AND és NOT lesznek. A Típus függvény nem az egyetlen le- 
hetséges módja annak, hogy kódoljuk az ontológiai megkülönböztetést. Használhattunk 
volna egy bináris predikátumot is, mint a Típus(X). XOR), vagy több egyargumentumú 
predikátumot, mint például az XOR(XI). Ezeknek a megoldásoknak bármelyike jól mű- 
ködne, de a Típus függvény választásával kiküszöböltük, hogy szükség legyen egy olyan 
axiómára, amely azt mondja ki, hogy minden egyes kapunak csak egyetlen típusa lehet. 

Ezután megvizsgáljuk a végpontokat (be- és kimeneteket). Egy kapunak vagy áram- 
körnek egy vagy több bemenete, és egy vagy több kimenete lehet. Mindegyiket elne- 
vezhetnénk egyszerűen egy konstanssal, mint ahogy azt a kapukkal tettük. Így az XI 
kapunak olyan végpontjai lennének, mint az X.Beg, az X.Be2 és az X.Kiy. A hosszú, 
összetett elnevezéseket azonban célszerű kerülni. Az. hogy valamit X.Bey-nek neve- 
zünk, nem jelenti azt, hogy ez az X, első bemenete; még ekkor is hozzá kell tennünk 
valamit egy explicit állítást használva. Valószínűleg szerencsésebb egy függvénnyel 
leírni egy kaput, hasonlóan mint, ahogy János király bal lábát elneveztük BalLáb(János)- 
nak. Így tehát jelöljük az X, kapu első bemenetét úgy, hogy: Be(1, X). Egy hasonló Ki 
függvényt használunk a kimenetekre. 

A kapuk közötti összeköttetést reprezentálhatjuk az Összekapcsolt predikátummal, ami 
két végpontot vesz argumentumként, például így: Összekapcsolt Ki(1, XI), Be(1, X2)). 

Végül, ismernünk kell, hogy egy jel magas vagy alacsony állapotban van-e. Erre 
egy lehetőség egy On bináris predikátum használata, és akkor igaz, ha a jel egy vég- 
ponton magas értékű. Ez azonban egy kissé megnehezíti az olyan kérdések feltevését, 
mint például: , Mik a lehetséges értékei a C, áramkör kimenetein lévő jeleknek?" Ezért 
be fogunk vezetni objektumokként két , jelértéket", az 1-et és a 0-t, valamint egy Jel 
függvényt, aminek egy végpont az argumentuma, és ami kijelöli ennek a végpontnak 
a jelértékét. 


A tárgyterülettel kapcsolatos általános tudás kódolása 


Az egyik jele annak, hogy megfelelő ontológiát használunk az, hogy kevés olyan általános 
szabály van, amit később a példányokra specifikussá kellene tennünk. A helyes szótár jel- 
temzője az, hogy minden egyes szabályt világosan és tömören meg tudunk fogalmazni. 
A mi példánkban csak hét egyszerű szabályra van szükségünk, hogy leírjunk mindent, amit 
tudnunk kell az áramkörökről. 


1. Ha két végpont össze van kapcsolva, akkor ugyanaz lesz a jelértékük: 
Vt, 12 Összekapcsoltít, t2) — Jel(tp) — Jel) 
2. A jel minden végpontnál vagy 1, vagy 0 (de soha nem mindkettő): 


Vip Jel) — 1 V Jekt) —0 
1750 


3. Az Összekapcsolt egy felcserélhető (kommutatív) predikátum: 
Vt, 12 Összekapcsolkti, t2) 6 Összekapcsoltítz, to) 
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4. Egy OR kapu kimenete akkor és csak akkor I, ha bármelyik bemenete I: 


Vg Típus(g) — OR 5 
JeKKK(1,g) — 15 Jn Jel(Be(n, 9) —1 


5. Egy AND kapu kimenete akkor és csakis akkor 0, ha bármelyik bemenete 0: 


Vg Típus(g) - AND 5 
JeKKKI, g) — 0 5 Jn Jel(Be(n, g) —0 


6. Egy XOR kapu kimenete akkor és csakis akkor I, ha a bemenetei különbözők: 


Vg Típus(g) — XOR 5 
JeKKi(1, g)) — 1 6 JeKBe(l, g) - Jel(Be(2. e)) 


7. Egy NOT kapu kimenete különbözik a bemenetétől: 
Vg (Típus(g) — NOT) — JeKKi(1, g)) 7 Jel(Be(1, g)) 


A problémaspecifikus példányok kódolása 
A 8.4. ábrán bemutatott áramkör neve C) és az itt következő leírással adjuk meg. Elő- 
ször kategorizáljuk a kapukat: 


Típus(X)—XOR —— Típus(X2) — XOR 
Típus(Ap)— AND Típus(A2) — AND 
Típus(01) — OR 


Ezután leírjuk a köztük fennálló kapcsolatokat: 


ÖsszekapcsolX Ki(1, XI, Be(1, X)) 
Összekapcsolt Ki(1, XI), Be(2, A) 
ÖsszekapcsolkKi(1, Az), Be(l, 0) 
Összekapcsolt Ki(1, Ar), Be(2. Op) 
ÖsszekapcsolKi(1, X2), KI, Cp) 
ÖsszekapcsolkKi(1, 01), Ki(2. C)) 


ÖsszekapcsolkBe(l, C)), Bel, X) 
Összekapcsolt Be(l, C)), Be(l, Ap) 
Összekapcsolt(Be(2, C), Be(2. X) 
Összekapcsoltt Be(2, Cp), Be(2, Ap) 
Összekapcsolt( Be(3, C1), Be(2, X2)) 
Összekapcsolt(Be(3, C1). Be(1. Aa) 


Lekérdezések megfogalmazása 


a következtetési eljárás felé 


Milyen bemeneti kombinációk esetében lenne a C) első kimenete (az összegelem) 0 és 


a Cj második kimenete (a maradék elem) 1? 


31, in, iz JeKBe(l, C))) — ij A JeKBel(2, C))) 





í2 A Jel(Be(3. CY) — iz 


A JeKKKI, C))) — 0 A Je(Ki(2, Cp)) — 


A válaszok az íj, íz és iz változók behelyettesítései úgy, hogy a keletkezett mondat 


következzen a tudásbázisból. Három ilyen behelyettesítés létezik: 


(ia / 1, i2/ 1. i3/0) 


(s / 1, í2/0, iz/ 11 


(i1/0, i2/1, iz/ 1) 
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Melyek a az összeadó áramkör összes végpontjának lehetséges értékhalmazai? 


Bi, i, íz, 01. 02 JeKBe(1, C1)) — íg A JeKBe(2, C1)) — iz 
A JeKBe(3, Cp)) — iz A JEKKKI1. CI) — 04 A JEKKI(2. C)) — 02 


Ez az utolsó lekérdezés egy teljes bemenet-kimenet táblázatot ad meg az eszközre, 
amelyet aztán ellenőrizhetünk, hogy valóban helyesen adja-e össze a bemeneteket. Ez egy 
egyszerű példa az áramkör ellenőrzésére (circuit verification). Az áramkör bemutatott 
definícióját nagyobb digitális rendszerek építésére is felhasználhatjuk, amelyekre aztán 
ugyanez a fajta ellenőrzési folyamat alkalmazható (lásd 8.17. feladat). Sok tárgyterület 
kezelhető egy ehhez hasonló strukturált tudásbázis-fejlesztéssel, amelyekben összetet- 
tebb koncepciókat határozunk meg egyszerűbb koncepciókra építve. 


Hibák kiszűrése a tudásbázisból 
Sokféleképpen perturbálhatjuk a tudásbázist, hogy meglássuk, milyen fajta hibás visel- 
kedések fordulhatnak elő. Például tételezzük fel, hogy kihagyjuk az 1 s 0"? állítást. 
A rendszer ebben a pillanatban már nem lesz képes semmilyen kimenetet sem produ- 
kálni az áramkörben, kivéve, ha a bemenet a 000 vagy az 110. Rábukkanhatunk a prob- 
lémára, ha minden egyes kapu kimenetére rákérdezünk. Például, megkérdezhetjük: 
Ji, i2, 0 Jel(Be(1, C1)) — ip A JeKBe(2, Cp)) — iz A JeKKE(1, X)) 
ami felfedi, hogy az X4-nél nem ismerjük a kimenetet az 10 és a 01 bemenetek esetén. 
Ezután megnézzük az XOR kapu axiómáit az X-re alkalmazva: 
JelKi(l, X)— 1 6 JeKBe(l, X.)) - JeKBe(2, Xp) 
Ha tudjuk, hogy a bemenetek, mondjuk, 1 és 0 voltak, akkor ezt lerövidíthetjük így: 
JeKKi(I,X)-18170 


Most már látható, hogy mi a probléma oka: a rendszer nem képes kikövetkeztetni azt, 
hogy JeKKKI, XI) — I, így meg kell neki mondanunk, hogy 1 — 0. 


8.5. ÖSSZEFOGLALÁS 


Ebben a fejezetben megmutattuk, hogy hogyan használható az elsőrendű logika (first- 
order logic) egy tudásalapú ágens reprezentációs nyelveként. A legfontosabb megálla- 
pítások a következők: 


s A tudásreprezentációs nyelveknek deklaratívnak, kompozíciósnak, kifejezőnek, a szö- 
vegkörnyezettől függetlennek és egyértelműnek kell lenniük. 


13 Ez a fajta kihagyás eléggé gyakori, mert az emberek általában feltételezik, hogy a különböző nevek 
különböző dolgokat takarnak. A logikai programozási rendszerek, amelyeket bővebben a 9. fejezetben 
mutatunk be, szintén megteszik ezt a feltételezést. 
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s A logikák különböznek ontológiai és episztemológiai megáltapításaikban. Amíg 
az ítéletlogika megállapításai csak tények létezésére vonatkoznak, addig az elsőrendű 
logika az objektumok és a relációk létezését is felhasználhatja, így nagyobb kifejező- 
erővel rendelkezik. 

s Egy lehetséges világot vagy modellt az elsőrendű logikában objektumok egy hal- 
maza definiál, a köztük lévő relációk és a rájuk alkalmazható függvények által. 

5. A konstansszimbólumok (constant symbols) objektumokat neveznek meg, a pre- 
dikátumszimbólumok (predicate symbols) relációkat, míg a függvényszimbólu- 
mok (function symbols) függvényeket. Egy interpretáció megadja a leképezést a 
szimbólumok és a modell között. Az összetett termek (complex terms) függvény- 
szimbólumokat rendelnek hozzá a termekhez, hogy nevet adjanak egy objektum- 
nak. Ha megadunk egy interpretációt és egy modellt, a mondat igazságtartalmát 
meghatároztuk. 

" Egy atomi mondat (atomic sentence) egy vagy több termre alkalmazott prediká- 
tumból áll. A mondat csak akkor igaz, ha a predikátum által megnevezett reláció 
fennáll a termek által megnevezett objektumok között. Az összetett mondatok 
(complex sentences) — az ítéletlogikához hasonló módon — összekötőjeleket hasz- 
nálnak, a kvantorok (guantifiers) használata pedig lehetővé teszi általános szabá- 
lyok megfogalmazását is. 

5" Egy tudásbázis építése az elsőrendű logikában a tárgyterület alapos elemzését igényli, 
valamint egy szótár megválasztását és a kívánt következtetések eléréséhez szükséges 
axiómák kódolását. 





Irodalmi és történeti megjegyzések 


Habár már Arisztotelész logikája képes volt objektumok feletti általánosítások kezelé- 
sére, az igazi elsőrendű logika keletkezését Gottlob Frege Begriffschrift (Fogalmak írá- 
sa vagy Fogalmi jelölés: Frege, 1879) c. művének megjelenésétől, a kvantorok beveze- 
tésétől számíthatjuk. A Frege-féle képesség a kvantorok egymásba ágyazása jelentős 
előrelépést jelentett, de az általa alkalmazott jelölésrendszer igen körülményes volt. 
Az elsőrendű logika jelenlegi jelölésrendszere alapvetően Giuseppe Peanótól származik 
(Peano, 1889), a szemantika azonban megegyezik a Frege által bemutatottal. Eléggé 
különös, hogy Peano axiómái nagyrészt Grassmann-nak (Grassmann, 1861) és Dede- 
kindnek (Dedekind, 1888) voltak köszönhetők. 

Az elsőrendű logika fejlődésének fontos akadálya volt az egyváltozós predikátumok 
előtérbe helyezése, illetve a többváltozós predikátumok kizárása. Az egyváltozós pre- 
dikátumokhoz való ragaszkodás általánosan jellemző volt a logikai rendszerekre Arisz- 
totelésztől Boole-ig. A logikai relációk első rendszerezett leírását Augustus De Morgan 
adta (De Morgan, 1864). De Morgan a következő példával mutatta be az arisztotelészi 
logikával nem kezelhető következtetéseket: , Minden ló állat; ezért a ló feje egy állat fe- 
je". Ez a következtetés nem valósítható meg az arisztotelészi rendszerrel, mert bármely, 
a következtetésben alkalmazható szabálynak először az ,.x a feje y-nak" két predikátu- 
mot tartalmazó mondatot kell elemeznie. A relációk logikáját alaposan tanulmányozta 
Charles Sanders Peirce (Peirce, 1870), aki Frege-től függetlenül, néhány évvel később 
szintén kifejlesztette az elsőrendű logikát (Peirce, 1883). 
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Leopold Löwenheim adta meg a modellelmélet rendszerezett leírását az elsőrendű 
logika számára (Löwenheim, 1915). Cikke az egyenlőségszimbólumot már a logika 
szerves részének tekinti. Löwenheim eredményeit Thoralf Skolem fejlesztette tovább 
(Skolem, 1920). Alfred Tarski a halmazelméletet felhasználva megadta az igazság és 
a modellelméleti kielégíthetőség explicit definícióját (Tarski, 1935, 1956). 

Elsősorban McCarthy érdeme az elsőrendű logika alkalmazása az MI-rendszerek 
eszközeként (McCarthy, 1958). A logikán alapuló MI-rendszerek fejlődésében jelentős 
előrelépést jelentett Robinson rezolúciós algoritmusa (Robinson, 1965), ami egy komp- 
lett elsőrendű logikai következtetési folyamat. A rezolúciót a 9. fejezetben fogjuk tár- 
gyalni. A logikai megközelítés alapjaival a Stanfordon sok eredményt értek el. Cordell 
Green kifejlesztett egy elsőrendű logikai következtetési rendszert, a 0A3-at (Green, 
1969a, 1969b), amely ahhoz vezetett, hogy először kíséreltek meg létrehozni egy logi- 
kai robotot a Stanford Research Institute-ban (Fikes és Nilsson, 1971). Az elsőrendű 
logikát Zohar Manna és Richard Waldinger alkalmazta a programokban való következ- 
tetésre (Manna és Waldinger, 1971), majd később Michael Genesereth az áramkörökhöz 
(Genesereth, 1984). Európában a logikai programozást — az elsőrendű következtetés kor- 
látozott változatát — fejlesztették ki a nyelvészeti elemzésekhez (Colmerauer és társai, 
1973) és általános deklaratív rendszerekhez (Kowalski, 1974). A számítógépes logiká- 
val Edinburgh-ban sikeresen foglalkoztak, az LCF (Számítási Funkciók Logikája) pro- 
jekten keresztül (Gordon és társai, 1979). Ezeket a fejlesztéseket a 9. és 10. fejezetben 
követjük nyomon. 

Számos színvonalas, az elsőrendű logika korszerű bevezetését adó írás ismert, Ezek 
közül Ouine műve az egyik legjobban áttekinthető (Ouine, 1982). Enderton írása 
inkább matematikai megközelítést követ (Enderton, 1972). Bell és Machover erősen 
formális leírást készített az elsőrendű logikáról, és ezzel együtt számos bonyolult, a 10- 
gika tárgyterületébe tartozó témáról (Bell és Machover, 1977). Manna és Waldinger a 
számítástechnika oldaláról közelítő, jól olvasható bevezetést készített (Manna és 
Waldinger, 1985). Gallier az elsőrendű logika rendkívül precíz matematikai bemuta- 
tását adta meg, együtt a logika automatikus következtetésre történő alkalmazásának 
részletes tárgyalásával (Gallier, 1986). A Logical Foundations of Artificial Intelligence 
(A mesterséges intelligencia logikai alapjai) (Genesereth és Nilsson, 1987) c. könyv a 
logika alapos bemutatásán kívül az érzeteket és cselekvéseket kezelő logikai ágensek 
első rendszerezett bevezetését nyújtja. 


Feladatok 


8.1. Egy logikai tudásbázis a világot mondatokkal reprezentálja határozott struktúra 
nélkül. Egy analóg (analog) reprezentáció viszont strukturált, ahol a leírás 
struktúrája közvetlenül megfelel a reprezentált dolog struktúrájának. Tekintsük 
egy ország autótérképét mint az országról ismert tények egy részének analóg 
reprezentációját. A térkép kétdimenziós felépítése megfelel a terület kétdimen- 
ziós felszínének. 

(a) Adjon öt példát a térképnyelv szimbólumaira. 
(b) Explicit mondatnak nevezzük az olyan mondatot, amelyet a reprezentáció 
Kétrehozója közvetlenül teír. Az ímplicit mondatok az explicit mondatokból 
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8.2. 


$.3. 


84. 


8.5. 


8.6. 


keletkeznek az analóg reprezentáció tulajdonságai szerint. Adjon három 
példát a térképnyelv implicit és explicit mondataira. 

(c) Adjon az ország fizikai struktúráját leíró tényekre három olyan példát, 
amely nem reprezentálható a térképnyelvvel. 

(d) Adjon két példát olyan tényekre, amelyek egyszerűbben kifejezhetők a tér- 
képnyelvvel, mint az elsőrendű logikával. 

(d) Adjon még két példát analóg reprezentációkra. Melyek az előnyei és a hát- 
rányai ezeknek a nyelveknek? 


Tekintsünk egy tudásbázist, amely csak két kijelentést tartalmaz: P(a) és P(b), 
Ebből a tudásbázisból következik-e az vx P(x)? Magyarázza meg válaszát mo- 
dellek segítségével. 


Érvényes-e a következő mondat: Jr, y x — y? Magyarázza meg. 


Írjon le egy olyan logikai mondatot, hogy minden olyan világban, ahol ez a 
mondat igaz, pontosan csak egy objektum legyen. 


Tekintsünk egy szimbólumszótárat, amely tartalmaz egy c konstansszimbólu- 
mot, pp predikátumszimbólumokat minden egyes k értékre és függvényszimbő- 
lumokat minden egyes X értékhez, ahol 1 £ k £ A. A tárgyterület méretét rög- 
zítsük D-ben. Bármely adott interpretációmodell-kombinációban minden egyes 
predikátum vagy függvény hozzá van rendelve az ugyanazon értékhez tartozó 
relációhoz vagy függvényhez. Feltételezhetjük, hogy a modeliben szereplő 
függvények lehetővé teszik, hogy néhány bemenetnek ne legyen értéke a függ- 
vény számára (vagyis, hogy az érték a láthatatlan objektum). Vezessen le egy 
formulát a lehetséges interpretációmodelI-kombinációk számának megállapítá- 
sára a D elemet tartalmazó tárgyterületben. Ne riassza meg, ha el kell távolíta- 
nia a felesleges kombinációkat. 


Reprezentálja a következő mondatokat az elsőrendű logikában úgy, hogy egy 

következetes szótárt használ (amelyet előzőleg definiálnia kell): 

(a) Néhány diák felvette a franciát 2001 tavaszi félévében. 

(b) Minden diák, aki felveszi a franciát. átmegy a vizsgán. 

(c) Csak egy diák vette fel a görögöt 2001 tavaszi félévében. 

(d) A görögben elért legmagasabb pontszám mindig magasabb a franciában 
elért legmagasabbnál. 

(e) Minden személy okos, aki biztosítást köt. 

( Senki nem köt drága biztosítást. 

(g) Van egy ügynök, aki csak azokkal köt biztosítást, akiknek még nincs köt- 
vényük. 

(h) Van egy borbély, aki minden férfit megborotvál a városban, aki nem borot- 
válkozik. 

(1) Az a személy, aki az Egyesült Királyságban születik, és akinek mindkét 
szülője brit állampolgár vagy ottani lakos, születésénél fogva brit állam- 
polgár. 
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8.7. 


8.9. 


8.10. 


8.11. 


8.12. 


8.13. 


8.14. 


8.15. 
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(j) Az a személy, aki az Egyesült Királyságon kívül születik. és egyik szülője 
született brit állampolgár, az származása alapján brit állampolgár. 

(k) A politikusok bármikor bolonddá tehetnek néhány embert, és minden em- 
bert bolonddá tehetnek egy kis időre, de nem tehetnek bolonddá mindenkit 
örökre. 


Reprezentálja a , Minden német azonos nyelvet beszél" mondatot predikátum- 
kalkulusban. Használja a Beszékx. ) predikátumot, amely jelentse azt, hogy x az 
1 nyelvet beszéli. 


Milyen axiómára van szükségünk, hogy ezt a tény kikövetkeztessük: Nó(Laura), 
ha adottak a tények: Férfi(Jim) és HázastársakíJim, Laura)? 


Írjon egy általános tény- és axiómahalmazt, hogy reprezentálja a következő állí- 
tást: , Wellington hallott Napóleon haláláról"; és hogy helyesen megválaszolhas- 
suk a kérdést: , Hallott Napóleon Wellington haláláróli?". 


Írja át a 7.5. alfejezetben bemutatott ítéletlogikai wumpus világ tényeit elsőren- 
dű logikába. Mennyivel tömörebb ez a változat? 


Készítsen axiómákat, amelyek leírják a következő predikátumokat: Unokája, 
Dédnagyapja, Fivére, Húga, Lánya, Fia, Nagynénje, Nagybátyja, Sógornője, 
Sógora, Unokatestvére. 

Írja le a 8.5. ábrán látható családfa tényeit. Használjon logikai következtető 
rendszert, és minden leírt mondat legyen a következtető rendszer számára 
KIJELENT-ve, és KÉRDEZ-ze meg, hogy ki Erzsébet unokája, ki Diana unokabátyja 
és kik Zara dédszülei. 


Írjon le egy mondatot, amely azt állítja, hogy a 4- egy kommutatív funkció. Kö- 
vetkezik ez a mondat Peano axiómáiból? Ha igen, magyarázza meg, hogy miért, 
ha nem, adjon meg egy modellt, amelyben az axiómák igazak, az Ön mondata 
pedig hamis. 
Magyarázza meg, mi a hibás az € halmaz tagság predikátum következő javasolt 
definíciójával: 

Vx,s x € (xls) 

Vx,5S xEszVy x E [yls) 


A halmazaxiómákat példaként használva, készítsen axiómákat a listák tárgy- 
területére, amelyek tartalmazzák a korábban a fejezetben említett összes kons- 
tanst, függvényt és predikátumot. 


Magyarázza meg, hogy mi a hiba a következő ajánlott definícióban a szomszé- 
dos négyzetekre a wumpus világban: 


Vx, s SzomszédosíIx, y], [x -- 1, y]) A Szomszédosí(x, y], [x,y - 1D 


8.5. ÖSSZEFOGLALÁS 331 


Györgyb4 Mami 
SpencerbfKydd Erzsébet b£ Fülöp Margit 


DianabáKároly . Annab4Márk  AndrásbiSára — Edward 


Z 


Vilmos Harry Péter Zara Beatnx  Eugenie 


8.5. ábra. Egy tipikus családfa. Az ,—" szimbólum a házastársakat köti össze, a nyilak 
a gyerekekre mutatnak, 


8.16. Írja meg a wumpus helyzetének meghatározásához szükséges axiómákat a 
Wumpus konstansszimbólum és a Be(Wumpus, Helyzet) bináris predikátum fel- 
használásával. Ne felejtse el, hogy csak egy wumpus van. 


8.17. Bővítse ki a 8.4. alfejezetben leírt szótárt úgy, hogy definiálja az összeadást az 

"migtf n-bites bináris számokra. Ezután kódolja a 8.6. ábrán látható négybites összeadó 
leírását, és tegye fel azokat a kérdéseket, amelyek szükségesek ahhoz, hogy 
igazoljuk összeadó-helyességét. 


8.18. A fejezetben az áramkör reprezentálása részletesebb a szükségesnél, ha csak az 
áramkör működése érdekel minket. Egy egyszerűbb formula bármely mm beme- 
netű, n kimenetű kaput vagy áramkört leír, egy st -H " argumentumos prediká- 
tum használatával, úgy, hogy a predikátum pontosan akkor igaz, amikor a bemenet 
és a kimenet konzisztens. Például, a NOT-kapukat így írjuk le: NOTTi, 0), amely- 
nél a NOT(0, 1)-et és a NOT(I, 0)-át ismerjük. A kapuk összeállítása a kapu- 
predikátumok összekötésével van definiálva, amelyben a közös változók di- 


Xi X2 XI Xg 


4 bnnh 





2222 2 





8.6. ábra. Egy négybites összeadó 
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rekt összeköttetéseket jeleznek. Például egy NAND áramkört összeállíthatunk 
AND-ekből és NOT-okból: 


Vi, h2, Og 0 NAND(ij, iz, 0) — AND(i4, iz, 0) A NOT(om 0) 


Ezt a reprezentációt felhasználva definiálja a 8.4. ábrán látható egybites összeadót 
és a 8.6. ábra négybites összeadóját, és magyarázza meg, milyen lekérdezéseket 
használna, hogy igazolja a megoldásokat. Milyen fajta lekérdezéseket nem fogad el 
ez a reprezentáció, amelyeket pedig a 8.4. alfejezetben lévő reprezentáció elfo- 
gadott? 


Kérjen útlevéligénylő lapot az Ön saját országába, nevezze meg azokat a szabá- 
lyokat, amelyek az igénylés jogosultságát meghatározzák, és fordítsa le az első- 
rendű logika nyelvére a 8.4. alfejezetben felvázolt lépéseket követve. 


9. KÖVETKEZTETÉS ELSŐRENDŰ 
LOGIKÁBAN 


Ebben a fejezetben definiálunk egy olyan hatékony következtetési mechanizmust, ame- 
lyik képes megválaszolni az elsőrendű logikában feltett kérdéseket. 


A 7. fejezetben meghatároztuk a következtetés (inference) fogalmát, és bemutattuk, 
hogy hogyan érhető el helyes és teljes következtetés az ítéletlogikában. Ebben a fejezet- 
ben kiterjesztjük ezeket az eredményeket, hogy olyan algoritmusokat kapjunk, amejyek 
bármely, az elsőrendű logikában feltehető kérdésre válaszolni tudnak. Ez jelentős ered- 
mény, mivel az elsőrendű logikával többé-kevésbé mindent kifejezhetünk, ha elég 
alaposan végezzük a feladatot. 

A 9.1. alfejezet következtetési szabályokat vezet be a kvantorokra, és megmutatja, 
hogy hogyan lehet — jóllehet nagy erőfeszítések árán — az elsőrendű logikai következ- 
tetést ítéletlogikai következtetésre redukálni. A 9.2. alfejezet leírja az egyesítés (uni- 
fication) ötletét, bemutatva, hogy az egyesítés felhasználásával, hogyan alkothatunk 
következtetési szabályokat, amelyek közvetlenül az elsőrendű logikai mondatokra alkal- 
mazhatók. Ezután a 9.3. alfejezetben megvizsgáljuk az elsőrendű logikai algoritmusok 
három nagy családját: az előrefelé láncolást (forward chaining) és ennek alkalmazását 
a deduktív adatbázisokban (deductive databases) és a produkciós rendszerekben 
(production systems). A hátrafelé láncolást (backward chaining) és a logikai prog- 
ramozást (logic programming) alkalmazó rendszereket a 9.4. alfejezetben tárgyaljuk; 
míg a rezolúció alapú tételbizonyító (theorem-proving) rendszereket a 9.5. alfejezet is- 
merteti. Általánosságban mindig a leghatékonyabb, az adott feladatban reprezentálandó 
tényeket és axiómákat kezelni képes módszert próbáljuk használni. A teljesen általános, 
a tetszőleges elsőrendű logikai mondatokon alkalmazható rezolúciós következtetés álta- 
lában kevésbé hatékony, mint a bizonyos típusú mondatokon alkalmazható előre- vagy 
hátrafelé láncolást használó megoldások. 


9.1. ÍTÉLETLOGIKAI KÖVETKEZTETÉS KONTRA 
ELSŐRENDŰ LOGIKAI KÖVETKEZTETÉS 


Ez és a következő alfejezet bemutatja azokat a gondolatokat, amelyeken a modern l0- 
gikai következtetési rendszerek alapulnak. Néhány egyszerű következtetési szabállyal 
kezdjük, amelyeket kvantorrat ellátott mondatokhoz alkalmazhatunk, hogy a segítségük- 
kel kvantorok nélküli mondatokhoz juthassunk. Ezek a szabályok természetes módon 
elvezetnek minket ahhoz a gondolathoz, hogy az elsőrendű következtetés megvalósít- 
ható azáltal, hogy a tudásbázist ítéletlogikává alakítjuk át, és a már általunk ismert íté- 
letlogikai következtetést használjuk. A következő alfejezet rámutat egy kézenfekvő 
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egyszerűsítésre, amellyel olyan következtetési módszerekhez juthatunk, amelyek köz- 
vetlenül képesek az elsőrendű mondatok felhasználására. 


Kvantorokra vonatkozó következtetési szabályok 


Kezdjük az univerzális kvantorok vizsgálatával. Tételezzük fel, hogy a tudásbázisunk 
tartalmazza a standard hagyományos axiómákat, amelyek szerint minden mohó király 
gonosz: 


Vx Király(x) A Mohó(x) — Gonosz(x) 
Ebből lehetségesnek tűnik kikövetkeztetni a következő mondatokat: 


KirályíJános) A Mohó(János) 5 GonosztJános) 
Király Richárd) A MohótRichárd) — Gonosz(Rtichárd) 
Király(Apja(János)) A Mohó(ApjalJános)) — Gonosz(ApjalJános)) 


Az univerzális példányosítás (Universal Instantiation, UI) szabálya kimondja, hogy 
az adott változó bármely alaptermmel (ground term) (változók nélküli termmel) való 
helyettesítésével elérhető mondatokat kikövetkeztethetjük.! Ahhoz, hogy formálisan le 
tudjuk írni a következtetési szabályokat, a 8.3. alfejezetben bevezetett helyettesítés 
(substitution) fogalmát használjuk. A HELYETTESÍT($, a) fogja jelölni annak az ered- 
ményét, hogy egy 8 behelyettesítést alkalmazunk az a mondathoz. Ekkor a szabály így 
írható le: 
Na 
HELYETTESÍT( (v/gh. a) 


bármely v változóra és g alaptermre. Például a korábban megadott három mondatot meg- 
kaphatjuk a következő helyettesítésekkel (x/János), (x/ Richárd) és (x/Apja(János) 1. 
Az ennek megfelelő egzisztenciális példányosítási (Existential Instantiation) szabály 
az egzisztenciális kvantorra egy kicsivel komplikáltabb. Minden a: mondatra, v változóra 
és olyan k konstans szimbólumra, amely sehol máshol nem jelenik meg a tudásbázisban: 


3va 
HELYETTESÍT((v/k), a) 


Például abból a mondatból, hogy: 





3x Koronat) A Fejéntx, János) 
kikövetkeztethetjük ezt a mondatot: 
Korona(C)) A Fején(C1, János) 


1 Ne keverjük össze ezeket a helyettesítéseket a kiterjesztett interpretációkkal, amelyeket a kvantorok sze- 
mantikájának a meghatározására használtunk. A helyettesítés egy változót cserél le egy termre (egy szintaktikai 
elemre), hogy új mondatot hozzon létre, ezzel szemben egy interpretáció hozzárendel egy változót egy objek- 
tumhoz a tárgyterületben. 
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feltéve, ha a C4 nem jelenik meg sehol máshol a tudásbázisban. Alapjában véve az eg- 
zisztenciális mondat azt mondja ki, hogy van valamely objektum, amely eleget tesz egy 
feltételnek, és a példányosítás folyamata csak névvel látja el ezt az objektumot. 
Ez a név viszont már nem tartozhat más objektumhoz. Egy szép példát találunk a mate- 
matikában: tételezzük fel, hogy tudjuk, létezik olyan szám, amely egy kicsit kisebb, mint 
2,71828, és eleget tesz annak az egyenletnek, hogy: d(x?)/dy — x? az x-re. Adhatunk nevet 
ennek a számnak, mint például e, de hiba lenne olyan nevet adni, amely már egy létező 
objektumhoz tartozik, mint például a 1r. A logikában ezt az új nevet Skolem-konstansnak 
(Skolem constant) nevezzük. Az egzisztenciális példányosítás egy speciális esete egy 
általánosabb folyamatnak, amelyet skolemizációnak (skolemization) nevezünk, és ame- 
lyet a 9.5. alfejezetben mutatunk be. 

Amellett hogy az egzisztenciális példányosítás bonyolultabb, mint az univerzális pél- 
dányosítás, kissé különböző szerepet is játszik a következtetésben. Míg az univerzális 
példányosítást többször is alkalmazhatjuk, hogy sok különböző eredményhez jussunk, 
az egzisztenciális példányosítást csak egyszer végezhetjük el. majd az egzisztenciális 
kvantorral ellátott mondattól megszabadulhatunk. Például amint hozzáadtuk a tudásbá- 
zishoz a Meggyilkol(Gyilkos, Áldozat) mondatot, már nincs szükségünk a 3x Meggyil- 
kol(x, Áldozat) mondatra. Pontosabban megfogalmazva, az új tudásbázis logikailag 
nem ekvivalens a régivel, de tekinthetjük úgy, hogy a következtetés szempontjából ek- 
vivalens (inferentially eguivalent), azaz pontosan akkor kielégíthető, amikor az eredeti 
tudásbázis ís kielégíthető. 





Redukálás ítéletlogikára 


Ha egyszer vannak szabályaink arra, hogy kvantorral ellátott mondatokból hogyan kö- 
vetkeztethetünk kvantor nélküli mondatokra, akkor vissza tudjuk vezetni az elsőrendű 
következtetést az ítéletlogikai következtetésre. Ebben az alfejezetben áttekintjük ennek 
a módszernek a legfontosabb elemeit; a részletekről a 9.5. alfejezetben fogunk szólni. 

Az első gondolat az, hogy éppen úgy, ahogyan egy egzisztenciális kvantorral ellátott 
mondatot felcserélhetünk a mondat egy példányával, egy univerzális kvantorral ellátott 
mondatot is felcserélhetünk a mondat összes lehetséges példányosításainak halmazával. 
Például tételezzük fel, hogy a tudásbázisunk mindössze a következő mondatokat tartai- 
mazza: 


Vx Király(x) A Mohó(x) 5 Gonosz(x) 

Király(János) (9.1) 
MohótJános) 

Fivér(Richárd, János) 


Ekkor alkalmazzuk az univerzális páldányosítást az első mondatra úgy. hogy az összes 
lehetséges alapterm-helyettesítést felhasználjuk a tudásbázisszótárból, ami ebben az 
esetben az (x/János) és az (x/Richárd). Így ezt kapjuk: 


Király(János) A MohótJános) — GonoszíJános) 
Király(Richárd) A Mohó(Richárd) — Gonosz(íRtichárd) 
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és megválhatunk az univerzális kvantorrai ellátott mondattól. Mármost, a tudásbázist 
alapvetően ítéletkalkulus-belinek tekinthetjük, ha az alap atomi mondatokat, mint a 
KirálJános), Mohó(János) stb., ítéletlogikai szimbólumoknak tekintjük. Így tehát a 7. 
fejezetben bemutatott bármely teljes ítéletlogikai algoritmust alkalmazhatjuk, hogy olyan 
következtetéshez juthassunk, mint a GonoszíJános). 

Ez a technika az ítéletlogikai állításokra való visszavezetés (propositionalization), 
amelyet teljesen általánossá tehetünk, mint azt a 9.5. alfejezetben be is fogjuk mutatni. 
Ez azt jelenti, hogy minden elsőrendű tudásbázis és lekérdezés átalakítható ítéletjogikai 
mondatokra úgy, hogy a tudásbázis vonzatai nem változnak. Így tehát van egy teljes 
következtetési folyamatunk vonzatok levezetésére. Vagy talán mégsem? Van egy prob- 
léma: amikor a tudásbázis tartalmaz függvényszimbólumot, a lehetséges alaptermek 
helyettesítéseinek halmaza végtelen! Például ha a tudásbázis megemlíti az Apja szimbó- 
lumot, akkor végtelen számú egymásba ágyazott termeket hozhatunk létre, mint például 
az Apja(ApjalApjatJános))). Az ítéletlogikai algoritmusainknak tehát nehézségeik lesz- 
nek a végtelen nagyságú mondathalmazokkal. 

Szerencsére ismert egy Jacgues Herbrandnak köszönhető híres tétel az előbbi prob- 
lémára (Herbrand, 1930), ami azt mondja ki, hogy ha egy mondat következik az ere- 
deti, elsőrendű tudásbázisból, akkor létezik olyan bizonyítás, amely csak egy véges 
méretű részhalmazt használ fel az ítéletkalkulus-belíre átalakított tudásbázisból. Mivel 
bármely ilyen részhalmazban az alaptermeknek van egy maximális beágyazási mélysé- 
ge, meg lehet találni a részhalmazt úgy, hogy először generáljuk az összes példányt a 
konstans szimbólumokhoz (Richárd és János), azután az összes 1-es mélységű termet 
(Apja(Richárd) és ApjatJános)), majd az összes 2-es mélységű termet, és így tovább 
mindaddig, amíg képesek leszünk megalkotni a vonzatmondat ítéletlogikai bizonyítását. 

Felvázoltuk az elsőrendű következtetés egy megközelítését az ítéletlogikai állítások- 
ra való visszavezetés révén, amely teljes (complete) — tehát bármely következményként 
kapott mondatot bizonyítani tudunk. Ez jelentős eredmény, ha figyelembe vesszük, hogy 
a lehetséges modellek száma végtelen. Másrészt viszont nem tudhatjuk, hogy a mondat 
vonzat-e, amíg a bizonyítás nincs kész. Mi történik, ha a mondat nem vonzata a TB-nek? 
Meg tudjuk-e ezt állapítani? Nos, ahogy ez majd kiderül, az elsőrendű logika esetében erre 
a kérdésre a válasz nemleges. A bizonyítási eljárás tovább folytatódik, egyre mélyebben 
beágyazott termeket generálva, és nem tudhatjuk, hogy a folyamat egy végtelen cikius- 
ba kerül, vagy hamarosan megleljük a bizonyítást. Ez nagyon hasonló a Turing gépek 
leállási problémájához. Alan Turing és Alonzo Church egymástól függetlenül és eltérő 
módon bizonyították be ennek a kérdésnek az eldönthetetlenségére vonatkozó tételt 
(Turing, 1936; Church, 1936). Az elsőrendű logikában a maga után vonzás kérdése 
félig eldönthető (semidecidable), ami azt jelenti, hogy létezik olyan algoritmus, amely 
igent mond minden vonzatmondatra, de nem létezik olyan algoritmus, amely emellett 
képes nemet mondani a nem levezethető mondatokra. 


9.2. EGYESÍTÉS ÉS KIEMELÉS 


Az előző alfejezet bemutatta az elsőrendű következtetésnek azt az értelmezését, amely az 
1960-as évekig létezett. Az éles szemű olvasók (és bizonyára a hatvanas évek elejének lo- 
gikával foglalkozó kutatói) észrevehették, hogy az ítéletlogikai megközelítés nem nagyon 
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hatékony. Például ha megnézzük a Gonosz(x) lekérdezést és az ehhez tartozó tudásbázist 
a (9.1) egyenletben, feleslegesnek tűnik olyan mondatok generálása, mint a Király(íRi- 
chárd) A Mohó(Richárd) 5 Gonosz(Richárd). Valójában a Gonosz( János) mondatra vo- 
natkozó következtetés bárki számára teljesen nyilvánvaló a következő mondatok alapján: 


Vx Királyíx) A Mohó(x) — Gonosz(x) 
Király(János) 
Mohó(János) 


Most megmutatjuk, hogyan tehetjük ezt a számítógép számára is egyértelművé. 


Egy elsőrendű következtetési szabály 


Az a következtetés, hogy János gonosz a következőképpen megy végbe: találjon egy 
x-et, amelyre igaz, hogy x egy király és x mohó, majd következtesse ki, hogy x gonosz. 
Általánosabban, ha van valamely 0 helyettesítés, amely az implikáció premisszáját 
megegyezővé teszi a tudásbázisban már létező mondatokkal, akkor a 6 helyettesítés 
elvégzése után az implikációkövetkezmény részét hozzáadhatjuk a tudásbázishoz. 
Ebben az esetben az (x/János) helyettesítés eléri ezt a célt. 

Tulajdonképpen több feladatot is elvégeztethetünk a következtetés ezen lépésével. 
Tételezzük fel, hogy a Mohó(János) mondat ismerete helyett csak azt tudjuk, hogy min- 
denki mohó: 


Vy Mohóty) (9.2) 


Ebben az esetben is szeretnénk azt a következtetést levonni, hogy Gonosz(János), mivel 
tudjuk, hogy János egy király (ez adott), és hogy János mohó (mert mindenki mohó). Egy 
megfelelő helyettesítés megtalálására van szükségünk ennek elvégzéséhez, mind az imp- 
likációs mondatban, mind az ehhez illesztendő mondatokban található változókra. Ebben 
az esetben az (x/János, y/János) helyettesítés alkalmazása az implikáció Királyíx) és 
Mohó(x) premisszáihoz és a Király(János) és Mohóty) tudásbázis mondatokhoz létrehoz- 
za az azonosságot. Így tehát ki tudjuk következtetni az implikáció konklúzióját. 

Ez a következtetés elvégezhető egyetlen következtetési szabály alkalmazásával, ame- 
lyet általánosított Modus Ponensnek (Generalized Modus Ponens) nevezünk: a p;, pf 
És ag atomi mondatokra, amelyekre létezik olyan 9 helyettesítés, hogy HELYETTESÍT(8, pi) 
— HELYETTESÍT(B, p;) minden i-re, akkor: 


P1.P2.s Pro WLAP2N-APRZ 9) 
HELYETTESÍT(8, 9) 





A szabály n 4 1 premisszát tartalmaz: n számú p; atomi mondatot és egy implikációt. 
A konklúzió a g konzekvenciára történő helyettesítés alkalmazásának az eredménye. 
A mi példánkra ezt így alkalmazhatjuk: 


PI - Király(János) Pi — Király(x) 
pi - Mohó(y) P2—Mokó €x) 
0 — (x/János, y/János) 4 — Gonosz(x) 


HELYETTESÍT(Ő, ag) — GonoszíJános) 
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Könnyű megmutatni, hogy az általánosított Modus Ponens helyes következtetési szabály. 
Először is, megfigyelhetjük, hogy bármely p mondatra (amelyeknek változóiról feltéte- 
lezzük, hogy univerzális kvantorokkal vannak ellátva) és bármely € helyettesítésre: 


pH HELYETTESÍT(8, p) 


Ez hasonlóan igazolható, mint az univerzális példányosítás szabály, és alkalmazható 
olyan 6-ra, amely kielégíti az általánosított Modus Ponens szabály feltételeit. Így tehát, 
a pf..... Pp -ből következtethetjük, hogy: 


HELYETTESÍT(Ő, pf) A ... A HELYETTESÍT(8, p,y) 
és apj A ... A Pn 7 4 implikációból ezt következtethetjük, hogy: 
HELYETTESÍT, pi) A ... A HELYETTESÍT(, p,) —- HELYETTESÍT(B, 9) 


Mivel a 8 az általánosított Modus Ponensben úgy van definiálva, hogy: HELYETTE- 
SÍT(B, p/) — HELYETTESÍT(Ő, p;) minden í-re; ebből kifolyólag a kér mondatból az első 
pontosan illeszkedik a másodiknak a premisszájához. Így tehát a HELYETTESÍT(B, g) kö- 
vetkezik a Modus Ponensből. 

Az általánosított Modus Ponens egy kiemelt (lifted) változata a Modus Ponensnek — 
átemeli a Modus Ponenst az ítéletlogikából az elsőrendű logikába. Látni fogjuk a feje- 
zet későbbi részében, hogy kifejleszthetjük az előrefelé láncolás, a hátrafelé láncolás és 
a 7. fejezetben bemutatott rezolúciós algoritmusok kiemelt változatait is. A kiemelt 
következtetési szabályok legfontosabb előnye az ítéletlogikára történő átalakítással 
szemben az, hogy csak azokat a helyettesítéseket hajtják végre, amelyek bizonyos 
következtetések végrehajtását teszik lehetővé. Egy potenciális korlát az, hogy egy bizo- 
nyos szempontból az Általánosított Modus Ponens kevésbé általános, mint a Modus 
Ponens (lásd 265. oldal): a Modus Ponens bármely a mondatot megenged az implikáció 
bal oldalán, ezzel szemben az Általánosított Modus Ponens speciális formátumot kíván 
meg erre a mondatra. Csak abban az értelemben nevezhető általánosítottnak, hogy tet- 
szőleges számú p/-re alkalmazható. 


Egyesítés 


A kiemelt következtetési szabályok olyan helyettesítések megtalálását igénylik, ame- 
lyek a különböző logikai kifejezéseket látszólag azonossá teszik. Ezt a folyamatot egye- 
sítési lépésnek (unification) nevezzük, ami kulcsfontosságú eleme minden elsőrendű 
következtetési algoritmusnak. Az EGYESÍT algoritmus vesz két mondatot, és visszaad 
egy rájuk vonatkozó egyesítést (unifier), ha létezik ilyen: 


EGYESÍT(p, g) — 8, ahol HELYETTESÍT(8, p) — HELYETTESÍT(Ő, 9) 


Nézzünk meg néhány példát arra, hogy az EGYESÍT-nek hogyan kell viselkednie. Téte- 
Tezzük fel, hogy van egy Ismer(János, x) lekérdezésünk: kit ismer János? Erre a kérdésre 
néhány választ úgy találhatunk, hogy megkeressük az összes mondatot a tudásbázisban, 
amely egyesíthető az Ismer(János, x)-szel. Itt vannak az egyesítési eredmények négy 
különböző, a tudásbázisban előforduló mondatra. 
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EgGYyesír(Ismer(János, x), Ismer(János, Júlia)) — (x/Júlia) 
EGYEsíT(IsmertJános, x), Ismerfy, Lajos)) — (x/Lajos, y/János) 
EgYEsíT(Ismer(János, x), Ismerfy, Anyjaty))) — (y/János, x/Anyja(János)) 
Egyesír(ismeríJános, x), Ismer(x, Erzsébet)) — sikertelen 


Az utolsó egyesítés sikertelen, mert az x nem tudja a János és az Erzsébet értékeit 
egyszerre felvenni. Emlékezzünk arra, hogy az Ismertx, Erzséber) azt jelenti, hogy: 
Mindenki ismeri Erzsébetet", így képesnek kellene lennünk azt kikövetkeztetni, hogy 
János ismeri Erzsébetet. A probléma abból származik, hogy a két mondat történetesen 
ugyanazt a változónevet, az x-et használja. A problémát úgy kerülhetjük el, hogy az 
egyesítendő mondatokban átnevezzük a változókat (standardizing apart) úgy, hogy 
elkerüljük a nevek egybeeséseit. Például átnevezhetjük az x-et az Ismer(x, Erzsében)- 
ben például z17-re (egy tetszőleges új változónévre) anélkül, hogy a jelentését megvál- 
toztatnánk. Most már működik az egyesítésünk: 


EGYESsír(IsmertJános, x), Ismer(zi7, Erzsébet)) — (x/Erzsébet, zyy/János) 
A 9.7. feladat tovább vizsgálja az átnevezés szükségességének problémáját. 





function EGYESÍTLx, y, 6) returns egy helyettesítést, hogy az x és az y megegyező legyen 
ínputs; x, egy változó, lista vagy egy összetétel 
). egy változó, lista vagy egy összetétel 
6, az eddig felépített helyettesítés (választható, az üres kizárva) 


1f80 — kudarc then return kudarc 

else if x — y then return 0 

else if VÁLTOZÓY(x) then return EGYESÍT-VÁLT(x, y, 0) 

else if VÁLTOZÓ?(y) then return EGYESÍT-VÁLT(y, x, 0) 

else if ÖSSZETÉTEL ?(x) and ÖSSZETÉTEL?(y) then 

return EGYESÍT(ARGOK([x], ARGOK[y], EGYESÍT(VÁL[x], VÁL[y], 0)? 

else if LISTA?(x) and LISTAy) then 

return EGYESÍT(MARADÉK[x], MARADÉK[y], EGYESÍT(ELSŐ[x], ELsőfy), 09) 
else return kudarc 





function EGYESÍT-VÁLT(vált, x, 8) returns egy helyettesítés 
inputs: vált, egy változó 

x, bármely kifejezés 

4, az eddig felépített helyettesítések 


if (vált/ért) € 8 then return EGYESsÍT(ért, x, 8) 

else íf (x/érr) € 8 then return EGYESÍT(érn, vál, 6) 

else if ELŐFORDUL-PRÓBA?( vált, x)€-re then return kudarc 
else return hozzáad (válr/x) 9-hoz 








9.1. ábra. Az egyesítési algoritmus. Az algoritmus összehasonlítja a bemenetek felépítését elemről elemre. 
A 8 helyettesítés. amely az EGYESÍTÉS argurnenturna, útközben épül fel, és arra használjuk, hogy meggyő- 
ződjünk arról, hogy a későbbi összehasonlítások konzisztensek lesznek az általunk előzőleg létrehozott 
lekötésekkel. Egy összetett kifejezésben, mint például az F(A, B), a VÁL függvény kiveszi az F függvény- 
szimbólumot, és az ARGOK függvény kiveszi az (A, B) argumentumlistát. 
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Még egy további nehézségen kell túljutni. Azt mondtuk, hogy az EGYESÍT olyan 
helyettesítéseket ad vissza, amelyek a két argumentumot látszólag azonossá teszi. 
Azonban több különböző ilyen egyesítés létezhet. Például az EGYESÍT(IsmerítJános, x), 
Ismertfy, 2)) visszaadhatja azt is, hogy: (y/János, x/z), vagy azt is, hogy: (y/János, x/Já- 
nos, z/János). Az első egyesítési lépés azt eredményezi, hogy: IsmertJános, 2), ezzel 
szemben a második azt adja, hogy: Ismer(János, János). A második eredményt meg- 
kaphatjuk az elsőből is egy további helyettesítés hozzáadásával: (z/János). Láthatjuk, 
hogy az első egyesítés általánosabb, mint a második, mert kevesebb korlátozást ad meg 
a változók értékeire. Azt állapíthatjuk meg, hogy minden egyesítendő kifejezéspárra 
létezik egy legáltalánosabb egyesítés (most general unifier), amely egyedi a változók 
átnevezésében. Ebben az esetben ez: (y/János, x/z). 

A legáltalánosabb egyesítések kiszámításához a 9.1. ábrán láthatunk egy algorit- 
must. Az eljárás igen egyszerű: egy rekurzív algoritmussal egymással párhuzamosan 
tárjuk fel a két kifejezést, felépítve az egyesítést, kivéve akkor, ha a struktúrákban a 
két megfelelő elem nem illeszkedik. Van egy drága lépés: amikor egy változót kell egy 
komplex termhez illesztünk, meg kell vizsgálni, hogy a változó előfordul-e a termben; 
ha igen, akkor az illesztés sikertelen. mert nem tudunk konzisztens egyesítést meg- 
alkotni. Ez a lépés az úgynevezett előfordulási próba (occur check), amely az algo- 
ritmus komplexitását az egyesítendő kifejezés méretével négyzetesen növekvővé teszi. 
Néhány rendszer, beleértve az összes logikai programozási rendszert, egyszerűen 
kihagyja az előfordulási próbát, és ennek eredményeként a következtetésük nem he- 
lyes. Más rendszerek időben lineáris komplexitású, ennél összetettebb algoritmusokat 
használnak. 


Tárolás és visszakeresés 


A KIJELENT és a KÉRDEZ függvények, amelyek szerepe, hogy informálják és lekérdez- 
ZÉk a tudásbázist, két egyszerűbb függvényt, a TÁROL és a BETÖLT függvényeket hasz- 
nálják fel. A TÁROL(5) eltárol egy s mondatot a tudásbázisban, míg a BETÖLT(g) vissza- 
adja az összes egyesítést, amelyet a g lekérdezés felhasználásával lehet létesíteni a 
tudásbázis illeszthető mondataival. A probléma, amivel illusztráltuk az egyesítést — az 
összes olyan tény megtalálása, amely egyesíthető az Ismer(János, x)-szel — a BETÖLT 
egyik példája. 

A TÁROL és a BETÖLT megvalósításának legegyszerűbb módja, hogy a tudásbázisban 
az összes tényt egyetlen hosszú listán tároljuk, és egy g lekérdezés megválaszolásakor 
meghívjuk az EGYESÍT(g, s5)-t minden s mondatra a listán. Ez az eljárás nem hatékony, 
de működik, és egyelőre elég a fejezet további részének megértéséhez. Az alfejezet hát- 
ralévő része áttekinti azokat az eljárásokat, amelyekkel a visszakeresést hatékonyabbá 
tehetjiik, így ezt első olvasásra átugorhatjuk. 

A BETÖLT függvényt azzal tehetjük hatékonyabbá, hogy biztosítjuk, hogy az egyesí- 
tési lépést csak olyan mondatokkal kíséreljük meg, amelyeknél van egyáltalán esély az 
egyesítésre. Például nincs értelme, hogy megpróbáljuk az egyesítést az Ismer(János, x)-re 
és a Fivér(Richárd, János)-re. Elkerülhetjük az ilyen egyesítési lépéseket, ha indexeljük 
(indexing) a tényeket a tudásbázisban. Egy egyszerű séma, amit predikátum indexelés- 
nek (predicate indexing) nevezünk, beteszi az összes Ismer tényt egy verembe és az 
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összes Fivér tényt egy másikba. A vermek egy hash-táblában? tárolhatók, hogy hatéko- 
nyan elérhessük őket. 

A predikátumok indexelése hasznos, ha sok predikátumszimbólum van, de csak kevés 
állítás az egyes szimbólumokhoz. Néhány alkalmazásban azonban sok mondat tartozik 
egy adott predikátumszimbólumhoz. Például tételezzük fel, hogy az adóhatóságok nyo- 
mon akarják követni, hogy ki alkalmaz kit, és ezeket a kapcsolatokat egy Alkalmaz(x, y) 
predikátum használatával írjuk le. Ez egy igen nagy verem lenne, akár munkaadók mil- 
lióival és alkalmazottak tízmillióival. Egy olyan kérdés megválaszolása, mint az Alkal- 
maz(x, Richárd), a predikátumok indexelésével az egész verem átböngészését igényelné. 

Egy ilyen lekérdezés esetében segítene, ha a tényeket mind a predikátummal, mind 
a második argumentummal indexelnénk, például úgy, hogy egy kombinált hash-tábla 
kulcsot használunk. A kulcsot egyszerűen előállíthatjuk a lekérdezésből, és pontosan 
visszakereshetjük közvetlenül azokat a tényeket, amelyek egyesíthetők a lekérdezéssel. 
Más lekérdezésekhez, mint amilyen az Alkalmaz(AIMA.org, y), szükségünk van arra, 
hogy a tényeket a predikátum és az első argumentum kombinálásával indexeljük. Így 
aztán a tényeket tárolhatjuk többszörös indexkulcsok alatt, azonnal hozzáférhetővé téve 
minden, a ténnyel egyesíthető lekérdezés számára. 

Ha adott egy tárolandó mondat, akkor létre lehet hozni az indexeket az összes lehetsé- 
ges vele egyesíthető lekérdezéshez. Arra a tényre, hogy Alkalmaz(AIMA.org, Richárd), 
ezek a lekérdezések: 


AlkalmaztAIMA. org, Richárd) Az AIMA.org alkalmazza Richárdot? 


Alkalmaz(x, Richárd) Ki alkalmazza Richárdot? 
Alkalmaz(AIMA. org, y) Kit alkalmaz az AIMA.org? 
Alkalmazíx, y) Ki alkalmaz kit? 


Ezek a lekérdezések egy bennfoglalási hálót (subsumption lattice) alkotnak, amint az a 
9.2. (a) ábrán látható. A hálónak van néhány érdekes tulajdonsága. Például a háló bármely 
csomópontjának a gyereke a szülőjéből egy egyszerű behelyettesítéssel megkapható, és a 
legmagasabb" közös leszármazottja bármely két csomópontnak a legáltalánosabb egye- 
sítőjük használatával érhető el. A háló részeiből bármely alaptény szisztematikusan létre- 





Alkalmaztx, y) Alkatmaztx. 3) 


Alkalmaz(x, Richárd)  Alkalmaz(AIMA.org,y) Alkalmaz, János) Alkalmazíx, x) AlkatmaztjJános, y) 


Alkalmaz(AIMA. org, Richárd). Alkalmaz(János, János) 
(a) b 





9.2. ábra. (a) A bennfoglalási háló, amelynek a legalacsonyabb csomópontja ez a mondat: Alkal- 
maz(AIMA. org, Richárd). (b) A bennfoglalási háló arra a mondatra, hogy: AtkatmazíJános, János). 


2 A hash-tábla információk tárolására és visszakeresésére szolgátó olyan adatstriktúra, amelyeket rögzített 
kulcsokkal indexelünk. Gyakorlati okokból egy hash-táblát tekinthetünk olyannak, mint amelynek a tárolási és 
a visszakérdezési ideje állandó, akkor is, ha a tábla nagyon nagy számú elemet tartalmaz. 
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hozható (9.5. feladat). Egy ismétlődő konstansokkal rendelkező mondatnak egy kissé más 
hálója van, ezt a 9.2. (b) ábrán láthatjuk. A függvényszimbólumok és a változók az eltá- 
rolandó mondatokban még érdekesebb hálófelépítéseket tesznek szükségessé. 

A séma, amelyet leírtunk, nagyon jól működik, amikor a háló csak kisszámú csomó- 
pontot tartalmaz. Egy n argumentumú predikátumra a háló 0(2") csomópontot tartalmaz. 
Ha a függvényszimbólumok használata megengedett, akkor a csomópontok száma szin- 
tén exponenciális a tárolandó mondat termjeinek függvényében. Ez rendkívül nagy számú 
indexet eredményezhet. Egy ponton az indexelés elveszti előnyeit az összes index tárolá- 
sának és fenntartásának problémája miatt. Ez ellen egy rögzített stratégia bevezetésével 
próbálhatunk védekezni úgy, hogy csak azokon a kulcsokon tartunk fenn indexeket, ame- 
lyek predikátumokból és az egyes argumentumokból állnak. Egy másik megoldás, hogy 
egy adaptív tervet használunk, amely mindig olyan indexeket hoz létre, amelyek megfe- 
lelnek az aktuális lekérdezéstípus igényeinek. A legtöbb MI-rendszerben a tárolni kívánt 
tények száma elég kicsi ahhoz, hogy a hatékony indexelés problémáját megoldottnak 
tekintsük. Az ipari és kereskedelmi adatbázisok esetében jelentős technikai fejlesztések 
történtek a feladat megoldására. 


9.3. ELŐREFELÉ LÁNCOLÁS 


Az ítéletlogikai határozott klózokra már megadtunk egy előrefelé láncolási algorit- 
must a 7.5. alfejezetben. A gondolat egyszerű: kezdjük a tudásbázisban szereplő ato- 
mi mondatokkal, és alkalmazzuk a Modus Ponenst előrefelé haladva, új atomi monda- 
tokat hozzáadva, egészen addig, amíg további következtetések már nem végezhetők. 
Most megmutatjuk, hogyan alkalmazzuk az algoritmust az elsőrendű határozott klózok- 
ra, és hogyan valósíthatjuk ezt meg hatékonyan. A határozott klózok, mint például a 
Helyzet 5 Válasz különösen hasznosak az olyan rendszerek számára, amelyek újonnan 
érkezett információk alapján végeznek következtetéseket válaszként. Számos rendszert 
tervezhetünk ilyen módon, és ezekben az esetekben az előrefelé láncolással történő 
következtetés sokkal hatékonyabb lehet, mint a rezolúciós tételbizonyítás. Ebből az kö- 
vetkezik, hogy gyakran érdemes megpróbálni olyan tudásbázist építeni, amely csak 
határozott klózokat használ, és így elkerülhetjük a rezolúcióval járó nehézségeket. 


Elsőrendű határozott klózok 


Az elsőrendű határozott klózok nagyon emlékeztetnek az ítéletlogikai határozott 
klózokra (lásd 272. oldal). Az ilyen klózok olyan literálok diszjunkciói, amelyek közül 
pontosan egy diszjunkt pozitív. Egy határozott klóz vagy egy atomi mondat, vagy egy 
implikáció, amelynek a feltétel része pozitív literálok konjunkciója, és amelynek követ- 
kezménye egyetlen pozitív literál. A következő mondatok elsőrendű határozott klózok: 


Király(x) A Mohó(x) — Gonoszíx) 
Király(János) 
Mohóty) 
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Eltérően az ítéletlogikai literáloktól, az elsőrendű Iiterálok tartalmazhatnak változókat, 
amely esetben a változókat univerzális kvantorral ellátottnak tételezzük fel. (A határo- 
zott klózok írásánál általában elhagyjuk az univerzális kvantorokat.) A határozott klóz 
egy megfelelő normál forma, hogy az általánosított Modus Ponensszel alkalmazhassuk. 
Nem minden tudásbázist lehet átalakítani határozott klózok halmazává, az egyetlen po- 
zitív literális korlátja miatt, de sokat igen. Gondoljuk át a következő problémát: 

A törvény kimondja, hogy bűntény az, ha egy amerikai polgár fegyvert ad el egy Amerikával ellen- 

séges nemzetek. A Nono ország, amely ellensége Amerikának, fel van szerelve rakétákkal, és eze- 

ket a rakétákat mind West ezredes adta el, aki amerikai. 


Be fogjuk bizonyítani, hogy West bűnöző. Először leírjuk a tényeinket elsőrendű hatá- 
rozott klózokként. A következő alfejezet fogja bemutatni, hogy az előrefelé láncolás al- 
goritmus hogyan oldja meg a problémát. 


-rDűntény az, ha egy amerikai polgár fegyvert ad el egy Amerikával ellenséges 
nemzetnek": 

Amerikai(x) A Fegyverfy) A Ellenségesíz) A Elad(x, z, y) 5 Bűnözőtx) (9.3) 
s:Nono... fel van szerelve rakétákkal." Azt a mondatot, hogy 3x Birtokol(Nono, x) A 
Rakéta(x) átalakítjuk két határozott klózzá Egzisztenciális Eliminációval, egy új kons- 
tans, az My bevezetésével: 


Birtokok Nono, M) (9.4) 

Rakéta(tM)) (9.5) 
,.És ezeket a rakétákat mind West ezredes adta el": 

Rakéta(x) A Birtokol(Nono, x) 5 Elad(West, x, Nono) (9.6) 
Tudnunk kell még, hogy a rakéták fegyverek: 

Rakéta(x) 5 Fegyvertx) (9.7) 
és hogy Amerika ellensége , ellenségesnek" számít: 

Ellensége(x, Amerika) 5 Ellenséges(x) (9.8) 
s. West ezredes. . ., aki amerikai": 

Amerikai( Wes?) (9.9) 
s: Nono ország, amely ellensége Amerikának..." 

EllenségeNono, Amerika) (9.10) 


A vidásbázis nem tartalmaz függvényszimbólumokat, és így egy példája a Datalog 
(Datalog) tudásbázisok osztályának — ami függvényszimbólumok nélküli elsőrendű 
határozott klózok halmaza. Látni fogjuk, hogy a függvényszimbólumok hiánya sokkal 
könnyebbé teszi a következtetést. 
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Egy egyszerű előrefelé láncolási algoritmus 


Az első előrefelé láncolási algoritmus, amit megvizsgálunk, nagyon egyszerű lesz, 
amint azt láthatjuk a 9.3. ábrán. Az algoritmus az ismert tényekből kiindulva végrehajtja 
az összes olyan szabályt, amelynek premisszái ki vannak elégítve, és ezek következmé- 
nyeit hozzáadja az ismert tényekhez. Ez az eljárás addig ismétlődik, amíg a kérdést meg 
nem válaszoltuk (feltételezve, hogy csak egy válaszra van szükségünk), vagy amikor 
már nem tudunk új tényeket a tudásbázishoz hozzáadni. Vegyük észre, hogy egy tény 
nem számít , újnak", ha csak átnevezése (rename) egy már ismert ténynek. Egy mondat 
átnevezése egy másiknak, ha az alkalmazott változók neveitől eltekintve megegyeznek. 
Például a Szereti(x, Fagylalt) és a Szereti(y, Fagylalt) mondatok egymás átnevezésének 
számítanak, mert csak az x és az y választásában különböznek. A két mondat jelentése 
megegyezik: mindenki szereti a fagylaltot. 

Az előző bűntényproblémánkat fogjuk felhasználni az ERL-EL-KÉRDEZ. algoritmus 
bemutatásához. Az implikációs mondatok a (9.3), (9.6), (9.7) és a (9.8). Két iterációs lé- 
pés szükséges: 


s Az első iterációban a (9.3) szabály nem elégítette ki a premisszákat. 
A (9.6) szabályt kielégíti az (x/ Mi) és az Elad(West, My, Nono) hozzáadása. 
A (9.7) szabályt kielégíti az (x/M4) és a Fegyver(M) hozzáadása. 
A (9.8) szabályt kielégíti az (x/Nono) és az Ellenséges(Nono) hozzáadása. 


s A második iterációban a (9.3) szabályt kielégíti az (x/ West, y/M1, z/Nono), és hozzá- 
adjuk azt, hogy: Bűnöző( West). 


function ERL-EL-KÉRDEZ(TB, a) returns egy helyettesítés. vagy hamis 
inputs: TB, a tudásbázis, elsőrendű határozott klózok halmaza 
a, a lekérdezés, egy atomi mondat 
local variables: iíj, a minden egyes iterációk során kikövetkeztetett új mondatok 


repeat until az új üres 
new-(1 
for each r mondatra in 7B do 
(Pr A... A Pn 5 9) — VÁLTOZÓ-ÁTNEVEZÍT) 
for each 8 olyan mint HELYETTESÍT(, pp, A ... A Pp) — HELYETTESÍTÁB, pf A ... A pp) 
néhány pl ,..., Pp-re a TB-ben 
9" — HELYETTESÍTŐ, 9) 
4t a" nem egy már a TB-ben meglévő mondat átnevezése vagy új then do 
hozzáad g" az új-hoz 
6 — EGYESÍT(G", a) 
if 6 nem sikertelen then return 9 
hozzáad tíj-at a TB-hez 
return hamis 














9.3. ábra. Egy koncepcionálisan egyszerű, de kevéssé hatékony előrefelé láncolási algorítmus. Minden 
egyes iterációban hozzáadja a 7B-hez az összes atomi mondatot, amelyet egy lépésben az implikációs 
mondatokból és a 7B-ben már meglévő atomi mondatokból kikövetkeztethetünk. 
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9.4. ábra. Az előrefelé láncolás algoritmus által generált bizonyítási fa a bűntény példára. A kiinduló 
tények az alsó sorban jelennek meg, az első iterációban kikövetkeztetett tények a középső sorban, míg 
a második iterációban kikövetkeztetett tények a legfelső sorban. 


A 9.4. ábra bemutatja a generált bizonyítási fát. Vegyük észre, hogy új következtetések 
már nem lehetségesek ezen a ponton, mivel minden mondatot, amelyet kikövetkeztethet- 
nénk az előrefelé láncolással, már explicit módon tartalmaz a 7B. Egy ilyen tudásbázist 
a következtetési folyamat fix pontjának (fixed point) nevezzük. Az elsőrendű határozott 
klózok előrefelé láncolásával létrehozott fix pontok hasonlítanak az ítéletlogikai előrefe- 
lé láncolással (lásd 273. oldal) generáltakhoz. A leglényegesebb különbség az, hogy egy 
elsőrendű fix pont tartalmazhat univerzális kvantorral ellátott atomi mondatokat. 

A ERL-EL-KÉRDEZ-t könnyű kielemezni. Először is megállapítható, hogy az eljárás 
helyes (sound), mivel minden következtetés csak az általánosított Modus Ponens alkal- 
mazása, amelyről már igazoltuk, hogy helyes. Másodszor. teljes (complete) a határozott 
klózokat tartalmazó tudásbázisokra, ami azt jelenti, hogy képes minden olyan lekérde- 
zést megválaszolni, amely következik bármely határozott kózokból álló tudásbázisból. 
A Datalog tudásbázisok esetére, amelyek nem tartalmaznak függvényszimbólumokat, 
a teljesség bizonyítása meglehetősen egyszerű. Először megszámoljuk a TB-hez hozzá- 
adható tényeket, amely szám meghatározza az iterációk maximális számát. Legyen a k 
ez a maximális érték (argumentumok száma) az adott predikátumokra, p a predikátu- 
mok száma és n a konstansszimbólumok száma. Egyértelmű, hogy nem lehet pn" kü- 
lönböző alapténynél több, tehát ennyi iteráció után az algoritmus el fog érni egy fix 
pontot. Ezután már az ítéletlogikai előrefelé láncolás bizonyításánál leírtakhoz nagyon 
hasonlóan érvelhetünk (lásd 273. oldal.) Az ítéletlogikai teljes eljárás átalakítását egy 
elsőrendű teljes eljárássá a 9.5. alfejezetben mutatjuk majd meg. 

Függvényszimbólumokat is tartalmazó általános határozott klózok esetében az ERL- 
EL-KÉRDEZ végtelen számú új tényt generálhat, így ilyenkor óvatosabbnak kell lennünk. 
Ha egy lekérdezésre adható válaszmondat levezethető a 7B-ből, akkor Herbrand tételét 
kell alkalmaznunk, hogy biztosítsuk, hogy az algoritmus megtalál egy bizonyítást (lásd a 
9.5. alfejezetet a rezolúciós esetre). Ha a lekérdezésre nincs válasz, akkor az algoritmus 
néhány esetben nem tud leállni. Például ha a tudásbázis a Peano-axiómákat tartalmazza, 


TermsSzám(0) 
Vn TermSzámín) 5 TermSzám(S(n)) 
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akkor az előrefelé láncolás hozzáadja a TermSzámt5(0)), TermSzám(S(S(0))), 
TermsSzám(S(S(S(0)))) mondatokat és így tovább. Általánosságban ezt a problémát nem 
lehet kikerülni. Hasonlóan, mint az általános elsőrendű logikában, a határozott klózok- 
kal való következtetés félig eldönthető. 


Hatékony előrefelé láncolás 


A 9.3. ábrán látható előrefelé láncolási algoritmust inkább a megértés megkönnyítése 
céljából mutattuk be, és nem mint egy hatékonyan végrehajtható algoritmust. A komp- 
lexitásnak három lehetséges forrása van. Először is, az algoritmus , belső hurka" elvégzi 
az összes lehetséges egyesítés megtalálását, ahol egy szabály premisszája egyesíthető a 
TB egy alkalmas tényhalmazával. Ezt gyakran mintaillesztésnek (pattern matching) 
nevezzük, és igen költséges lépés. Másodszor, az algoritmus újra ellenőriz minden sza- 
bályt minden iterációban, hogy megvizsgálja, hogy a premisszák ki vannak-e elégítve, 
még olyankor is, amikor nagyon kevés változtatást végzünk a tudásbázisban az egyes 
ciklusokban. Végül, az algoritmus számos olyan tényt is generálhat, melyek irreleván- 
sak a cél szempontjából. Mindhárom problémaforrást meg fogjuk vizsgálni. 


Szabályok illesztése az ismert tényekhez 


A szabályok premisszáinak a TB tényeihez történő illesztése egyszerű problémának 
tűnhet. Például tételezzük fel, hogy a következő szabályt akarjuk alkalmazni: 


Rakéta(x) — Fegyvertx) 


Ezután meg kell találnunk az összes tényt, amely egyesíthető a Rakéta(x)-szel. Egy 
megfelelően indexelt tudásbázisban ez elvégezhető a tények számával lineáris időben. 
Vizsgáljunk meg egy szabályt, mint amilyen például a: 


Rakéta(x) A BirtokokNono, x) 5 EladWest, x, Nono) 


Itt is megkereshetjük a Nono által birtokolt összes objektumot objektumonként konstans 
idő alatt. Ezután minden egyes objektumra meg tudjuk vizsgálni, hogy az rakéta-e. 
Amennyiben a tudásbázis sok Nono által birtokolt objektumot tartalmaz és nagyon ke- 
vés rakétát, akkor azonban célszerűbb lenne először az összes rakétát megkeresni, és 
aztán ellenőrizni, hogy azokat Nono birtokolja-e. Ez a konjunkt sorrendezés (con- 
junct ordering) probléma: találjunk egy olyan sorrendet, amely a szabály premissza 
részének konjunktjait megoldja úgy, hogy ezzel a teljes költséget minimalizáljuk. 
Megmutatható, hogy az optimális sorrend megtalálása önmagában is NP-nehéz, de egy jó 
heurisztika elérhető. Például ilyen a legkorlátozottabb változó (most constrained 
variable) heurisztikája, amelyet az 5. fejezetben a kényszerkielégítési problémákra hasz- 
náltunk. Ez azt a logikát követi, hogy rendezzük sorba a konjunktokat úgy, hogy először 
a rakétákat keressük, ha kevesebb rakéta van, mint Nono által birtokolt objektum. 

A kapcsolat a mintaillesztés és a kényszer kielégítése között valójában nagyon szoros. 
Bármelyik konjunktot úgy tekinthetünk, mint az általa tartalmazott változók korlátozá- 
sát — például, a Rakétatx) egy unáris korlátozás az x-en. Ezt a gondolatot kiterjesztve, 
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(ér) Küknya, ét) A Külínya, da) A 

(o) Küllét, g) A Küllét, da) N 
Külkg, údw) A Kükg, da) A 

(ya) Kül(údw, v, ét) A Kül(údw, da) A 
0 (pw) Kül(v, da) 5 Színezhető 0) 

SZ Kül(Piros, Kék)  KülPiros, Zöld) 


() Kül(Zöld, Piros) Kül(Zöld, Kék) 


KüKkKék, Piros) Kül(Kék, Zöld) 


(a) (b) 


9.5. ábra. (a) Ausztrália térképének kiszínezését bemutató kényszergráf (5.1. ábra). (b) A térképszínező 
kényszerkielégítési probléma egy határozott klózzal reprezentálva. Vegyük észre, hogy a változók tárgy- 
területe a KÚL-re megadott alaptények konstansai áltat implicit módon definiáltak. 


minden véges tárgyterületű kényszerkielégítési problémát kifejezhetünk egyszeri határozott 
klózként, néhány társított alapténnyel kiegészítve. Vizsgáljuk meg az 5.1. ábrán látható tér- 
képszínezési problémát, amelyet a 9.5. (a) ábrán újra bemutatunk. Egy ezzel megegyező 
formulát adtunk meg egy határozott klóz formájában a 9.5. (b) ábrán. Világos, hogy a Szí- 
nezhető() konklúzió csak akkor kikövetkeztethető, ha a kényszerkielégítési problémának 
van egy megoldása. Mivel a kényszerkielégítési problémák általában magukba foglalják 
a 3SAT problémákat különleges esetekként, levonhatjuk azt a következtetést, hogy egy 
határozott klóz illesztése egy tényhalmazhoz NP-nehéz. 

Elég elkeserítőnek tűnhet, hogy az előrefelé láncolás tartalmaz egy NP-nehéz illesz- 
tési problémát a belső hurokban. Három módja van annak, hogy felvidítsuk magunkat: 


s Emlékezhetünk arra, hogy a legtöbb szabály a valódi tudásbázisokban kisméretű és 
egyszerű (mint a bűntény példa szabályai), és nem nagy és komplex (mint a 9.5. áb- 
rán látható kényszerproblémánál). Az adatbázisok területén fel szokták tételezni, 
hogy mind a szabályok mérete, mind a predikátumok argumantumszáma egy konstans- 
sal megadható korlát alatt marad, és így csak az adatkomplexitás (data complexity) 
miatt kell aggódni — vagyis a következtetés komplexitása miatt, ami az adatbázisban lé- 
vő alaptények számának függvénye. Könnyű megmutatni, hogy az előrefelé láncolás 
adatkomplexítása polinomiális. 

.  Tekinthetjük a szabályok azon csoportját, amelyekre az illesztés hatékony tud lenni. 
Alapjában véve minden Datalog klózt tekinthetünk úgy, mint ami egy kényszerkielé- 
gítési problémát határoz meg, így az illesztés kivitelezhető akkor, ha a megfelelő 
kényszerkielégítési probléma is nyomon követhető. Az 5. fejezet leírja a kényszer- 
kielégítési problémák néhány praktikusan megoldható családját. Például ha a kény- 
szergráf (egy olyan gráf, amelynek a csomópontjai változók és az élei kényszerek) fát 
formáz, akkor a kényszerkielégítési probléma lineáris időben megoldható. Pontosan 
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ugyanez a szabály áll fenn a szabályillesztésre. Például ha eltávolítjuk Dél-Ausztrá- 
liát a 9.5. ábráról, akkor az új klóz a következő lesz: 


Kül(nya, ét) A Küllét, g) A Kül(g, údw) A Kül(údw, v) 2 Színezhetől) 


Ez megfelel az 5.11. ábrán bemutatott redukált kényszerkielégítési problémának. 
A faszerkezetű kényszerkielégítési problémák megoldására használt algoritmusokat 
közvetlenül alkalmazhatjuk a szabályillesztés problémájára. 

s És végül dolgozhatunk azon, hogy megszüntessük a felesleges szabályillesztési kísér- 
leteket az előrefelé láncolási algoritmusban, amely a következő alfejezet témája lesz. 


Inkrementális előrefelé táncolás 


Amikor a bűntény példán bemutattuk az előrefelé láncolás működését, akkor csaltunk, 
nevezetesen abban, hogy kihagytunk néhány szabályillesztést, amelyet a 9.3. ábrán be- 
mutatott algoritmus elvégzett. Például a második iterációban a: 


Rakéta(x) 5 Fegyver(x) 


szabály (ismét) illeszthető a Rakéta(M)-hez, és természetesen a Fegyver(M)4) konklúziót 
már ismerjük, így semmi sem történik. Az ilyen felesleges szabályillesztést elkerülhetjük, 
ha figyelembe vesszük a következő megfigyelést: Minden, a 1-edik iterációban kikövet- 
keztethető új tény levezetéséhez szükséges legalább egy, a t — 1 ciklusban kikövetkezte- 
tett új tény felhasználása. Ez azért igaz, mert bármely olyan következtetés, amely nem 
igényel egy új tényt a f — 1 ciklusból, már elvégezhető lett volna a ? — 1 ciklusban. 

Ez a megfigyelés természetes módon elvezet minket egy inkrementális előrefelé lán- 
colási algoritmushoz, ahol a : ciklusban csak akkor ellenőrzünk egy szabályt, ha annak 
premisszája tartalmaz egy p; konjunktot, amely egyesíthető egy pf ténnyel, és amelyre 
újonnan következtettünk a r( — 1 ciklusban. A szabályillesztő lépés aztán rögzíti a p;-t, 
hogy illeszkedjen a p;( -hez, de lehetővé teszi, hogy a szabály többi konjunktja illeszked- 
jen bármely megelőző ciklus tényeihez. Ez az algoritmus pontosan ugyanazokat a ténye- 
ket generálja minden egyes ciklusban, mint amelyeket a 9.3. ábrán látható algoritmus, de 
annál sokkal hatékonyabb. 

Megfelelő indexeléssel könnyű megtalálni azokat a szabályokat, amelyeket egy 
adott tény kielégíthetővé tehet. Valójában számos rendszer egy ilyen frissítési módban 
működik, ahol az előrefelé láncolás minden egyes olyan tényre aktualizálódik, ame- 
lyet KIJELENT-ettünk a rendszernek. A következtetések sorban végigveszik a szabályok 
halmazát, amíg el nem érik a fix pontot, és ez a folyamat a következő új ténynél újra 
kezdődik. 

A tudásbázisban lévő szabályoknak tipikusan csak egy kis töredékét eredményezi 
egy adott tény hozzáadása. Ez azt jelenti, hogy jelentős mennyiségű felesleges mun- 
kát végzünk néhány ki nem elégített premisszát is tartalmazó részleges illesztések 
ismételt létrehozásával. A bűntény példánk túl kicsi ahhoz, hogy ezt megfelelően be- 
mutassuk, de vegyük észre, hogy egy részleges illesztést az első ciklusban már létre- 
hoztunk az: 


Amerikaitx) A Fegyverfy) A Eladtx, y, z) A Ellenségesíz) — Bűnözőtx) 
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szabály és az Amerikai(West) tény között. Ezt a részleges illesztést aztán kiselejtezzük, 
de újraépítjük a második ciklusban is (amikor a szabály sikeres). Hatékonyabb lenne 
megőrizni, és fokozatosan kiegészíteni újabb részleges illesztésekkel, amikor az új 
tények beérkeznek, ahelyett hogy kiselejteznénk őket. 

A rete algoritmus? volt az első, amely alaposan foglalkozott ezzel a problémával. 
Az algoritmus feldolgozza a tudásbázis szabályait, hogy létrehozzon egy adatfolyam- 
hálózatot, amelyben minden csomópont egy literál egy szabály premissza részéből. Vál- 
tozó lekötések áramlanak a hálózaton, megszűrve azokat, amelyek nem illeszkednek egy 
literálhoz. Ha egy szabályban két literálnak ugyanaz a változója — például Elad(x, y, z) 
A Ellenséges(z) a bűnöző példában -, akkor a literálokhoz tartozó lekötések egy egyen- 
lőségi csomóponton mennek keresztül. Egy változó lekötésnek, amely elér egy csomó- 
pontot egy n argumentumú literálnál úgy, mint az Elad(x, y, z), várakoznia kell, mielőtt 
a folyamat újra kezdődne, amíg a többi változóhoz tartozó lekötéseket is létrehozzuk. 
Egy adott pontban a rete háló állapota megadja a szabályok összes, addig elvégzett 
részleges illesztéseit, és így elkerülhető a jelentős újraszámolás. 

A rete hálók, és más, hatékonyságot növelő fejlesztések mindig is jelentős szerepet 
játszottak az úgynevezett produkciós rendszerekben (production systems), amelyek 
az első széles körben használt előrefelé láncolási rendszerek voltak.! Az XCON szakér- 
tői rendszer (eredetileg R1-nek hívták, McDermott, 1982) egy produkciós rendszer fel- 
építését felhasználva készült. Az XCON néhány ezer szabályt tartalmazott számítógép- 
tartozékok konfigurációinak megtervezésére a DEC cég vásárlóinak számára. Ez volt 
az egyik első igazi kereskedelmi siker a szakértő rendszerek feltörekvő piacán. Sok más 
hasonló rendszer épült ugyanezt a technológiát felhasználva, amelyet be is építettek egy 
általános célú programozási nyelvbe, az OPS-5-be. 

A produkciós rendszerek a kognitív architektúrákban (cognitive architectures), 
mint például az ACT (Anderson, 1983) vagy a SOAR (Laird és társai, 1987), is népsze- 
rűek. A kognitív architektúrák az emberi gondolkodás modelljei. Az ilyen rendszerekben 
a rendszer , munkamemóriája" az ember rövid távú memóriáját modellezi, és a produkált 
következmények a hosszú távú memória részei. A működés minden egyes ciklusában 
a produkciókat a tények munkamemóriájához illesztik. Egy olyan következmény, 
amelynek feltételeit kielégítik, hozzátehet és kitörölhet tényeket a működő memóriából. 
Az adatbázisokkal ellentétben a produkciós rendszerekben gyakran sok szabály és vi- 
szonylag kevés tény van. Megfelelően optimalizált illesztési technológiával néhány 
modern rendszer képes valós időben működni több mint egymillió szabállyal is. 





Irreleváns tények 


Úgy tűnik, hogy a rossz hatékonyság problémájának az utolsó forrása az előrefelé lán- 
colásban a megközelítésből fakad, ez már az ítéletlogikai kontextusban is felmerült. 
(lásd 7.5. alfejezet). Az előrefelé láncolás az ismert tényeken alapuló összes lehetséges 
következtetést elvégzi, akkor is, ha azok irrelevánsak az elérendő célhoz. A bűntény 
példánkban nem voltak olyan szabályok, amelyek irreleváns konklúziókat vontak volna 


3 A rete hálót jelent Iatinul, angol kiejtésben (riti) a ,treaty"-vel rímel. 
A produkció kifejezés a produkciós rendszerekben egy feltétel cselekvés szabályt jelent. 
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maguk után, így az irányítottság hiánya nem jelentett problémát. Más esetekben (például 
ha több szabályunk van, amelyek leírják az amerikaiak étkezési szokásait és a rakéták 
árát is), a ERL-EL-KÉRDEZ számos irreleváns konklúziót fog generálni. 

Az irreleváns konklúziók elkerülésének egy lehetséges módja a hátrafelé láncolás 
használata, amint az a 9.4. alfejezetben látható lesz. Másik megoldás, hogy az előrefelé 
láncolást a kiválogatott szabályok egy részhalmazára korlátozzuk. Ezt a megközelítést 
az ítéletlogikai kontextusban már tárgyaltuk. Egy harmadik megközelítési használnak 
a deduktív adatbázisok területén, ahol az előrefelé láncolás elterjedt eszköznek számít. 
Az alapötlet az, hogy írjuk át a szabályhalmazt felhasználva a célállítást, hogy aztán 
csak releváns változó kapcsolatokat — amelyek az úgynevezett mágikus halmazhoz 
(magic set) tartoznak — vegyük figyelembe az előrefelé következtetésben. Például ha 
a cél állítás a Bűnöző(West), akkor a szabályt, amely a Bűnöző(x)-re következtet, át kell 
írni úgy, hogy tartalmazzon egy további konjunktot, amely korlátozza az x értékét: 


Mágikus(x) A Amerikai(x) A Fegyver(y) A Elad(x, y, z) A Ellenséges(z) — Bűnöző) 


A Mágikus(West) tény is hozzáadódik a 7B-hez. Ily módon, még akkor is, ha a tudásbá- 
zis amerikaiak millióiról tartalmaz is adatokat, csak West ezredest fogjuk figyelembe 
venni az előrefelé láncolási folyamatban. A mágikus halmazok definiálásának és a tu- 
dásbázis átírásának teljes folyamata túl összetett ahhoz, hogy most itt részletezzük, de az 
alapötlet egyfajta , generikus" hátrafelé való következtetés elvégzése a célból kiindulva 
azért, hogy megtaláljuk, mely változókapcsolatokat kell korlátozni. A mágikus halmaz 
megközelítést egy hibrid algoritmusnak tekinthetjük az előrefelé következtetés és a hát- 
rafelé haladó előfeldolgozó folyamat között. 


9.4. HÁTRAFELÉ LÁNCOLÁS 


A logikai következtetési algorítmusoknak a második nagy családja a 7.5. alfejezetben 
bemutatott hátrafelé láncolás (backward chaining) megközelítést használja. Ezek az 
algoritmusok a célból kiindulva hátrafelé dolgoznak, láncszerűen haladva a szabályo- 
kon keresztül, hogy megtalálják a bizonyítást alátámasztó már ismert tényeket. Először 
bemutatjuk az alapvető algoritmust, majd leírjuk, hogyan használják ezt a logikai prog- 
ramozásban (logic programming), amely a legelterjedtebb formája az automatizált 
következtetéseknek. Azt is látni fogjuk, hogy a hátrafelé láncolásnak vannak hátrányai is 
az előrefelé láncolással szemben. és meg fogjuk vizsgálni, milyen módon kerekedhetünk 
felül ezeken. Végül megmutatjuk a logikai programozás és a kényszerek kielégítésének 
problémája közötti szoros kapcsolatot. 


Egy hátrafelé láncolási algoritmus 


A 9.6. ábra egy egyszerű hátrafelé láncolási algoritmust mutat be, az ERL-HL-KÉRDEZ-t. 
Az algoritmust célok listájával hívjuk meg, amely kezdetben egy elemet tartalmaz, az 
eredeti lekérdezést, és az eljárás visszaadja az összes olyan helyettesítéshalmazt, ame- 
lyek kielégítik a lekérdezést. A célok listáját úgy tekinthetjük, mint egy feldolgozásra 
váró , vermet". A bizonyítás aktuális ága akkor lesz sikeres, ha a verem összes elemét 
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function ERL-HL-KÉRDEZ(7B, célok, 8) returns helyettesítések egy halmaza 
inputs: 7B, egy tudásbázis 
célok, egy lekérdezést alkotó konjunkciók egy Jistája, ahol 8 már alkalmazva van 
9. az aktuális helyettesítés, kezdetben az üres helyettesítés () 
local variables: válaszok, helyettesítések egy halmaza, kezdetben üres 


if célok üres then return (61 
9"— HELYETTESÍTÉS(Ő, ELsŐ(célok)) 
for each r mondatra in TB, ahol VÁLTOZÓ-ÁTNEVEZ(r) — (pp A... AP 59) 
és 8" a EGYESÍT(g. 97) sikeres 
új. célok — [ Pi, ---, Pn IMARADÉK(cétok)) 
válaszok — ERL-HL-KÉRDEZ(ZB, új célok, KOMPOZÍCIÓ(4 ", 4)) UJ válaszok 
return válaszok 











9.6. ábra. Egy egyszerű hátrafelé láncolási algoritmus 


ki tudjuk elégíteni. Az algoritmus először veszi a lista első célját, és megtalálja az ösz- 
szes olyan klózt a tudásbázisban, amelynek a pozitív literálja, vagyis a feje (head) 
egyesíthető a céllal. Minden ilyen klóz létrehóz egy új rekurzív hívást, amelyben a pre- 
missza, vagyis a klóz törzse (body) hozzá lesz adva a célveremhez. Emlékezzünk, 
hogy a tények olyan klózok, amelyeknek fejük van, de törzsük nincs, így amikor egy 
cél egyesül egy ismert ténnyel, nem adunk új alcélokat a veremhez, és így a célt meg- 
oldjuk. A 9.7. ábra a Bűnöző(West) származtatásának a bizonyítási fáját mutatja be, 
a (9.3) mondataiból kiindulva a (9.10)-en keresztül. 


Bűnözől Wes?) 











[/onerikaitWes) [/egyvertyi [EradtWest. Mu ] Ellenséges(Nono) 
T tzNono) 























[Rakéta [akét ] [BirtokoNonc, Mo) [Ettenségttvono Amerika) 
UM (I 1 1) 


9.7. ábra. Egy hátrafelé láncolással létrehozott bizonyítási fa, annak bizonyítására, hogy West egy bűnö- 
ző. A fát mélységi kereséssel kell kiénékelni, balról jobbra. Hogy bebizonyítsuk a Bűnöző(Wesr) klózt. be 
kell bizonyítanunk az alatta elhelyezkedő négy konjunktot is. Néhányan közülük megtalálhatók a tu 
bázisban, míg mások további hátrafelé láncolást igényelnek. Mindegy egyes sikeres egyesítés lekötéseit 
láthatjuk a megfelelő részcél mellett. Jegyezzük meg, hogy mihelyt egy konjunkcióban egy részcél sike- 
tes, helyettesítéseit a következő részcélokhoz alkalmazzuk. Így tehát, mire az ERL-HL-KÉRDEZ eljut az 
utolsó konjunkcióig, az eredetileg Ellenségesíz)-ig, az már a Nono-hoz lesz lekötve. 
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Az algoritmus a helyettesítések egy kompozícióját (composition) használja. 
A Kompozíció(ó,, 82) olyan helyettesítés, amelynek hatása ugyanaz, mintha sorban 
minden helyettesítést alkalmaznánk. Tehát: 


HELYETTESÍT(KOMPOZÍCIÓ(8) , 02), p) - HELYETTESÍT(82, HELYETTESÍT(81, p)) 


Az algoritmusban a 9-ban tárolt aktuális változólekötéseket összevonjuk azokkal a 
lekötésekkel, amelyeket a célnak a klózfejjel való egyesítése eredményez, megkapva 
így egy új aktuális lekötéshalmazt a visszafelé történő híváshoz. 

A hátrafelé láncolás, ahogyan bemutattuk, egy tiszta mélységi keresési algoritmus. 
Ez azt is jelenti, hogy a helyigénye a bizonyítás méretének lineáris függvénye (most 
figyelmen kívül hagyva a megoktások összegyűjtéséhez szükséges helyet). Ez azt is 
jelenti, hogy a hátrafelé láncolás alkalmazása (eltérően az előrefelé láncolástól) olyan 
ismert problémákkal jár, mint amilyen az ismétlődő állapotok és a nem teljesség. 
Később meg fogjuk vizsgálni ezeket a problémákat és néhány lehetséges megoldást, 
de először nézzük meg, hogyan használják a hátrafelé láncolást a logikai programozá- 
si rendszerekben. 


Logikai programozás 


A logikai programozás közel áll egy olyan technológiához, amely megtestesíti azt a 
deklaratív ideált, amelyet a 7. fejezetben írtunk le, miszerint a rendszereket úgy kell 
létrehozni, hogy a tudást formális nyelven fejezzük ki, és a problémákat egy következ- 
tetési folyamat végigfuttatásával oldjuk meg. Ezt az ideális megközelítést Robert 
Kowalski egyenlete foglalja össze: 


Algoritmus - Logika -- Vezérlés 


A Prolog messze a legszélesebb körben használt logikai programozási nyelv. Több 
százezer használója van. Elsősorban gyors prototípusnyelvként használták, valamint 
szimbólummanipulációs feladatokhoz, mint például fordítóprogramok írására (Van 
Roy, 1990) vagy természetes nyelvek elemzésére (Pereira és Warren, 1980). Számos 
szakértőrendszert írtak Prologban jogi, orvosi, pénzügyi és más tárgyterületeken. 

A Prolog programok határozott klózok halmazai, jelötési rendszere kissé eltér a standard 
elsőrendű logikáétól. A Prolog nagybetűket használ a változókra és kisbetűket a konstan- 
sokra. A klózok leírásában a fej megelőzi a törzset; a ,,:-" -t használja a bal oldali impliká- 
cióra, vesszők választják el a literálokat a törzsben, és pont jelzi a mondat végét: 


bűnöző(X) :- amerikai(X), fegyver(Y), elad(X,Y,2), ellenséges(Z) 


A Prolog a listák jelölésére és az aritmetikára tartalmazza a , szintaktikai nyalánkságot". 
Példaként íme egy Prolog program a csatol (X, Y , 2) -re, amely akkor sikeres, ha a 
2 lista az X és az Y listák csatolásának az eredménye: 


csatol([],Y,Y) 
csatol((A1J2 X, Y, AjZ]):- csatol(x,Y,Z) 


Természetes nyelven úgy olvashatóak ezek a klózok, hogy (1) egy üres listát hozzá- 
csatolva az Y listához, egy ugyanolyan Y listát kapunk eredményként, és a (2) szerint 
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az (AIZ1 az (AJXI Y-hoz csatolásának az eredménye. A csatol ezen definíciója 
eléggé hasonlónak tűnik a Lispben megtalálható megfelelő definíciókhoz, de valójában 
ez sokkal kifejezőbb. Például feltehetjük a következő kérdést: csatol (A, B, (1, 21) : 
melyik két listát kel! csatolni ahhoz, hogy összeállítsuk az [1, 2]-t? A programot futtat- 
va ezeket a megoldásokat kapjuk vissza: 





Az [ B - [1,2] 
A z [1] B [21 
Az [1.2] Be CC) 


A Prolog-programok végrehajtása mélységi keresést alkalmazó hátrafelé láncoláson ke- 
resztül történik, ahol a klózokat olyan sorrendben alkalmazzák, ahogyan a tudásbázisban 
szerepelnek. A Prolog néhány aspektusa a standard logikai következtetésen kívül esik. 


" Beépített aritmetikai függvényeket tartalmaz. Az ilyen függvényszimbólumokat 
használó literálokat a kód végrehajtásával , bizonyítja" a program, és nem végez 
további következtetéseket. Például az ,X egyenlő 443" akkor sikeres, ha az X ér- 
tékét a 7-hez kötjük. Ugyanakkor, az a célállítás, hogy: , 5 egyenlő X4Y" siker- 
telen lesz, mert a beépített függvények nem képesek önállóan egy tetszőleges egyen- 
letmegoldást elvégezni.5 

Vannak olyan beépített predikátumok, amelyeknek mellékhatásai vannak, ha végre- 
hajtjuk őket. Ilyenek a bemeneti-kimeneti predikátumok és a tényeket a TB-hez 
hozzáadó, illetve onnan törlő kijelent/visszavon predikátumok. Ezeknek 
a predikátumoknak nincs megfelelőjük a logikában. és hatásukat sokszor nem egy- 
szerű végigkövetni — például ha a tényeket egy olyan bizonyítási fa egyik ágán 
jelentjük ki, amely végül sikertelennek bizonyul. 

A Prolog lehetővé tesz olyan egyedi formájú tagadást, amelyet sikertelenségi tagadás- 
nak (negation as failure) nevezünk. Egy negált cél, mintanem P, akkor tekintető bi- 
zonyítottnak, ha a rendszerek nem sikerül bebizonyítania a P-t. Így a következő mondat: 


élő(X) :- nem halott(X) 


úgy olvasható, hogy: , Mindenki élő, ha nem bizonyítható, hogy halott." 

" A Prolognak van egy egyenlőségi operátora (—), de ez nem rendelkezik a logikai 
egyenlőség teljes hatékonyságával. Egy egyenlőséget tartalmazó célállítás akkor si- 
keres, ha a két term egyesíthető, máskülönben sikertelen. TehátazX4Y-2 43 
akkor sikeres, ha az X lekötött értéke a 2, és az Y lekötött értéke a 3, de a hajnal- 
csillag-esthajnalcsillag sikertelen. (A klasszikus logikában az utóbbi 
egyenlet lehet igaz, vagy lehet nem igaz.) Az egyenlőségről sem tényt, sem szabályt 
nem tudunk hozzáadni a TB-hez. 

s A Prolog egyesítési algoritmusa nem tartalmazza az előfordulási próbát. Ennek az 
a következménye, hogy lehetséges nem helyes következtetést végezni. Ez azonban 
ritkán okoz problémát, leginkább olyankor, amikor a Prologot matematikai tételek 
bizonyítására használjuk. 


5 Jegyezzük meg, hogy ha a Peano-axiómák meg vannak adva, akkor sz ilyen célok megoldhatók egy Prolog- 
Programon belüli következtetéssel. 
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A Prolog tervezésénél meghozott döntések kompromisszumot jelentenek a deklara- 
tivitás és a végrehajtási hatékonyság között — mármint amit hatékonyságon értettünk 
a Prolog tervezésének idején. Visszatérünk majd ehhez a témához, miután megvizsgál- 
tuk, hogyan valósítják meg a Prologot. 


A logikai programok hatékony megvalósítása 


Egy Prolog program végrehajtása kétféle módon történhet: lehet interpretált és lehet 
lefordított. Az interpretáció általában az ERL-HL-KÉRDEZ algoritmus (lásd 9.6. ábra) 
futtatását jelenti a programmal mint tudásbázissal. Azt mondjuk, hogy , általában", mi- 
vel a Prolog különböző interpretációi különböző megoldásokat tartalmaznak a sebesség 
maximalizálására. Itt mi csak két implementációt nézünk meg. 

Először is ahelyett, hogy minden lépésben összeállítanánk az összes lehetséges vá- 
lasz listáját minden egyes részcélhoz, a Prolog interpreter egy választ hoz létre, és egy 
, Ígéretet" ad meg arra, hogy a többi lehetséges választ is generálni fogja, miután az 
aktuális választ teljes mértékben feltárta. Ezt az ígéretet választási pontnak (choice 
point) nevezzük. Mikor a mélységi keresés befejezte az aktuális válaszból fakadó lehet- 
séges megoldások feltárását, és visszalép a választási ponthoz, a választási pontot kiter- 
jesztjük úgy, hogy megadjon egy új választ a részcélhoz, és egy új választási pontot, Ez 
a megközelítés időt és tárolóhelyet takarít meg. Ezenkívül nagyon egyszerű határfelületet 
biztosít a hibakereséshez, mert egy adott pillanatban csak egyetlen megoldási útvonal 
vizsgálata történik meg. 

Másodszor, az ERL-HL-KÉRDEZ egyszerű alkalmazása a helyettesítések generálása- 
kor és kompozíciójakor jól gazdálkodik az idővel. A Prolog a helyettesítéseket úgy 
alkalmazza, hogy olyan logikai változókat használ, amelyek emlékezni tudnak az aktuá- 
lis lekötéseikre. A program futásának bármely pontján a programban lévő minden 
egyes változó vagy szabad, vagy valamely értékhez lekötött. Ezek a változók és érté- 
kek együtt definiálják implicit módon a helyettesítést a bizonyítás aktuális ágához. 
A vizsgált ágak kiterjesztése csak további változólekötéseket hoz létre, mivel egy új 
lekötés hozzáadása egy már lekötött változóhoz az egyesítés sikertelenségét eredmé- 
nyezi. Mikor a keresésben sikertelennek bizonyul egy ág, a Prolog visszalép egy meg- 
előző választási ponthoz, és ekkor esetleg fel kell oldania néhány változót. Ezt úgy 
hajtja végre, hogy nyomon követi a veremben — amelynek útvonal (trail) a neve — 
lekötött összes változót. Mivel minden egyes új változó az EGYESÍT-VÁLT-tal kapcso- 
lódik, a változót beteszi az útvonalba. Amikor egy cél sikertelen, és ideje visszatérni 
egy megelőző választási ponthoz, minden egyes változó szabaddá válik. minthogy 
kivesszük az útvonalból. 

Még a leghatékonyabb Prolog interpretereknek is néhány ezer gépi utasításra van 
szükségük egy következtetési lépés végrehajtásához; az index kikeresésének, az egyesí- 
tésnek, a rekurzív hívási verem felépítésének a költsége miatt. Valójában az interpreter 
úgy viselkedik. mint aki még soha sem látta a programot. Például újra meg kell találnia 
a célhoz illeszkedő kiózokat. Egy lefordított Prolog program ezzel szemben egy olyan 
következtetési eljárás, amelyet egy specifikus klózhalmazra készítettek. és így tudja, 
mely klózok illeszthetők az adott célhoz. A Prolog fordító alapjában véve minden egyes 
különböző predikátumra egy miniatűr tételbizonyítót generál, kiküszöbölve így az 
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interpretációs lépések nagy részét. Lehetséges az is, hogy az egyesítési eljárást nyitott 
kóddal (open-code) lássuk el az egyes eljárás hívásokra, elkerülve így a termek struktú- 
rájának explicit elemzését. A nyitott kódú egyesítés részleteit megtalálhatók a (Warren és 
társai, 1977)-ben. 

A mai számítógépek utasításkészletei szegényesnek tűnnek összehasonlítva a Prolog 
szemantikájával, így tehát a Prolog fordítóit egy átmeneti nyelvre fordítják le ahelyett, 
hogy közvetlenül gépi nyelvre fordítanák. A legnépszerűbb átmeneti nyelv a Warren 
Absztrakt Gép (Warren Abstract Machine) vagy WAM, amelyet David H. D. Warren- 
ről neveztek el, aki az első Prolog fordító egyik megvalósítója volt. A WAM a Prolog 
számára alkalmas absztrakt utasításkészlet, és interpretálható vagy lefordítható gépi 
nyelvre. Más fordítók, mint például a Lisp vagy a C, egy magas szintű nyelvre fordít- 
ják le a Prologot, és ezután használják a nyelvnek a fordítóját, hogy azt a gépi nyelvre 
fordítsa. Például, a Csatol definícióját a 9.8. ábrán bemutatott kódra lehet fordítani. 
Van még néhány kérdés, amit fontos megemlíteni: 





s Ahelyett hogy keresgélni kellene a tudásbázisban a Csatol klózokat, a klózokat 
eljárássá lehet alakítani, és a következtetéseket egyszerűen úgy hajtjuk végre, hogy 
meghívjuk az eljárást. 

s Mint azt korábban leírtuk, az aktuális változók lekötéseit egy útvonalhoz rendeljük. 
Az eljárás első lépése elmenti az útvonal pillanatnyi állapotát úgy, hogy azok vissza- 
állíthatóak lesznek a VISSZAÁLLÍT-ÚTVONAL-lal, ha az első klóz sikertelen. Ez fel fog 
oldani minden lekötést, amelyet az első EGYESÍT hívás generált. 

s A legtrükkösebb rész a folytatások (continuations) listájának használata a válasz- 
tási pontok implementálására. Gondolhatunk úgy egy folytatásra, mint egy eljárás és 
egy argumentumlista becsomagolására, melyek együtt határozzák meg, hogy mit 
kell legközelebb csinálni, amikor az aktuális cél sikeres lesz. Nem elég csak úgy 
egyszerűen visszatérni egy olyan eljárásból, mint a CSATOL, amikor a cél sikeres, 
mivel itt sokféle módon lehet sikeres az eljárás, és minden egyes esetet fel kell derí- 
teni. A folytatás argumentum megoldja ezt a problémát, mert minden egyes esetben 
lehívhatjuk, ha egy cél sikeres. A CSATOL kódban, ha az első argumentum üres, 
akkor a CSATOL predikátum sikeres. Ezután HÍVJUK a folytatást, az útvonalhoz ren- 
delt lekötésekkel, hogy végrehajtsa, amit a folytatásban legközelebb meg kell tenni. 
Például ha a CSATOL hívása a legfelső szinten történik, a folytatás kinyomtatja a vál- 
tozók lekötéseit. 





procedure CsATOL(ax, y, az, folytatás) 


útvonal — GLOBÁLIS-ÚTVONAL-MUTATÓ() 

íf ax — [] és EGYesír(y, az) then Hívífolytatás) 
VISSZAÁLEÍT-ÚTVONAL(sítvonal) 

a. — ÚI-VÁLTOZÓ(); x — ÚJ-VÁLTOZÓO); z — ÚJ-VÁLTOZÓUJ 

if EGYEsír(ax, [a ) x) és Egyesír(az, [a I z]) then CsATOL(x. y. z, folytatás) 











9.8. ábra. A csatol predikátum fordításának pszeudokódos reprezentációja. Az ÚJ-VÁLTOZÓ függvény 
egy új változót ad vissza, amely különbözik a korábban visszaadott változóktól. A Hív(fofvtatás) eljárás 
folytatja a végrehajtást a megadott folytatással. 
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Mielőtt Warren a Prolog fordítót elkészítette volna, a logikai programozás túl lassú 
volt általános célú felhasználáshoz. A Warren és mások által létrehozott fordítók lehető- 
vé tették, hogy a Prolog kód olyan sebességet érjen el, amelyek — különböző standard 
tesztek szerint is — versenyképessé tették a C nyelvvel (Van Roy, 1990). Természetesen 
az a tény, hogy egy tervkészítőt vagy egy elemzőt egy természetes nyelvhez néhány tu- 
cat Prolog sorban meg lehet írni, lényegesen vonzóbbá teszi a Prologot a C-nél a legtöbb 
kisebb MI-kutatási projekt prototípusának az elkészítésénél. 

A párhuzamosítás szintén jelentős gyorsítást eredményezhet. Két elsődleges tere van 
a párhuzamosításnak. Az első, amelynek neve VAGY-párhuzamosság (OR-para- 
lellism), abból a lehetőségből származik, hogy egy cél számos különböző klózzal lehet 
egyesíthető a tudásbázisban. Mindegyik egyesítés egy potenciális megoldáshoz vezető 
független ág megjelenését eredményezi a keresési helyen, és minden ilyen ágat párhu- 
zamosan is megoldhatunk. A második, amelynek neve ÉS-párhuzamosság (AND- 
paralellism), abból származik, hogy az implikáció törzsében minden egyes konjunktot 
egy párhuzamos implikációval is meg lehet oldani. Az ÉS-párhuzamosságot nehezebb 
megvalósítani, mert a megoldás az egész konjunkcióra konzisztens lekötéseket igényel 
az összes változóra. Így minden egyes konjunktív ágnak kommunikálnia kell a többi 
ággal, hogy biztosítsák a globális megoldást. 


Redundáns következtetés és végtelen hurkok 


Most nézzük meg a Prolog nyelv Achilles-sarkát, a mélységi keresés és az ismételt ál- 
lapotokat és végtelen útvonalakat tartalmazó fák illeszkedésének hiányát. Vizsgáljuk 
meg a következő logikai programot, amely eldönti, hogy létezik-e egy útvonal két pont 
között egy irányított gráfban: 


útvonal(X, 2) :- kapcsolat(X, 2) 
útvonal(X, 2) :- útvonal(X, Y) , kapcsolat(Y, Z) 


Egy egyszerű, három csomópontos gráfot, amelyet a kapcsolat (a, b) és a kap- 
csolat (b, c) definiál, mutat be a 9.9. (a) ábra. Az útvonal (a, c) lekérdezésére 
a program a 9.10. (a) ábrán látható bizonyítási fát generálja. Másrészt viszont, ha a két 
klózt ebbe a sorrendbe tesszük: 


útvonal (X, Z) :- útvonal (X, Y) , kapcsolat(Y, 2) 
útvonal(X, 2) :- kapcsolat (X, 2) 


akkor a Prolog a 9.10. (a) ábrán bemutatott végtelen keresést végzi. A Prolog tehát, 
mint egy tételbizonyító, határozott klózokból álló 7B-re nem teljes (incomplete) (még 
a Datalog programok esetében sem teljes, mint azt a példánk mutatja). mivel léteznek 
olyan tudásbázisok, amelyekben nem tud bizonyítani vonzat mondatokat. Vegyük észre, 
hogy az előrefelé láncolással nincs ilyen probléma: ha egyszer az útvonal (a, b), az 
útvonal (b, c) és az útvonal (a, c) útvonalak ki lettek következtetve, az előre- 
felé láncolás leáll. 

A mélységi keresésen alapuló hátrafelé láncolásnak is akad problémája a felesle- 
ges számításokkal. Például amikor meg akarunk találni egy útvonalat az A4-ből a J4- 
be a 9.9. (b) ábrán, a Prolog 877 következtetést hajt végre, amelyek legnagyobb 
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(a) 
9.9. ábra. (a) Az A-ból a C-be vezető útvonal megtalálása a Prologot egy végtelen hurokba vezetheti, (b) 
Egy gráf, amelyben minden csomópontot két véletlenszerű következő rétegbeli csomóponthoz kapcso- 
lunk a következő rétegben. Egy útvonal megtalálása az A-ből a J4-be 877 következtetést igényel. 


részét a csomópontokhoz tartozó összes lehetséges útvonal megtalálása képezi, ame- 
lyekből pedig nem lehet elérni a célt. Ez hasonló a 3. fejezetben megtárgyalt ismé- 
telt állapot problémához. A következtetési lépések teljes száma a generált alap- 
tények számának exponenciális függvénye lehet. Ha az előrefelé láncolást alkalmaz- 
zuk ehelyett, akkor legfeljebb n? útvonal (X , Y) tény generálható az n csomópont 
összekötésével. A 9.9. (b) ábrán látható problémához csak 62 következtetési lépés 
szükséges. 

Az előrefelé láncolás a gráfkeresési problémáknál a dinamikus programozás 
(dynamic programming) egyik példája, amelyben a részproblémákra vonatkozó meg- 
oldások előállítása inkrementálisan történik a kisebb részproblémáktól indulva, végig 
tárolva a részmegoldásokat, hogy elkerüljük az újraszámolást. Ugyanezt a hatást érhetjük 
el egy hátrafelé láncoló rendszerben a memók gyűjtésének (memoization) használatá- 
val, ami azt jelenti, hogy a részcélok megoldásait tároljuk, amint megtaláltuk őket, hogy 
azután újra felhasználhassuk ezeket a megoldásokat, amikor a részcél visszatér, meg- 
takarítva így az előző számítás megismétlését. Ezt a megközelítést használják a táblázatos 
logikai programozási (tabled logic programming) rendszerek, amelyeknek hatékony 
tárolási és visszakeresési mechanizmusuk van a memók gyűjtésének megvalósítására. 
A táblázatos logikai programozás egyesíti a hátrafelé láncolás célirányosságát az előre- 
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9.10. ábra. (a) Az A-ból a €-be vezető útvonal bizonyítása. (b) Végtelen mélységű bizonyítási fa, amely 
akkor generálódik, ha a klózok , rossz" sorrendben vannak. 


358 9. KÖVETKEZTETÉS ELSŐRENDŰ LOGIKÁBAN 


felé láncolás dinamikus programozási hatékonyságával. Ez az eljárás teljes a Datalog 
programokra is, ami azt eredményezi, hogy a programozónak kevesebbet kell aggódnia 
a végtelen hurkok problémája miatt. 


Korlátozott logikai programozás 


Az előrefelé láncolás tárgyalásánál (lásd 9.3. alfejezet) bemutattuk, hogy a kényszer- 
kielégítési problémákat hogyan lehet határozott klózokként kódolni. A standard Prolog 
képes megoldani az ilyen problémákat, pontosan úgy, mint az 5.3. ábrán bemutatott 
visszalépéses algoritmus. 

Mivel a visszalépéses módszer sorba veszi a változók tárgyterületeit, ezért csak vé- 
ges tárgyterületű (finite domain) kényszerkielégítési problémákra működik. A Prolog 
termjeiben véges számú megoldásnak szabad léteznie bármely szabad változókkal ren- 
delkező célra. (Például, a kül (ag, sa) célnak, amely azt jelenti ki, hogy Oueens- 
landnek és Dél-Ausztráliának különböző színűnek kell lenni, hat megoldása van, ha 
három szín megengedett.) A végtelen méretű tárgyterületekre alkalmazott módszerek — 
például az egész számokat felvevő vagy valós értékű változókat tartalmazó problémáknál 
alkalmazható módszerek — teljesen különböző algoritmust igényelnek, mint például a 
kényszerpropagálást vagy a lineáris programozást. 

A következő klóz akkor tehető sikeressé, ha a három szám kielégíti a háromszög 
egyenlőtlenséget: 


háromszög (X, Y, 2) :- 
KszO, Ys-0, 25-0, XtYozZ, YtZ5EX, XsZ5XY 


Ha a Prolognak a háromszög (3 , 4 , 5) lekérdezést adjuk, akkor ez jól működik. Ha 
viszont azt kérdezzük: háromszög (3, 4, 2), akkor erre nem talál megoldást, mert 
a 7270 részcélt a Prolog nem tudja kezelni. A nehézséget az okozza, hogy a Prologban 
a változóknak két állapot valamelyikében kell lenniük: egy változó szabad vagy egy 
bizonyos termhez lekötött. 

Egy változó lekötése egy termhez a korlátozás egyik speciális fajtájának tekinthető, 
nevezetesen egy egyenlőségkényszernek. A korlátozott logikai programozás (cons- 
traint logic programming, CLP) lehetővé teszi, hogy a változók korlátozva legyenek, 
ahelyett hogy lekötöttek lennének. Egy korlátozott logikai program megoldása a korlá- 
toknak a tudásbázisból származtatható legspecifikusabb halmaza a lekérdezés változóin. 
Például a háromszög (3, 4, 7) lekérdezésre a megoldás a 7 57 2 5- 1 kényszer. 
A standard logikai programok csak a CLP speciális esetei. amelyekben a megoldás kény- 
szereinek egyenlőségi kényszereknek — azaz lekötéseknek - kell lenniük. 

A €LP-rendszerek különféle kényszermegoldó algoritmusokat is tartalmaznak a 
nyelvben megengedett kényszerek kezelésére. Például egy valós értékű változókon ér- 
telmezett, lineáris egyenlőtlenségeket megengedő rendszer tartalmazhat egy lineáris 
programozási algoritmust ezen kényszerek feloldására. A CLP-rendszerek egy sokkal 
rugalmasabb megközelítési is adoptálnak a standard logikai programozási lekérde- 
zések megoldására. Például a mélységi. balról jobbra történő visszalépéses keresés 
helyett használhatják bármelyik ennél hatékonyabb, az 5. fejezetben tárgyalt algorit- 
must, beleértve a heurisztikus konjunktok sorba rendezését, a visszaugrást, a vágási 
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halmaz kondicionálást és így tovább. A CLP-rendszerek tehát vegyesen alkalmazzák a 
kényszerekkielégítési algoritmusok, a logikai programozás és a deduktív adatbázisok 
elemeit. 

A CLP-rendszerek szintén hasznosítják az 5. fejezetben bemutatott különböző 
kényszerprogramozási keresési optimalizációs módszereket, mint a változók és értékek 
sorba rendezését, az előrefelé ellenőrzést vagy az intelligens visszalépés módszerét. 
Számos rendszert úgy terveztek meg, hogy a programozónak nagyobb kontrollja legyen 
a következtetések keresésének a sorrendje felett. Például az MRS nyelv (Genesereth és 
Smith, 1981; Russell, 1985) lehetővé teszi a programozó számára, hogy metaszabá- 
lyokat (metarules) írjon a konjunktok megvizsgálási sorrendjének meghatározására. 
A felhasználó például írhat egy olyan szabályt. amely azt mondja ki, hogy a legkevesebb 
változóval rendelkező cél legyen először kipróbálva, vagy írhat tárgyterület-specifikus 
szabályokat bizonyos predikátumokhoz. 
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A logikai rendszerek általunk bemutatandó három családjának az utolsó tagja a rezolú- 
ción (resolution) alapul. Láttuk a 7. fejezetben, hogy a propozíciós rezolúció egy 
cáfolásteljes következtetési folyamat az ítéletlogikában. Ebben az alfejezetben meg 
fogjuk vizsgálni, hogyan lehet kiterjeszteni a rezolúciót az elsőrendű logikára. 

A teljes bizonyítási eljárás létezésének kérdése a matematikusokat érdekli közvet- 
lenül. Ha egy teljes bizonyítási eljárás megtalálható matematikai állításokra, ebből két 
dolog következik. Először is, az összes tétel előfeltételeit mechanikusan elő tudjuk 
állítani; másodszor, a teljes matematika felépíthető alapaxiómák halmazának logikai 
következményeként. A teljesség kérdésének vizsgálata így a 20. századi matematika 
néhány legfontosabb eredményényének a megszületéséhez vezetett. 1930-ban Kurt Gödel 
német matematikus bebizonyította az első teljességi tételt (completeness theorem) az 
elsőrendű logikára, megmutatva, hogy minden kikövetkeztetett mondatnak létezik 
véges bizonyítása. (Gyakorlatban is felhasználható bizonyítási módszert viszont nem 
találtak egészen addig, amíg J. A. Robinson nem publikálta a rezolúciós algoritmust 
1965-ben.) 1931-ben Gödel bebizonyította a még híresebb nemteljességi tételt (in- 
completeness theorem). A tétel kimondja, hogy egy logikai rendszer, amely tartal- 
mazza az indukció elvét — amely nélkül a diszkrét matematika igen kis része építhető 
fel— szükségszerűen nem teljes. Ebből az következik, hogy léteznek olyan kikövetkez- 
tetett mondatok, amelyeknek a rendszeren belül nincs véges bizonyítása. Lehet, hogy 
a tű ott van a metaforikus szénakazalban, de nincs olyan eljárás, amely garantálná, 
hogy megtaláljuk. 

Gödel tétele ellenére, a rezolúcióalapú tételbizonyításokat széles körben alkalmazták 
matematikai tételek levezetésére, beleértve néhány olyan tételt is, amelyre előzőleg 
nem volt ismert bizonyítás. A tételbizonyításokat — más alkalmazások mellett — hasz- 
nálták például hardvertervezés verifikálására vagy logikailag helyes programok gene- 
rálására. 
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Az elsőrendű logika konjunktív normál formája 


Mint az ítélatlogika esetében, az elsőrendű rezolúció is megköveteli, hogy a mondatok 
konjunktív normál formában (conjunctive normal form) (CNF) legyenek, tehát 
minden mondat klózok konjunkciója, ahol minden egyes klózt literálok diszjunkciója 
alkot.ó A titerálok tartalmazhatnak változókat, amelyeket univerzális kvantorral ellá- 
tottnak feltételezünk. Például a 

Vx Amerikai(x) A Fegyverfy) A Eladtx, y, 2) A Ellenségesíz) —- Bűnöző(x) 
mondat CNF-formára átalakítva ilyen lesz: 

-Amerikai(x) V -Fegyverty) V -Eladtx, y, z) V -Ellenségesíz) V Bűnöző(x) 
Minden elsőrendű logikai mondat átalakítható a következtetés szempontjából egyenér- 
tékű CNF-mondattá. Ami azt jelenti, hogy egy CNF-mondat akkor kielégíthetetlen, ha 
az eredeti mondat is kielégíthetetlen, ezáltal a CNF-mondatok között ellentmondásokat 
keresve létre tudunk hozni bizonyításokat. 

A CNF-mondatok átalakításának eljárása nagyon hasonló az ítéletlogikai eljáráshoz, 
amelyet a 269. oldalon láthatunk. A legfontosabb különbség abból fakad, hogy ki kell 
vonnunk a mondatokból az egzisztenciális kvantorokat. Ezt az eljárást a következő 
mondat lefordításával illusztráljuk: , Mindenkit, aki az összes állatot szereti, valaki sze- 
ret", vagyis: 

Vx IVy Állatíy) — Szereti(x, y)h 2 [dy Szereti(y, x)) 

A lépések a következők: 


s Az implikációk eliminálása. 
Vx [-vy -áÁllatty) V Szeretilx, y)] V [dy Szereti(y, x)] 


s A befelé mozgatása. A negált összekötőjelekre vonatkozó már ismert szabályok 
mellett szükségünk van a negált kvantorokra vonatkozó szabályokra is. Így ezt kapjuk: 


-aWvx p-ből lesz 3x -p 
-3x p-ből lesz Vx -p 


A mondatunk a következő átalakításokon megy keresztül: 


Vx [dy -(-Állaty) V Szeretitx, y))) v [dy Szeretity, 01 
Vx [dy - -Állatíy) A —Szereti(x, y)) v [dy Szereti(y, x9] 
Wx [y Állatty) A —Szereti(x, y)1 v [dy Szereti(y, x)] 


Figyeljük meg, hogyan alakítottuk át az univerzális kvantort (vy) az implikáció 
premisszájában egzisztenciális kvantorrá. A mondatot most így lehet kiolvasni , Vagy 
van olyan állat, amelyet x nem szeret, vagy (ha ez nem áll fenn) valaki szereti x-et." 
Világos, hogy az eredeti mondat jelentését megőriztük. 


5 Egy klózt implikációként is reprezentálhatunk a bat oldali atomok konjunkciójával és a jobb oldali atomok disz- 
junkciójával, mint azt a 7.12. feladatban láthatjuk. Ezt a formát, amelyet KowalskI-formának (Kowalski form) szok- 
tak nevezni, gyakran sokkal könnyebb kiolvasni, ha az implikációk írása jobbról balra történik (Kowalski, 19796). 
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s" A változók átnevezése. Az olyan mondatokban, mint a (vx P(x)) v (Ax 0(x)), ame- 
lyek ugyanazt a változó nevet kétszer is használják, változtassuk meg az egyik vál- 
tozó nevét. Ezzel elkerüljük, hogy később keveredés lehessen, amikor elhagyjuk a 
kvantorokat. Így ezt kapjuk: 


Vx [3dy Állat(y) A -Szereti(x, y)] v [3z Szereti(z, x)] 


s Skolemizáció. A skolemizáció (skolemization) az az eljárás, amelynek során elimi- 
nációval eltávolítjuk az egzisztenciális kvantorokat. Egyszerű esetben ez megegyezik 
a 9.1. alfejezetben található egzisztenciális példányosítási szabállyal: fordítsuk le a 
3x P()-et P(A)-ra, ahol az A egy új konstans. Ha ezt a szabályt alkalmazzuk a minta- 
mondatunkra, akkor azonban ezt kapjuk: 


Vx [Állat(A) A -Szereti(x, A)) V SzeretüB. x) 


amelynek teljesen téves a jelentése: azt mondja ki, hogy mindenki vagy nem tud sze- 
retni egy bizonyos A állatot, vagy egy bizonyos 8 entitás szereti őt. Valójában, az 
eredeti mondatunk lehetővé teszi minden egyes személy számára, hogy ne szeressen 
egy másik állatot, vagy egy másik személy szeresse őt. Így tehát, azt szeretnénk, 
hogy a Skolem entitások az x-től függjenek: 


Vx [Álla(F(x) A —Szereti(x, F(x))] V SzeretifG(x), x) 


Itt az F és a G Skolem-függvények. Az általános szabály az, hogy a Skolem-függ- 
vények argumentumai mind univerzális kvantorral ellátott változók, amelyeknek 
a hatókörében az egzisztenciális kvantor értelmezett. Hasonlóan az Egzisztenciális 
Példányosításhoz, a skolemizált mondat is pontosan akkor kielégíthető, ha az erede- 
ti mondat is kielégíthető. 

s Az univerzális kvantorok elhagyása. Ezen a ponton minden megmaradt változó 
univerzális kvantorral van ellátva. Mi több, a mondat egyenértékű azzal a mondat- 
tal, amelyben az összes univerzális kvantort balra rendezték. Így tehát most már 
elhagyhatjuk az univerzális kvantorokat: 


(Álla(F(x2)) A —Szereti(x, F(xY)I V Szereti( G(x), x) 
s Az A elosztása a V felett. 
[Állat F(x)) V Szereti(Gx), x)1 A [—Szeretix, F(x)) V Szereti(G(x), x)) 


Ennek a lépésnek az elvégzéséhez szükség lehet az egymásba ágyazott konjunkciók 
és diszjunkciók kibontására is. 


A mondat most CNF formájú, és két klózból áll. Eléggé olvashatatlan lett. (Némikép- 
pen segíthet, ha megmagyarázzuk, hogy az F(x) függvény egy, az x személy által 
potenciálisan nem szeretett állatra vonatkozik, míg a G(x) olyan valakire utal, aki 
szeretheti x-et.) Szerencsére, nekünk ritkán kell CNF-mondatokat vizsgálnunk — a for- 
dítási folyamat könnyen automatizálható. 
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A rezolúciós következtetési szabály 


Az elsőrendű klózokra vonatkozó következtetési szabály egyszerűen a 268. oldalon 
megadott propozíciós rezolúciós szabály kiterjesztett változata. Két klóz, amelyek stan- 
dardizálva vannak, tehát nem tartalmaznak azonos változókat, akkor rezolválható, ha 
tartalmaznak komplememens literálokat. Az ítéletlogikai literálok akkor komplemensek, 
ha az egyik a negációja a másiknak; míg az elsőrendű literálok akkor komplemensek, 
ha az egyik egyesül a másik negációjával. Így ezt kapjuk: 
EV Vo MV e NM 
HELYETTESÍT(Ő. €) V..V ELV 1 V.V VM VAN meg VM VAN Mp 


ahol az EGYESÍT(/;, -mj) - 0. Például rezolválhatjuk ezt a két klózt: 
TÁMat(Fe)) V Szereti(G(x), (9) és (-Szereti(u, v) v -Megöli(u, v)I 


— (u/G(x), v/x) egyesítő felhasználásával a komplemens literálokat, a Szereti(G(x), x)-t 
és a —Szereti(u, v)-t eliminálva kapjuk meg a rezolvens (resolvent) klózt: 


TÁHaF(x)) V -MegölitG(2), x)1 


A bemutatott szabály neve bináris rezolúciós (binary resolution) szabály, mert pon- 
tosan két literált old fel. A bináris rezolúciós szabály önmagában nem eredményez egy 
teljes következtetési folyamatot. A teljes rezolúciós szabály literálok részhalmazait 
rezolválja minden egyes egyesíthető klózban. Egy alternatív megközelítés a fakto- 
rálásnak (factoring), a felesleges literálok eltávolításának a kiterjesztése az elsőrendű 
logikára. A propozíciós faktorálás két literált eggyé redukál, ha azok azonosak. Az első- 
rendű faktorálás két literált eggyé redukál, ha azok egyesíthetők. Az egyesítőt a teljes 
klózra kell alkalmazni. A bináris rezolúció és a faktorálás kombinációja már teljes eljá- 
rást eredményez. 





Példabizonyítások 


A rezolúció a TB HF a állítást úgy igazolja, hogy bebizonyítja. hogy a TB A -a nem 
kielégíthető, vagyis a bizonyítás az üres klóz származtatásával történik. Az algoritmi- 
kus megközelítés megegyezik az ítélellogikában lévővel, amelyet a 7.12. ábrán már 
bemutattunk, így ezt itt most nem ismételjük meg. Ehelyett inkább két példabizonyí- 
tást adunk meg. Az első a bűntény példa a 9.3. alfejezetből. A mondatok CNF-ben a 
következők: 


-Amerikai(x) v -Fegyverly) V -Eladtx, z, y) V -Ellenségesíz) V Bűnözőtx) 
-Rakétatx) V -Birtokol(Nono, x) v Elad( West, x, Nono) 
-Ellenség(x, Amerika) V Ellenséges(x) 


-Rakéta(x) V Fegyver(x) 
Birtoko(Nono, M) RakétatM ) 
Amerikai( West) Ellenség(Nono, Amerika) 


Hozzáadjuk a mondatok halmazához a negált célt is -Bűnöző(West). A rezolúciós 
bizonyítást a 9.11. ábra mutatja be. Figyeljük meg a szerkezetét: a bizonyításnak egy 
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9.11. ábra. Egy rezolúciós bizonyítás arra, hogy West bűnöző 


egyszerű , gerince" van, amely a célklózzal kezdődik, és folyamatosan rezolvál a tudás- 
bázisból származó klózokkal, mindaddig, amíg az üres klózt nem generálja. Ez jellemző 
a Horn-klózokat tartalmazó tudásbázisokon végzett rezolúcióra. Valójában a fő gerinc 
mentén található klózok pontosan megfelelnek a 9.6. ábrán látható hátrafelé láncolási 
algoritmusban a célváltozók egymást követő értékeinek. Ez azért van így, mert mindig 
azt a klózt választjuk ki rezolválásra, amelynek a pozitív literálja egyesíthető a gerin- 
cen lévő , aktuális" klóz bal szélen elhelyezkedő literáljával, és pontosan ez történik 
a hátrafelé láncolásban is. Így tehát a hátrafelé láncolás valójában a rezolúció egy spe- 
ciális esete, egy különleges vezérlési stratégiával, amely meghatározza, hogy melyik 
rezolúciót hajtsuk végre legközelebb. 

A második példánk kihasználja a skolemizációt, és nem határozott klózokat is tartal- 
maz. Ez valamivel bonyolultabb bizonyítási struktúrát eredményez. Természetes nyelven 
megfogalmazva a probléma a következő: 


Mindenkit, aki az összes állatot szereti, szeret valaki. 

Bárkit, aki megöl egy állatot, senki sem szeret. 

Jankó szereti az összes állatot. 

Vagy Jankó, vagy a Kíváncsiság ölte meg a macskát, akinek a neve Tuna. 

A Kíváncsiság ölte meg a macskát? 
Először is leírjuk az eredeti mondatokat, némi háttértudást, és a G negált célt az első- 
rendű logikában: 


Vx [Vy Állatíy) — Szereti(x, y)1 — [dy Szereri(y, x)] 
Vix [dy Állat(y) A Megöli(x, y)1 - (Vz —Szereti(z, x)] 
Vx Állat(x) 5 SzeretitJankó, x) 

Megöli( Jankó, Tuna) V Megöli(Kfváncsiság, Tuna) 
Macska(Tuna) 

Vx Macska(x) Állat(x) 

-Megöli(kíváncsiság, Tuna) 
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Most pedig alkalmazzuk az átalakítási procedúrát, hogy minden egyes mondatot CNF-be 
konvertáljunk: 


AL. ÁllakF(x)) v Szereti(G(), x) 
A2. —Szereti(x, F(x)) V Szereti G(x), x) 
B. —-Állatíy) v -Megöli(x, y) v -Szereti(z, x) 
C. -Állat(x) v Szereti(Jankó, x) 
D. Megölí(Jankó, Tuna) V Megöli(kKíváncsiság, Tuna) 
E. Macska(Tuna) 
F. -Macska(x) V Állat(x) 
-G. —-Megöli(kKíváncsiság, Tuna) 


A 9.12. ábrán látható a rezolúciós bizonyítása annak, hogy a Kíváncsiság ölte meg a 
macskát. Magyarul a bizonyítást így írhatjuk át: 


Tegyük fel, hogy a Kíváncsiség nem ölte meg Tunát. Tudjuk, hogy vagy Jankó, vagy a Kíváncsi- 
ság tette; tehát biztosan Jankó tehette. Mármost, Tuna egy macska, és a macskák állatok, tehát Tuna 
egy állat. Mivel bárkit, aki megöl egy állatot, senki sem szeret, tudjuk, hogy Jankót nem szereti senki, 
Másrészt, Jankó minden állatot szeret, tehát valaki szereti őt, tehát ez az ellentmondás áll fenn. Így 
tehát a Kíváncsiság ölte meg a macskát. 


A bizonyítás képes megválaszolni a , A Kíváncsiság ölte meg a macskát?" kérdést, de 
gyakran ennél általánosabb kérdéseket akarunk feltenni, mint például: ,,Ki ölte meg 
a macskát?" A rezolúció meg tudja válaszolni ezt is, de ennek a válasznak a levezetése egy 
kicsit több munkát igényel. A célállítás a 3w Megölifw, Tuna), amely negáláskor CNF-ben 
-Megöliíw, Tuna) lesz. Megismételve a bizonyítást a 9.12. ábrán az új negált céllal, 
hasonló bizonyítási fát kapunk, de a következő helyettesítéssel: (w/Kíváncsiság) az egyik 
lépésben. Így ebben az esetben, annak a kiderítése, hogy ki ölte meg a macskát, nem áll 
másból, mint a lekérdezés változóiban lévő lekötések nyomon követése a bizonyításban. 
Sajnos, a rezolúció csak nem konstruktív bizonyítást (nonconstructive proofs) tud 
előállítani az egzisztenciális célmondatokra. Például a -Megöli(w, Tuna) rezolválható 
a Megöli(Jankó, Tuna) V Megöli(Kíváncsiság, Tuna)-val, hogy a Megöli(Jankó, Tuna) 
mondatot megkapjuk, amely megint rezolválható ezzel: -Megöli(w, Tuna), és így kap- 
juk meg az üres klózt. Figyeljük meg, hogy ebben a bizonyításban a w-nek két külön- 
böző lekötése van. A rezolúció megmutatja azt, hogy igen, valaki megölte Tunát — vagy 
Jankó, vagy a Kíváncsiság. Ez nem túl meglepő! Egy lehetséges megoldás korlátozni 
a rezolúciós lépéseket úgy, hogy a kérdés változóinak csak egy tekötésük lehessen egy 
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9.12. ábra. Egy rezohíciós bizonyítása annak, hogy a Kíváncsiság ölte meg a macskát. Figyeljük meg a 
faktorálás használatát a Szereti( (Jankó), Jankó) kióz származtatásánál. 
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adott bizonyításban, majd képesnek keil lennünk arra, hogy visszakövessük a lehetséges 
lekötéseket. Egy másik megoldás egy speciális válasz literál (answer literal) hozzáadá- 
sa a negált célhoz, amelyből ez lesz: -Megölilw, Tuna) V Válaszíw). Ilyenkor a rezolú- 
ciós folyamat mindig generál egy pontosan egy literált tartalmazó választ, amikor egy 
ilyan klóz generálódik. A 9.12. ábrán látható bizonyításra ez a Válasz(Kíváncsiság). 
A nem konstruktív bizonyítás ezt a klózt generálná: Válasz(Kíváncsiság) V VálaszíJan- 
kó), amely nem ad számunkra választ. 


A rezolúció teljessége 


Ebben a részben bebizonyítjuk a rezolúció teljességét. A fejezet elolvasását nyugodtan 
kihagyhatja bárki. aki megelégszik azzal, hogy elhiszi ezt az állítást. 

Be fogjuk mutatni, hogy a rezolúció cáfolásteljes (refutation-complete), ami azt 
jelenti, hogy ha egy mondathalmaz kielégíthetetlen, akkor a rezotúció mindig képes 
levezetni egy ellentmondást. A rezolúció nem alkalmazható arra, hogy mondatok egy 
halmazának összes logikai következményét generálja, de használható arra, hogy meg- 
mondjuk, hogy egy adott mondat következménye-e a mondathalmaznak. Így alkalmaz- 
ható egy adott kérdésre adható összes válasz megtalálására, felhasználva a korábban 
a fejezetben már bemutatott célnegálás módszert. 

Tényként tekintjük, hogy minden (egyenlőséget nem tartalmazó) elsőrendű logikai 
mondat átírható CNF-klózok haimazára. Ez a mondat alakján végzett indukciós bizo- 
nyítással igazolható, az atomi mondatból, mint alapesetből kiindulva (Davis és Putnam, 
1960). Célunk tehát bizonyítani a következőt: ha S egy kielégíthetetlen klózhalmaz, ak- 
kor az §-en elvégzett véges számú rezolúciós lépés alkalmazása ellentmondáshoz vezet. 

Bizonyításunk váza követi Robinson eredeti bizonyítását, néhány Geneserethtől és 
Nilssontól származó egyszerűsítés hozzáadásával (Genesereth és Nilsson, 1987). A 9.13. 
ábra mutatja be a bizonyítás alapvető struktúráját, ami a következő: 


1. Először megvizsgáljuk, hogy ha $ kielégíthetetlen, akkor létezik § klózai között 
bizonyos alappéldányoknak egy olyan halmaza, ami szintén kielégíthetetlen. 
(Herbrand-tétel). 

2. Ekkor az alap rezolúciós tételhez (ground resolution theorem) fordulunk, amelyet 
a 7. fejezetben adtunk meg, és amely kijelenti, hogy a propozíciós rezolúció teljes az 
alapmondatokra. 

3. Ezután alkalmazzuk a kiterjesztéslemmárt (lifting lemma) annak megmutatására, 
hogy bármely propozíciós rezolúciós bizonyításhoz, amely alapmondatok halmazát 
használja, található olyan elsőrendű rezolúciós bizonyítás, amely azokat az elsőren- 
dű logikai mondatokat használja, amelyekből az alapmondatokat megkaptuk. 


Az első lépés elvégzéséhez szükségünk lesz három új fogalorora: 


s  Herbrand-univerzum: Ha S a klózok egy halmaza, akkor a Hs a Herbrand-uni- 
verzuma §-nek, vagyis az összes alaptermből álló halmaz, amelyet létrehozhatunk 
a következőkből: 
(a) Az S függvény szimbólumai, ha vannak ilyenek. 
(b) Az S konstansszimbólumai, ha vannak ilyenek. Ha nincs ilyen, akkor az 
A konstans szimbólum. 
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Mondatok bármely § halmaza reprezentálható klóz formájában 
Y 
Tételezzük fel, hogy S nem kielégíthető, és klóz formában van 
4  —  ——  Herbrand-tétel 
Az alappéldányoknak néhány 5" halmaza nem kielégíthető 
1 


y 1———— — , — —— Alap rezolúciós tétel 
A rezolúció talál egy ellentmondást az 57-ben 

1 

$———————  — — Kiterjesztéslemma 


Van egy bizonyítás az §7-ben lévő ellentmondásra. 











9.13. ábra, A rezolúcióteljesség bizonyításának a szerkezete 


Például, ha az § csak a —P(x, F(x, A)) A -O(x, A) V R(x, B) klózt tartalmazza, akkor a 
Hs az alapmondatok következő végtelen halmaza: 


(A, B, F(A, A), F(A. B), F(B, A), F(B, B), F(A. F(A, A)), ...) 


s  Telítődés: Ha S a klózok egy halmaza, és P az alaptermek egy halmaza, és P(S) az 
§ telített halmaza P-re vonatkoztatva, akkor P(S) az összes alapklóz halmaza, amelyet 
úgy kapunk meg, hogy alkalmazzuk az összes lehetséges konzisztens helyettesítését 
a P-beli alaptermeknek az 5-beli változókkal. 

"  Herbrand-bázis: Egy S klózhalmaznak a hozzá tartozó Herbrand-univerzumra vo- 
natkozó telítődését S Herbrand-bázisának nevezzük, és H(5)-sel jelöljük. Például, 
ha § csak a korábban példaként használt klózt tartalmazza, akkor a H(S) a következő 
végtelen klózhalmaz : 


(DP(A, H(A, AD) V 50KA, A) V R(A, B), 

-—P(B, F(B, A)) V-B, A) V R(B, B), 

-P(F(A, A), F(F(A, A), A)) V -O(F(A, A), A) V R(F(A, A), B) 
-P(KA, B), F(R(A, B), AJ) V DOKF(A, B), A) V R(R(A, B), B), ...) 


Ezek a definíciók lehetővé teszik, hogy a Herbrand-tétel (Herbrand"s theorem) 
egyik formáját állítsuk (Herbrand, 19309: 


Ha a klózok egy S halmaza nem kielégíthető, akkor létezik egy véges H(S) részhal- 
maz, amely szintén nem kielégíthető. 


Legyen S" ez a véges részhalmaza az aiapmondatoknak. Mármost, alkalmazhatjuk 
az alap rezolúciós tételt (lásd 272. oldal), hogy kimutassuk, hogy a rezolúciós! 
lezárt (resolution! closure) RC(S") tartalmazza az üres klózt. Ez azt jelenti, hogy a 
propozíciós rezolúció futtatása a teljességig az 5"-en egy ellentmondást fog eredmé- 
nyezni. 
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(Gödel nemteljesség tétele 


A matematikai indukciós sémákkal (mathematical induction schema) kibővítve az elsőrendű lo- 
gikát, Gödel nemteljesség tétele (incompleteness theorem) megmutatta, hogy léteznek olyan igaz 
aritmetikai mondatok, amelyek nem bizonyíthatók. 

A nemteljesség elmélet igazolása mintegy 30 oldalt kívánna. így túlmutat ennek a könyvnek a 
keretein, de a bizonyítás lényegét felvázoljuk a következőkben. Először a számok logikai elméletét 
vezetjük be. Ebben az elméletben egyetlen konstans létezik, a 0, és egyetlen függvény, az 5 (az utód- 
függvény). Az így létrehozott modellben 5(0) fejezi ki az 1-et, S(S(0)) jelöli a 2-t és így tovább. 
A nyelv tehát alkalmas az összes természetes szám kifejezésére. A nyelv szótára tartalmazza ezen- 
kívül a 4, a x és az exp (exponenciális) függvényszimbólumokat és a logikai összekötőjelek és 
a kvantorok szokásos halmazát. Először figyeljük meg. hogy a nyelv mondatai megszámozhatók. 
(Definiáljunk alfabetikus sorrendet a szimbólumok között, és rendezzük alfabetikus sorrendbe 
a nyelv ], 2, ..., n, ... hosszúságú mondatait.) Így minden a mondathoz hozzárendelhetünk egy 
egyedi a természetes számot, a Gödel-számot (Gödel number). Fontos tehát, hogy a számelmé- 
let minden saját mondatához tartalmaz egy nevet. Hasonlóan megszámozhatunk minden egyes P bi- 
zonyítást egy G(P) Gödel-számmal, mivel egy bizonyítás nem más, mint mondatok véges sorozata. 

Most tegyük fel, hogy adott egy A halmaz, amely a természetes számokról igaz állításokat meg- 
fogalmazó mondatokat tartalmaz. Mivel az A halmaz megadható egész számoknak egy adott halma- 
zával (az A halmazban található mondatok Gödel-számaival), ezért létre tudunk hozni a defi 
nyelvben egy a(j, A) mondatot, amely a következő állítás: 








Ni i nem a Gödel-száma a j Gödel-számú mondat olyan bizonyításának, amely bizonyítás csak 
A-beli premisszákat használ, 


Legyen a d az aítia, A) mondat, vagyis egy olyan mondat, amely kifejezi önmagának a bizonyít- 
hatatlanságát A-ból. (Igazolható, hogy ilyen mondat mindig létezik, de nem egyszerű ezt belátni.) 

Kövessük végig a következő ügyes érvelést. Tegyük fel, hogy a bizonyítható A-ból, de akkor 
a hamis, mivel a épp azt mondja ki, hogy nem igazolható. Ebben az esetben viszont létezik egy ha- 
"mis mondat, ami bizonyítható A-ból, így A nem tartalmazhatna csak igaz mondatokat — ez az előze- 
tes feltételezésünkkel ellentétes. Tehát a nem bizonyítható A-ból. Ez viszont éppen az, amit a állít 
saját magáról, tehát o egy igaz mondat. 

Tehát megmutattuk (29 és fél oldalnyi levezetést átugorva), hogy bármely. a számelméletben 
definiálható igaz mondatokat tartalmazó halmaz esetében, bizonyos alapaxiómák feltételezése mel- 
lett, léteznek olyan igaz mondatok, amelyek nem bizonyíthatók az axiómákból, Ez az eredmény, 
más következmények mellett azt jelenti, hogy a matematika bármely axiómarendszerében megfo- 
galmazható olyan tétel, amely nem bizonyítható az adott rendszer axiómáiból. Ez a matematikának 
egy igen fontos eredménye. A Gödel-tétet hatását a mesterséges intelligencia területére sokan vitat- 
ták, köztük maga Gödel is. A 26. fejezetben visszatérünk erre a kérdésre. 





Most, hogy megállapítottuk, hogy mindig van egy rezolúciós bizonyítás, amely magá- 
ban foglal néhány véges részhalmazt a Herbrand S bázisból, a következő lépés annak 
megmutatása, hogy létezik egy rezolúciós bizonyítás, amely magának az 5-nek a klózait 
tartalmazza, amelyek nem szükségszerűen alapklózok. Azzal kezdjük, hogy megvizsgál- 
juk a rezolúciós szabály egy egyszerű alkalmazását. Robinson alaplemmája magába fog- 
lalja a következő tényt: 


Legyen C€) és C5 két klóz, amelyeknek nincsenek közös változói. Legyenek Cf és C/ az 
alappéldányai C-nek és C2-nek. Ha C" rezolvense Cf-nek és C7-nek, akkor létezik egy 
olyan C kióz, amelyik (1) rezolvense C-nek és C2-nek és (2) C" alappéldánya C-nek. 


Ezt kiterjesztéslemmának (lifting lemma) nevezik, mivel kiterjeszti a bizonyítási 
lépést az alap klózokról az általános elsőrendű klózokra. A kiterjesztési lemma bizonyí- 
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tásához Robinsonnak szüksége volt az egyesítés módszerének megalkotására és a leg- 
általánosabb egyesítő tulajdonságainak levezetésére is. A bizonyítás áttekintése helyett 
a következőkben illusztráljuk a lemmát: 


Cj — P(x, F(x, A)) V DO(x. A) V R(x. B) 

Cz ——N(GWy), 2) v. P(HW), 2 

1 — —aP(H(B), F(H(B), A)) V 5O(H(B), A) V R(H(B), B) 
-N(G(B), F(FHKB), A)) V P(H(B), FKB), A) 

C" — -N(G(B), F(H(B), A)) V -2O(H(B), A) V R(H(B), B) 
C 5 -N(G0), F(HG), A)) v. -xXHC), A) V R(Hy), B) 


Látható, hogy C" valóban C alaptermje. Általánosságban ahhoz, hogy C(-nek és C4- 
nek legyen rezolvense, úgy kell létrehozni őket, hogy először a C4-beli és a C5-beli 
komplemens literálok legáltalánosabb egyesítőjét alkalmazzuk C1-re és C2-re. A kiter- 
jesztési lemma felhasználásával könnyű hasonló állításokat levezetni a rezolúciós sza- 
bály alkalmazásának bármely sorozatára: 


Bármely az 5" lezárásához tartozó C" klózhoz létezik egy S lezárásában levő C klóz, 
amelyre a C" klóz a C klóz alappéldánya, és a C levezetése azonos hosszúságú a C" 
levezetésével. 


Ebből a tényből következik, hogy ha S" lezárásában megjelenik az üres klóz, akkor ez 
szintén megtalálható az S rezolúciós lezárásában. Ez azért van, mivel az üres klóz sem- 
milyen más klóznak sem alappéldánya. Összefoglalva: megmutattuk, hogyha S nem 
kielégíthető, akkor létezik az üres klóznak egy véges méretű rezolúciós szabályt alkal- 
mazó levezetése. 

Az elmélet bizonyításában az alapklózokról az elsőrendű klózokra történő kitetjesz- 
tés az állítás erejének igen jelentős növelése. Ez abból következik, hogy az elsőrendű 
bizonyításban már csak annyiszor kell a változókat helyettesíteni, amennyiszer ez a bi- 
zonyításhoz szükséges, míg az alapklózmódszereknél szükséges volt nagyszámú önké- 
nyes példányosítást megvizsgálni. 





Az egyenlőség kezelése 


Az ebben a fejezetben az eddig leírt következtetési módszerek közül egyik sem foglalko- 
zott az egyenlőséggel. Három jól elkülöníthető megközelítést alkalmazhatunk. Az első az, 

hogy axiómákkal látjuk et az egyenlőséget — vagyis leírunk mondatokat az egyenlőségi 
relációról a tudásbázisban. El kell mondanunk, hogy az egyenlőség reflexív, szimmetri- 

kus, tranzitív, és hogy az egyenlők helyettesíthetők egyenlőkket bármely predikátumban 
vagy függvényben. Ezért van szükségünk három alapaxiómára, majd ezután egy további- 
ra minden egyes predikátumhoz vagy függvényhez: 





Vx x—x 

Vx,y xzyzy-x 

Vx,y,z XSYAYy—-ZSXxÉz 
Vx,y x—y5 (PI) SP) 
Vay xzy5 (Pk) s Po) 
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Vw,x,yZ w-yAx—z5(Filw,9)— Fi(y,2) 
Vwx,y.z wszyAx—z o (FAw,X)— Fo, 2) 


Mikor ezek a mondatok adottak, egy standard következtetési eljárás, mint amilyen a 
rezolúció elvégezhet olyan feladatokat, amelyek egyenlőségi következtetést igényelnek, 
mint például a matematikai egyenletek megoldása. 

Az egyenlőség kezelésének másik módja egy további következtetési szabály alkalma- 
Zása. A legegyszerűbb szabály, a demoduláció (demodulation) vesz egy egységklózt, 
x — yés helyettesíti az y-t bármely termmel. ami x-szel egyesíthető egy másik klózban. 
Formálisabban kifejezve ezt kapjuk: 


s Demoduláció. Bármely x, y és z termekre, ahol EGYESÍT(x, z) — 8, és az m,[z] egy 
literál, ami tartalmazza a z-t. 


tm mV. V mulz] 
my. v ... V m (HELYETTESÍTEB, y)] 


A demodulációt jellemzően arra használják, hogy leegyszerűsítsen állítások kollek- 
cióit használó kifejezéseket, mint például x -- 0 — x, x! — x és így tovább. A sza- 
bályt ki lehet terjeszteni, hogy olyan nem egység klózokkal is tudjon foglalkozni, 
amelyekben egy egyenlőségi literál megjelenik. 

"  Paramoduláció (paramodulation). Bármely x, y és z termre, ahol az EGYESÍT(x, 2) — 9. 


GV..V8VXxzy, mV. V m, [2] 
IHELYETTESTr(6, 4 V...V.£4v.mpv.... vm b] 


A demodulációval ellentétben a paramoduláció egy teljes következtetési eljárást ered- 
ményez az egyenlőséggel rendelkező elsőrendű logikában. 

Egy harmadik megközelítés az egyenlőségi következtetést teljes mértékben egy 
kiterjesztett egyesítési algoritmuson belül kezeli. Ez azt jelenti, hogy a termek egyesít- 
hetők, ha bizonyíthatóan egyenlők egy bizonyos helyettesítés alatt, ahol a , bizonyítha- 
tóan" lehetővé tesz egy bizonyos mennyiségű egyenlőségi következtetést. Például, azok 
a termek, hogy I -H 2 és 2 4 1 normális esetben nem egyesíthetők, de egy egyesítési 
algoritmus, amely ismeri, hogy x 4 y — y -k x, tudná őket egyesíteni az üres helyettesí- 
téssel. Az ilyen fajta egyenleti egyesítés (eguational unification) elvégezhető haté- 
kony algoritmusokkal, amelyeket arra terveztek, hogy a felhasznált bizonyos axiómákat 
használja (kommutativitás, asszociativitás és így tovább), ahelyett hogy explicit követ- 
keztetéseket tenne ugyanazokkal az axiómákkal. A tételbizonyítások, amelyek ezt a 
technikát használják, szoros kapcsolatban állnak a korlátozott logikai programozási 
rendszerekkel, amelyeket a 9.4. alfejezetben írtunk le. 





Rezolúciós stratégiák 


Tudjuk, hogy a rezolúció ismételt alkalmazása megtalálja a bizonyítást, ha létezik. 
Ebben a részben olyan stratégiákat tekintünk át, amelyek hatékonyan segítenek meg- 
találni a bizonyításokat. 
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Egységpreferencia 


Ez a stratégia előnybe helyezi azoknak a mondatoknak az alkalmazását, amelyek egyet- 
len literált tartalmaznak (szokták ezeket egységklóznak (unit clause) is nevezni). 
A stratégia alapötlete az, hogy próbáljunk meg létrehozni egy üres klózt, így tehát jó 
ötlet lehet előnyben részesíteni az olyan következtetéseket, amelyek rövidebb klózokat 
hoznak létre. Egy egységmondat feloldása (mint amilyen a P) egy bármely más mon- 
dattal (mint amilyen a -P v -0 V R), mindig egy olyan klózt eredményez (ebben az 
esetben: -0 VR ), amely rövidebb lesz, mint a másik klóz. Amikor az egységprefe- 
rencia-stratégiát először alkalmazták az ítéletkalkulusban, akkor ez drámai gyorsulást 
eredményezett, megvalósíthatóvá téve olyan bizonyítások elvégzését, amelyek a prefe- 
renciák meghatározása nélkül nem voltak kivitelezhetők. Az egységpreferencia azonban 
önmagában nem csökkenti le eléggé az elágazások számát a közepes méretű problémák- 
ban ahhoz, hogy ezek kezelhetők legyenek rezolúcióval. Mindenesetre a módszer egy 
hasznos heurisztika, amit jól lehet kombinálni más stratégiákkal. 

Az egységrezolúció (unit resolution) a rezolúció egy korlátozott formája, amelyben 
minden rezolúciós lépésnek tartalmaznia kell egy egységklózt. Az egységrezolúció álta- 
lában nem teljes, de a Horn-tudásbázisokban teljes. Az egységrezolúciós bizonyítások 
a Horn-tudásbázisokon emlékeztetnek az előrefelé láncolásra. 


"Támogató halmaz 


Hasznosak azok a módszerek, amelyek megpróbálják meghatározni, hogy melyik rezo- 
lúciót érdemes először elvégezni, de még hatékonyabbak, ha megpróbáljuk kizárni a 
lehetséges rezolúciók egy csoportját is. A támogató halmaz (set of support) stratégia 
pontosan ezt teszi. Az eljárás mondatok egy halmazának kiválasztásával kezdődik, 
amelyet támogató halmaznak nevezünk. Minden rezolúció egy támogató halmazbeli 
elemet és egy másik, nem halmazbeli elemet kombinál össze, és hozzáadja a rezolvenst 
a támogató halmazhoz. Ha a támogató halmaz viszonylag kicsi a tudásbázishoz képest, 
akkor a módszer alkalmazása jelentős mértékben lecsökkenti a keresési teret. 

Óvatosan kell alkalmaznunk a megközelítést, mivel az algoritmus nem lesz teljes, ha 
a támogató halmazt rosszul választjuk meg. Ha az S támogató halmazt úgy választjuk 
meg, hogy a maradék mondatok együttesen kielégíthetők, akkor a támogató halmaz stra- 
tégiáját alkalmazó rezolúció teljes. Elterjedt módszer, hogy a negált lekérdezés monda- 
tot használjuk támogató halmazkéni, azt feltételezve, hogy az eredeti tudásbázis konzisz- 
tens. (Végül is, ha a tudásbázis nem konzisztens, akkor a lekérdezésből következtethető 
tény is jelentés nélküli.) A támogató halmaz stratégiának további előnye, hogy a létreho- 
zott bizonyítási fák célorientáltak, így az olvasók számára könnyen érthetők. 


Bemeneti rezolúció 
A bemeneti rezolúció (input resolution) stratégiában minden rezolúció egy (tudásbázis- 


beli vagy lekérdező-) mondatot kombinál más mondatokkal. A 9.11. ábrán látható bizo- 
nyítás csak bemeneti rezolúciót használ. Ezt az ábrákon sok oldalkapcsolattal rendelkező 
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vonal jellemzi, ahol a kapcsolódásokon egyedi mondatok találhatók. Egyértelmű, hogy az 
ilyen alakú bizonyítási fák mérete kisebb, mint bármely más bizonyítási fáé. Horn formájú 
tudásbázisok esetében a Modus Ponens egyfajta bemeneti rezolúciós stratégia, mivel min- 
dig az eredeti TB egy mondatát kombinálja egy másik mondattal. Így nem meglepő, hogy 
a bemeneti rezolúció teljes a Horn formájú tudásbázisok esetében, de nem teljes általános 
esetben. A lineáris rezolúció (linear resolution) stratégia egy olyan általánosítás, amely 
megengedi, hogy P és 0 együtt szerepeljenek a rezolúcióban, ha P eredeti eleme a TB-nek, 
vagy ha P leszármazottja 0-nak a bizonyítási fában. A lineáris rezolúció teljes eljárás. 


Bennfoglalás 


A bennfoglalás (subsumption) módszere kizárja a keresésből azokat a mondatokat, 
amelyek benne foglaltatnak (például mert specifikusabbak) más tudásbázisbeli monda- 
tokban. Például ha P(x) megtalálható a tudásbázisban, akkor nincs értelme hozzáadni 
P(A)-t, még kevesebb értelme van hozzáadni P(A) V 0(B)-t. A bennfoglalás segít kis 
méreten tartani a 7B-t, amely a keresési tér méretének csökkentését eredményezi. 


Tételbizonyítók 


A tételbizonyítók (amelyeket automatizált következtetőknek is szoktunk nevezni) két 
szempontból különböznek a logikai programozási nyelvektől. Először is a legtöbb 10- 
gikai programozási nyelv csak Horn klózokkal dolgozik, ezzel szemben a tételbizonyí- 
tások elfogadják a teljes elsőrendű logikát. Másodszor, a Prolog programok egymásba 
fűzik a logikát és a kontrollt. Ha a programozó választása az A:-B, €-re esik az A : - 
C, B helyett, ez a program végrehajtására van hatással. A legtöbb tételbizonyításban 
a mondatok választott szintaktikai formája nincs hatással a kapott eredményekre. A té- 
telbizonyításoknak is szükségük van az információ kontrolljára, hogy hatékonyan 
működhessenek, de ezt az információt általában külön tárolják a tudásbázistól. ahelyett, 
hogy magának a tudásreprezentációnak a részeként jelenne meg. A legtöbb kutatás a 
tételbizonyítások tárgyában magában foglalja az általában hasznos kontrollstratégiákat, 
amelyek a sebességet is növelhetik. 


Egy tételbizonyítás szerkesztése 


Ebben a részben leírjuk az OTTER (Organized Technigues for Theoremproving and 
Effective Research) nevű tételbizonyítót (McCune, 1992), különös figyelmet fordítva á 
vezérlési stratégiájára. Ahhoz, hogy egy problémát készítsen elő az OTTER számára, 
a felhasználónak négy részre kell osztania a tudásbázist: 


. Egy klózhalmazra, melyet támogató halmaznak (set of support) (vagy sos-nek) 
nevezünk, és amely definiálja a problémáról szóló legfontosabb tényeket. Minden 
rezolúciós lépés a támogató halmaz egy tagját rezolválja egy másik axiómához ké- 
Pest, tehát a keresést a támogató halmazra koncentráljuk. 
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s A használható axiómákra (usable axioms), amely egy halmaz a támogató halma- 
zon kívül. Ez háttértudást biztosít a problématerületről. A határ megválasztása a 
probléma részei (tehát ami az sos-en belül van) és a háttér (tehát a használható axió- 
mák) között a felhasználó megítélésén múlik. 

s Az egyenletek egy halmazára, amelyeket átírásoknak (rewrites) vagy demodulá- 
toroknak (demodulators) nevezünk. Habár a demodulátorok egyenletek, mindig 
balról jobbra irányban alkalmazzák őket. Így tehát egy kanonikus formát határoz- 
nak meg, amelyben az összes term leegyszerűsödik. Például az x -t 0 — x demo- 
dulátor kimondja, hogy minden termet az x -t- 0 formában az x termmel kell helyet- 
tesíteni, 

s Paraméterek és klózok egy halmazára, amelyek meghatározzák a vezérlési straté- 
giát. A felhasználónak egy heurisztikus funkciót szükséges specifikálni, hogy 
kontrollálja a keresést, és egy szűrő funkciót, hogy kitöröljön néhány lényegtelen 
részcélt. 


Az OTTER úgy működik, hogy folyamatosan rezolválja a támogatóhalmaz egy elemét 
az egyik használható axiómával szemben. A Prologgal ellentétben, ez egy , a legjobbat- 
először" keresést használ. A heurisztikus funkciója megméri minden egyes klóz , súlyát", 
ahol a könnyebb klózokat részesíti előnyben. A heurisztika egzakt kiválasztása a felhasz- 
nálón múlik, de általában a klóz súlyának korrelálnia kell a méretével vagy a nehézségével. 








procedure OTTER (sos, használható) 
inputs: sos, egy támogató halmaz — a problémát meghatározó klózok (egy globális változó) 
használható, háttértudás, amely potenciálisan releváns a problémával 


klóz — az sos legkönnyebb tagja 

átteszi a klóz-t az sos-ből a használható-ba 

FELDOLGOZ(KÖVETKEZTET(klóz, használható), s05) 
until sos — [] or egy cáfolatot talál 





function KÖVETKEZTET(Álőz, használható) returns klózokat 


rezolvál kiőzok-at a használható minden egyes tagjával 
return az eredményezett klózokat a FILTER alkalmazása után 





Procedure FELDOLGOZ(Klózok, 505) 


for each kióz in kiózok do 
któz — EGYSZERŰSÍTÉKtóz) 
egybevon megegyező líterálokat 
selejtez klózt, ha az tautológia 
sos €— [klózlsos] 
if a klóz-nak nincs literálja then egy cáfolatot talált 
if a klóz-nak egy literálja van then keres egység cáfolatot 











9.14. ábra. Az OTTER tételbizonyítás vázlata. A heurisztikus kontrollt alkalmazzák a , legkönnyebb" klóz 
kiválasztására és a FILTER funkcióban, amely kitörli a jelentéktelen klózokat a további vizsgálatból. 
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Az egységklózokat könnyűként kezeljük; így tehát a keresést az egységpreferencia-straté- 
gia általánosításának tekinthetjük. Minden egyes lépésnél az OTTER átteszi a , legköny- 
nyebb" klózt a támogatóhalmazból a használható listára, és hozzáadja a használható listá- 
hoz a legkönnyebb klóz és a használható lista elemeinek rezolválásakor keletkezett néhány 
közvetlen következményt, Az OTTER leáll, amikor talál egy cáfolatot, vagy amikor nincs 
több klóz a támogatóhalmazban. Az algoritmus a 9.14. ábrán látható részletesebben. 


A Prolog kiterjesztése 


Egy tételbizonyító létrehozásának alternatív módja, ha a Prolog fordítóból indulunk ki, 
és ezt kiterjesztjük úgy, hogy egy helyes és teljes következtetőgépet kapjunk a teljes 
elsőrendű logikához. Ezt a megközelítést alkalmazták a Prolog Technológia Tételbizo- 
nyítóban (Prolog Technology Theorem Prover, PTTP) (Stickel, 1988). A PTTP négy 
jelentős változtatást tartalmaz a Prologhoz képest, hogy helyreállítsa a teljességet és a 
kifejezőképességet: 


" Az előfordulási próba visszakerül az egyesítési folyamatba, hogy azt biztosabbá tegye. 

s A mélységi keresést felváltja egy iteratívan mélyülő keresés. Ez a keresési stratégiát 
teljessé teszi, és csak egy konstans értékkel vesz több időt igénybe. 

" A negált literálok (mint a -?(x)) engedélyezettek. A megvalósításban két különálló 
folyamat van, az egyik a P-t akarja bebizonyítani, a másik a —P-t. 

s Egy n atommal rendelkező klóz n különböző szabályként kerül tárolásra. Például az 
A 6 B A €-t úgy is tárolnánk, mint -8 — C A A és úgy is, mint -C 5 B A -A. 
Ez a technika, amelyet zárásnak (locking) nevezünk, azt eredményezi, hogy az 
aktuális célt csak minden egyes klóz fejével kell egyesíteni, de még így is lehetővé 
teszi a negálás helyes kezelését. 

" A következtetést teljessé teszik (még a nem Horn-klózokra is) a lineáris bemeneti 
szabály hozzáadásával: ha a z aktuális cél egyesül a veremben lévő egyik cél negált- 
jával, akkor azt a célt rezolváltnak kell tekinteni. Ez egy módja az ellentmondások- 
kal való következtetésnek. Tételezzük fel, hogy az eredeti cél a P, és ezt redukáltuk 
következtetések sorozatával a —P célra. Ez a -P 5. P mondatra vezet, amely logi- 
kailag egyenértékű a P-vel, 


A felsorolt változtatások ellenére a PTTP megőrzi azokat a tulajdonságokat, amelyek 
a Prologot gyorssá teszik. Az egyesítések még így is a változók közvetlen változtatásá- 
val történnek úgy, hogy a lekötések feloldása a visszalépés során az útvonal lezárásával 
együtt történik. A keresési stratégia itt is a bemeneti rezolúción alapszik, ami azt jele- 
neti, hogy minden rezolúció a probléma egyik eredeti kijelentésében megadott klózzal 
szemben történik (és nem egy származtatott klózzal). Ez lehetővé teszi a probléma ere- 
deti kijelentésében adott összes klóz lefordítását. 

A PTTP fő hátránya az, hogy a felhasználó elveszít minden vezérlési lehetőséget 
a megoldások keresése során. Minden következtetési szabályt a rendszer mind az ere- 
deti. mind a kontrapozitív formájában felhasznál. Ez nehezen értelmezhető kereséseket 
eredményez. Például figyeljük meg ezt a szabályt: 


Vey— fia, b) —(r—aAgy-b) 
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Prolog szabályként tekintve, ez is egy következetes módja annak a bizonyításának, 
hogy két f term megegyezik. De a PTTP még a kontrapozitív állítást is generálhatja: 


(za) s(fix.y) zfla bb Ap - b) 


Úgy tűnik, hogy ez igen fáradságos módja annak, hogy bizonyítsuk két term, x és a kü- 
lönbözőségét. 


Tételbizonyítások mint segédeszközök 


Eddig úgy tekintettünk a következtető rendszerekre, mint független ágensre, amelynek 
önállóan kell döntéseket hoznia és cselekednie. A tételbizonyítások másik felhasználá- 
sa, amikor segítőként használjuk, és tanácsokkal lát el, mondjuk egy matematikust. 
Ebben a használati módban a matematikus felügyelőként viselkedik, feltérképezi a kö- 
vetkező lépés meghatározásának stratégiáját, hogy mi legyen, és megkéri a tételbizo- 
nyítót, hogy töltse ki a részleteket. Egy bizonyos fokig mellékessé teszi a félig eldönt- 
hetőség problémáját, mivel a felügyelő megszüntethet egy lekérdezést, és próbálhat egy 
másik megközelítést, ha a lekérdezés túl sok időt vesz igénybe. A tételbizonyítás bízo- 
nyítás-ellenőrzőként (proof checker) is működhet, ahol a bizonyítást mi adjuk meg 
vázlatosan, nagyobb lépések sorozataként, és a rendszer tölti ki az egyedi következteté- 
sek részleteit, amelyek igazolják lépéseink helyességét. 

A $ocratic következtető (Socratic reasoner) egy tételbizonyító, amelynek a KÉRDEZ 
függvénye nem teljes, de amely mindig elérkezhet egy megoldáshoz, ha a megfelelő kér- 
déssorozatot tesszük fel. Így tehát a Socratic következtetők jó segítők, feltéve, ha van 
egy felügyelő, aki a megfelelő KÉRDEZ hívásokat összeállítja. Az ONTIC (McAllester, 
1989) egy Socratic következtető rendszer matematikai tételbizonyításhoz. 





A tételbizonyítások gyakorlati felhasználása 


A tételbizonyítók újszerű matematikai eredményeket produkáltak. A SAM (Semi- 
Automated Mathematics) program volt az első, amely bebizonyított egy lemmát a rácsel- 
méletben (Guard és társai, 1969). Az AURA program szintén nyitott kérdéseket válaszolt 
meg a matematika különféle területein (Wos és Winker, 1983). A Boyer-Moore-tétel- 
bizonyítót (Boyer és Moore, 1979) sok éven keresztül használták és bővítették. 
Natarajan Shankar ezt használta fel, hogy megadja az első teljes, precíz formális bízo- 
nyítását Gödel nemteljesség tételének (Shankar, 1986). Az OTTER program az egyik 
legerősebb tételbizonyító. Használták a kombinatorikus logika néhány nyitott kérdésé- 
nek megoldására. A legismertebb ezek közül a Robbins-algebra. 1933-ban Herbert 
Robbins egy egyszerű axiómasorozatot javasolt, amely a Boole-algebra definiálására 
látszott alkalmasnak, de nem találtak hozzá bizonyítást (több matematikus, köztük 
Alfred Tarski, jelentős munkája ellenére). 1996. október 10-én, nyolc nap számítás után 
az EOP (az OTTER egyik változata) megtalálta a bizonyítást (McCune, 1997). 

A tételbizonyításokat alkalmazhatjuk a hardver- és szoftvertervezésben a verifikáció 
(verification) és a szintézis (synthesis) során felmerülő problémákra, mivel mindkét 
tárgyterülethez lehetséges megfelelő axiómarendszert definiálni. Így tehát a tételbizonyí- 
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tási kutatást megtalálhatjuk a hardvertervezés, a programozási nyelvek és a szoftver- 
fejlesztés területein is — nem csupán az MI-ben. A szoftver esetében az axiómák meg- 
határozzák a programozási nyelv minden egyes szintaktikus elemének tulajdonságait. 
(A programokról történő következtetés eléggé hasonló az akciókról történő következ- 
tetéshez a szituációkalkulusban.) Egy algoritmus akkor tekinthető igazoltnak, ha 
a kimenetei megfelelnek a specifikációnak minden bemenet mellett. Az RSA nyilvános 
kulcskódolási algoritmust és a Boyer-Moore-féle húrillesztési algoritmust is ilyen 
módon igazolták (Boyer és Moore, 1984). A hardver esetében az axiómák leírják a jelek 
és az áramkör elemei közötti interakciókat (lásd a 8. fejezetbeli példát). Egy 16 bites 
összeadó tervét az AURA igazolta (Wojcik, 1983). A logikai következtetők, amelyeket 
speciálisan igazolásokra terveztek, egész CPU-kat voltak képesek verifikálni, beleértve 

Az algoritmusok formális szintézise volt a tételbizonyítások egyik első felhasználása, 
amint azt Cordell Green (Green, 1969a) felvázolta, aki Simon korábbi ötleteire támaszko- 
dott (Simon, 1963). Az alapötlet az volt, hogy egyféle módon bizonyítsák azt a tételt, hogy 
s létezik egy p program, amely eleget tesz egy bizonyos specifikációnak". Ha a bizonyítást 
úgy korlátozzuk, hogy konstruktív legyen, a program maga is kinyerhető lesz a bizonyítás- 
ból. Habár ez egy teljesen automatizált deduktív szintézis (deductive synthesis), leg- 
alábbis így nevezzük, még nemigen használható általános célú programok készítésére, ám 
a kézzel irányított deduktív szintézis már sikeresen tervezett néhány újszerű és bonyolult 
algoritmust. A speciális célú programok szintézise szintén aktív kutatási terület. Az AURA 
tételbizonyítót sikerrel alkalmazták a hardverszintézis területén olyan áramkörök tervezé- 
sére, amelyek kompaktabbak, mint minden azt megelőző terv (Wojciechowski és Wojcik, 
1983). Sok áramkör tervezésénél az ítéletlogika elegendő, mivel a legfontosabb ítéletállí- 
tások halmaza rögzített, ugyanis ezek az áramkör elemeit írják le. Az ítéletlogikai követ- 
keztetés alkalmazása a hardverszintézisben ma már egy standard technika, amelynek sok 
nagyméretű hálózati alkalmazása létezik (lásd például Nowick és társai, 1993). 

Ugyanezeket a technikákat mostanában kezdik el alkalmazni a szoftverek verifiká- 
ciójához is, például a SPIN modell ellenőrző programmal (Holzmann, 1997). A Remote 
Agent űrhajó vezérlési programot például sikerült verifikálni a repülés előtt és után 
(Havelund és társai, 2000). 
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Az elsőrendű logikai következtetés egy elemzését mutattuk be, továbbá számos algorit- 
must, melyek ilyen következtetéseket képesek végrehajtani. 


s Egy első megközelítés következtetési szabályokat használ kvantorok példányosítá- 
sára azért, hogy átalakítsa a következtetési problémát az ítéletkalkulusra. Ez a meg- 
közelítés jellemzően nagyon lassú megoldásokat eredményez. 

s A egyesítés használata, azaz a megfelelő helyettesítések megkeresése változókhoz, 
megszünteti a példányosítás lépését az elsőrendű bizonyításokban, és így sokkal 
hatékonyabbá teszi a folyamatot. 

s A Modus Ponens kiterjesztett változata az egyesítést használja, létrehozva egy ter- 
mészetes és nagy modellező erejű következtetési szabályt, az általánosított Modus 
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Ponenst (generalized Modus Ponens). Az előrefelé láncolás (forward chaining) 
és a hátrafelé láncolás (backward chaining) algoritmusok határozott klózok hal- 
mazára alkalmazzák ezt a szabályt. 

s Az általánosított Modus Ponens teljes a határozott kiózokra, habár a következtetési 
probléma félig eldönthető (semidecidable). A Datalog programok esetében, amely 
programok csak függvénymentes határozott klózokat tartalmaznak, a következtetés 
eldönthető. 

s Az előrefelé láncolást a deduktív adatbázisokban tdeductive databases) használ- 
ják, ahol sikeresen kombinálják ezt a módszert a relációs adatbázis más műveleteivel. 
Ezenkívül az előrefelé láncolást használják a produkciós rendszerekben (produc- 
tion systems) is, amelyek hatékonyan képesek frissíteni a tudásbázisukat nagymére- 
tű szabályhalmazokkal is. 

s Az előrefelé láncolás teljes a Datalog programokra, és polinomiális időben fut. 

s A hátrafelé láncolást a logikai programozási rendszerekben (logic programming 
systems) használják, mint amilyen például a Prolog, amely kifinomult fordítási 
technikákat alkalmaz, hogy biztosítsa a gyors következtetést. 

s A hátrafelé láncolásban sok a felesleges következtetés, és előfordulhatnak végtelen 
hurkok. Ezeket a memók gyűjtésével (memoization) lehet kezelni. 

s Az általánosított rezolúciós (resolution) következtetés teljes bizonyítási rendszer az 
elsőrendű logikában. Az eljárás konjunktív normál formájú tudásbázisokat használ 
fel. 

" Számos stratégia ismert a rezolúciós rendszerek keresési terének a csökkentésére, 
anélkül hogy a teljességet veszélybe sodornánk. A hatékony rezolúcióalapú tétel- 
bizonyításokat felhasználták, hogy érdekes matematikai tételeket bebizonyítsanak, 
és hogy verifikáljanak, valamint szintetizáljanak szoftvereket és hardvereket. 


Irodalmi és történeti megjegyzések 


A logikai következtetéseket széles körben vizsgálták már az ókori görög matematiku- 
sok is. Az Arisztotelész által legtöbbet vizsgált következtetési módszer a szillogizmus 
(syilogism) volt. A szillogizmus , szituációkra" és ,hangulatokra" bontható a termek 
mondatbeli sorrendjétől függően (amelyeket predikátumoknak nevezünk ma) és az 
egyes termek általánosságának mértékétől függően (amit ma a kvantorok segítségével 
értelmezünk), illetve attól függően, hogy a termek negálva voltak-e. A legalapvetőbb 
szillogizmus, amely az első szituáció első hangulata, a következő: 


Minden § az M is. 
Minden M a P is. 
Ezért minden S a P is. 


Arisztotelész más szillogizmusok érvényességét is megpróbálta igazolni, visszavezetve 
ezeket az első szituációra. Pontosan leírta az egyes szillogizmusokhoz tartozó hangula- 
tokat és szituációkat, de a szillogizmusok igazolása már kevésbé volt precíz. 

(Gottlob Frege, aki teljes elsőrendű logikát fejlesztett ki 1879-ben, következtetési 
rendszerét logikailag érvényes sémák nagyméretű gyűjteményére és egyetlen következ- 
tetési szabályra alapozta, a Modus Ponensre. Frege kihasználta azt a tényt, hogy ennek 
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a formának , A P-ből következtesd a 0-t" következtetési szabályának a hatását szimu- 
lálhatja a Modus Ponens alkalmazásával a P-re, egy logikailag érvényes sémával, a 
P: 0-val. A kifejezésnek ezt az , axiomatikus" stílusát, amely a Modus Ponenst, plusz 
számos logikailag érvényes sémát használ, Frege után még számos matematikus hasz- 
nálta; a leginkább említésre méltó, hogy a Principia Mathematicában (Whitehead és 
Russell, 1910) is felhasználták. 

A következtetési szabályok, mint az axiomatikus sémáktól különálló dolgok álltak a 
természetes dedukció (natural deduction) központjában, amelyet Gerhard Gentzen 
és Stanislaw Jáskowski vezetett be (Gentzen, 1934; Jáskowski, 1934). A természetes 
dedukciót azért nevezik , természetesnek", mert nem kívánja meg a mondatok átalakí- 
tását az (olvashatatlan) normál formára, és következtetési szabályaikat úgy tervezték, 
hogy az emberek számára természetesnek tűnjenek. Prawitz egy egész könyv hosszú- 
ságú elemzést adott a természetes dedukcióról (Prawitz, 1965). Gallier az automatikus 
dedukció elméleti alátámasztásának kifejtéséhez alkalmazta Gentzen szekvenciáit 
(Gallier, 1986). 

A klózforma felfedezése nagy jelentőségű lépés volt az elsőrendű logika matemati- 
kai elemzésének kifejlesztésében. Whitehead és Russell (Whitehead és Russell, 1910) 
kiterjesztették az úgynevezett átviteli szabályt [maga a kifejezés Herbrandtól származik 
(Herbrand, 1930)], amit a kvantoroknak a formula elé történő kiemelésére alkalmaztak. 
A Skolem-konstansokat és a Skolem-függvényeket, viszonylag precíz leírást adva, 
Thoralf Skolem vezette be (Skolem, 1920). A skolemizáció teljes eljárása, a Herbrand- 
univerzum fontos fogalmának bevezetésével együtt egy későbbi írásban található 
(Skolem, 1928). 

Herbrand elmélete, amit Jacgues Herbrand francia matematikusról neveztek el, fontos 
szerepet játszott az automatikus következtető rendszerek módszereinek fejlesztésében, 
mind a Robinsonhoz fűződő rezolúció bevezetése előtt és után (Herbrand, 1930). Ezt 
tükrözi az, hogy habár maga a fogalom valójában Skolem eredménye, erre ,, Skolem- 
univerzum" helyett , Herbrand-univerzumként" hivatkozunk. Herbrandot említhetjük még 
az egyesítés felfedezőjeként is, mivel az egyesítés algoritmus egy változata megtalálható a 
(Herbrand, 1930)-ban. Gödel (Gödel, 1930) mutatta meg, Skolem és Herbrand elméle- 
teire építve, hogy az elsőrendű logikának létezik teljes bizonyítási eljárása. Alan Turing 
és Alonzo Church egymástól függetlenül, igen különböző bizonyításokat alkalmazva 
megmutatták, hogy az érvényesség kérdése az elsőrendű logikában nem eldönthető 
(Turing, 1936; Church 1936). Enderton kiválóan megfogalmazott írása egy precíz, de 
viszonylag érthető stílusban magyarázza el ezeket az eredményeket (Enderton, 1972). 

Habár McCarthy (McCarthy, 1958) javasolta először az elsőrendű logika használatát 
reprezentációs feladatokra és következetésre az MI-ben, az első ilyen rendszert a mate- 
matikai tételbizonyítás iránt érdeklődő matematikai logika kutatói fejlesztették ki. Ab- 
raham Robinson javasolta először, hogy használják az ítéletlogikára történő átalakítást 
és Herbrand-elméletet együtt. Gilmore (Gilmore, 1960) készített először egy olyan prog- 
ramot, amely ezen a megközelítésen alapult. Davis és Putnam (Davis és Putnam, 1960) 
vezették be a klózformát, és hoztak létre egy olyan programot, amely megkísérelt cáfo- 
latokat találni, oly módon, hogy a Herbrand-univerzum elemeit a változók helyére 
alapklózokat helyettesítve és ítéletinkonzisztenciákat keresve az alapklózok között. 
Prawitz (Prawitz, 1960) vezette be azt az alapötletet, hogy az ítéletinkonzisztencia lekér- 
dezése vezesse a keresési folyamatot, és azt is, hogy csak akkor hozzunk létre termeket 
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a Herbrand-univerzumban, hogyha ez szükséges az ítélet-inkonzisztencia megállapítása 
céljából. Más kutatók egyéb fejlesztései után, ez a gondolat vezette el J. A. Robinsont 
(nem rokona az előzőnek) a rezolúció módszerének kifejlesztéséhez (Robinson, 1965). 
Az úgynevezett , inverz módszer", amit egyidejűleg fejlesztett ki S. Maslov szovjet kuta- 
tó, kissé eltérő elveken alapult, mint Robinson rezolúciós módszere, de hasonló számí- 
tási előnyöket nyújt a propozicionalizációhoz képest (Maslov, 1964, 1967). Wolfgang 
Bibel kapcsolati módszere (connection method) e megközelítés kiterjesztésének 
tekinthető. 

A rezolúció kifejlesztése után az elsőrendű következtetéssel foglalkozó munkák kü- 
lönböző irányokban ágaztak el. Az MI-ben a rezolúciót a kérdés-válasz rendszerekre 
adoptálta Cordell Green és Bertram Raphael (Green és Raphael, 1968). Egy kevésbé 
formális megközelítést alkalmazott Carl Hewitt (Hewitt, 1969). Az ő PLANNER nyelve, 
habár sohasem valósították meg teljességében, előfutára volt a logikai programozás- 
nak, és útmutatásokat tartalmazott az előrefelé és hátrafelé láncoláshoz, valamint a ne- 
gáltak sikertelenségének vizsgálati módszeréhez. Az eredeti nyelv egy részét, a MICRO- 
PLANNER-t (Sussman és Winograd, 1970) megvalósították és felhasználták az SHRDLU 
természetes nyelvek megértését segítő rendszerben (Winograd, 1972). A korai MI- 
alkalmazások jelentős erőfeszítést tettek olyan adatstruktúrák előállítására, amelyek 
lehetővé teszik tények hatékony előhívását. Ezeket a munkákat is bemutatják az MI- 
programozással kapcsolatos cikkek (Charniak és társai, 1987; Norvig, 1992; Forbus és 
de Kleer, 1993). 

A hetvenes évek elejére az előrefelé láncolás (forward chaining) jól megalapozott- 
nak tekinthető az MI-ben, egy könnyen érthető alternatívája lett a rezolúciónak. Rend- 
szerek széles körében került felhasználásra, Nevins geometriai tételbizonyítójától (Nevins, 
1975) a VAX konfigurációjához használt RI szakértői rendszerig (McDermott, 1982). 
Az MI-alkalmazások jellemzően nagyszámú szabályt tartalmaztak. tehát fontos volt kifej- 
leszteni hatékony szabályillesztési technológiát, különösen az inkrementális frissítések 
problémájára. A produkciós rendszerek (production systems) technológiáját azért 
fejlesztették ki, hogy segítse az ilyen típusú az alkalmazások megvalósítását. Az Ops-5 
produkciós rendszer nyelvet (Forgy, 1981; Brownston és társai, 1985) használták az 
R1-hez és a S0AR kognitív szerkezetéhez (ILLaird és társai, 1987). Az Ops-5 tartalmazta a 
rete illesztési folyamatot is (Forgy, 1982). A SOAR, amely új szabályokat generál, hogy 
megőrizze a megelőző számítások eredményeit, igen nagy szabályhalmazokat állíthat elő 
— több mint 1 000 000 szabályt a TACAIR-SOAR rendszer esetében, amely katonai repü- 
lőgépek szimulációját kontrollálja (Jones és társai, 1998). A CLIPS (Wygant, 1989) egy 
€-alapú produkciós rendszer nyelv, amelyet a NASA-nál fejlesztettek ki, és hatékony 
integrációt tett lehetővé más programokkal, eszközökkel és érzékelő rendszerekkel, vala- 
mint felhasználták űrjárművek automatizálására és egyéb harcászati alkalmazásokra. 

A deduktív adatbázisokként (deductive databases) ismert kutatási terület szintén 
hozzájárult az előrefelé következtetés megértéséhez. Egy Toulouse-i szellemi műhely- 
ben kezdődött a munka 1977-ben, amelyet Jack Minker szervezett, összehozva a logi- 
kai következtetési és az adatbázisrendszerekkel foglalkozó szakembereket (Gallaire és 
Minker, 1978). Egy történeti áttekintés (Ramakrishnan és Ullman, 1995) szerint: a ,.de- 
duktív [adatbázis-] rendszerek megkísérlik a Prolog adaptálását, a skis mennyiségű 
adatx megközelítésről a vnagymennyiségű adatx világára." Így tehát, ennek a munkának 
a célja az, hogy egybeolvassza a relációs adatbázis technológiát, amelyet nagyméretű 
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tényhalmazok előhívására terveztek, a Prolog-alapú következtetési technológiával, 
amely jellemzően egyszerre csak egy tényt hív elő. A deduktív adatbázisokról szóló 
szövegek közé tartoznak az (Ullman, 1989) és a (Ceri és társai, 1990) munkák. 

Chandra és Harel (Chandra és Harel, 1980), valamint Ullman (Ullman, 1985) nagy 
hatású munkái a Datalognak mint egy, a deduktív adatbázisokhoz kidolgozott standard 
nyelvnek az elfogadásához vezettek. Az , alulról felfelé" irányú következtetés, az elő- 
refelé láncolás szintén standard lett — részben azért, mert elkerüli a leállási problémákat 
És a felesleges számítások problémáját, amely a hátrafelé láncolásnál előfordul, és rész- 
ben azért, mert természetesebben felhasználható az alapvető relációs adatbázis-operáci- 
óőkhoz. A mágikus halmazok (magic sets) technikája a szabályok átírására, amelyet 
Bancilhon (Bancilhon és társai, 1986) fejlesztettek ki, lehetővé tette az előrefelé lánco- 
lásnak, hogy a hátrafelé láncolástól kölcsönözze a célorientáltság előnyös tulajdonságát. 
A , fegyverkezési verseny" kiegyenlítése céljából, a táblázatos logikai programozási 
módszerek kölcsönveszik a dinamikus programozás előnyét az előrefelé láncolástól. 

A logikai következtetések komplexitásáról szerzett tudásunk legnagyobb része a 
deduktív adatbázisokkal foglalkozó tudományos közösségből származik. Chandra és 
Merlin (Chandra és Merlin, 1977) mutatták ki először, hogy egy egyszerű nem rekur- 
Zív szabály (vagyis egy konjunktív lekérdezés (conjunctive guery) az adatbázisok 
terminológiájában) illesztése NP-nehéz lehet. Kuper és Vardi (Kuper és Vardi, 1993) 
javasolták az adatkomplexitás (data complexity) használatát — annak a mértéknek 
a használatát, ami a komplexitást, mint az adatbázis méretének egy függvényét méri, 
miközben a szabály méretét konstansnak tekinti — a lekérdezések megválaszolásának 
mértékére. Gottlob és társai (Gottlob és társai, 1999b) a konjuktív lekérdezések és a 
kényszerkielégítés közötti kapcsolatot vizsgálták, megmutatva. hogy a hiper-fák lebon- 
tása hogyan optimizálja az illesztési folyamatot. 

Mint azt már előzőleg említettük, a hátrafelé láncolás (backward chaining) Hewitt 
PLANNER nyelvében jelent meg a logikai következtetéshez (Hewitt, 1969). A logikai kö- 
vetkeztetés magától értetődően ettől a munkától függetlenül fejlődött tovább. A lineá- 
ris rezolúció egy korlátozott változatát, amelyet SL-rezolúciónak (SL-resolution) 
nevezünk, Kowalski és Kuehner (Kowalski és Kuehner, 1971) fejlesztette ki Loveland 
modelleliminációs (model elimination) technikájára építve (Loveland, 1968). Ennek 
a határozott klózokra alkalmazott változata az SLD-rezolúció (SLD-resolution), amely 
önmagában alkalmas határozott klózok, mint programok interpretálására (Kowalski, 
1974; 1979a; 19796). Ezalatt, 1972-ben, a francia kutató, Alain Colmerauer kifejlesztette 
és alkalmazni kezdte a Prologot, a természetes nyelvek elemzésének céljából. A Prolog 
klózait először kontextusmentes nyelvtani szabályoknak szánták (Roussel, 1975; Colme- 
rauer és társai, 1973). Az elméleti háttér túlnyomó részét a logikai programozás részé- 
re Colmerauerrel együttműködve Kowalski fejlesztette ki. A szemantikai definíció, 
amely a rögzített pontokat használja, Van Emdennek és Kowalskinak köszönhető (Van 
Emden és Kowalski, 1976). Kowalski (Kowalski, 1988) és Cohen (Cohen, 1988) jó tör- 
téneti áttekintést nyújtanak a Prolog eredetéről. A Logikai programozás alapjai (Foun- 
dations of Logic Programming) (Lloyd, 1987) egy elméleti elemzése a Prolog és egyéb 
logikai programozónyelvek megalapozásának. 

A hatékony Prolog fordítókat általában a Warren Abstract Machine (WAM) számítá- 
si modelljére alapozzák, amelyet David H. D. Warren (Warren, 1983) fejlesztett ki. Van 
Roy (Van Roy, 1990) megmutatta, hogy a további fordítási technikák alkalmazása, mint 
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amilyen a típusinterferencia, versenyképessé teszi a Prolog programokat a C programok- 
kal a sebesség tekintetében. A Japán Ötödik Generációs projekt, amely egy 1982-ben 
kezdődő 10 éves kutatási erőfeszítés volt, teljes egészében a Prologon, mint az intellí- 
gens rendszerek kifejlesztésének alapeszközén alapult. 

A rekurzív logikai programok felesleges ciklusainak elkerüléséhez egymástól függet- 
lenül Smith (Smith és társai, 1986), valamint Tamaki és Sato (Tamaki és Sato, 1986) 
fejlesztettek ki módszereket. Az utóbbi tanulmány tartalmazta a memók gyűjtését is a 
logikai programokra, egy olyan módszert, amelyet teljes mértékben David S. Warren 
fejlesztett ki a táblázatos logikai programozás (tabted logic programming) módsze- 
rében. Swift és Warren (Swift és Warren, 1994) bemutatták, hogy hogyan terjesszük ki 
a WAM-ot táblázatok kezelésére, amely képessé tette a Datalog programokat, hogy egy 
nagyságrenddel gyorsabban fussanak, mint az előrefelé láncolást alkalmazó deduktív 
adatbázisrendszerek. 

A korai elméleti munkákat a korlátozott logikai programozás területén Jaffar és 
Lassez végezték (Jaffar és Lassez, 1987). Jaffar és társai (Jaffar és társai, 1992a) ki- 
fejlesztették a CLP(R) rendszert a valós értékű kényszerek kezelésére. Jaffar (Jaffar és 
társai, 1992b) általánosította a WAM-ot, létrehozva ezzel a CLAM-ot (Korlátozott 
Logikai Absztrakt Gép, Constraint Logic Abstract Machine) a CLP megvalósításainak 
specifikálásához. Ait-Kaci és Podelski (Ait-Kaci és Podelski, 1993) bemutattak egy 
kifinomult LIFE-nak nevezett nyelvet, amely egyesíti a CLP-t a funkcionális progra- 
mozással és az öröklődés következtetéssel. Kohn (Kohn, 1991) egy ambiciózus pro- 
jektet mutat be a korlátozott logikai programozás használva, a valós idejű vezérlési 
architektúrákat megalapozva, teljesen automata pilóták alkalmazására. 

A logikai programozásról és a Prologról számos könyvet írtak. A Logika a probléma- 
megoldáshoz (Logic for Problem Solving) (Kowalski, 1979b) egy korai általános tanul- 
mány a logikai programozásról. A Prologgal foglalkozó könyvek közé tartoznak 
Clocksin és Mellish (Clocksin és Mellish, 1994), Shoham (Shoham, 1994) és Bratko 
(Bratko, 2001) írásai. Marriott és Stuckey (Marriott és Stuckey, 1998) kitűnő leírását 
adják a CLP-nek. A 2000-ben történt megszűnéséig a Journal of Logic Programming 
volt a téma legfontosabb folyóirata; helyét mára átvette a Theory and Practice of Logic 
Programming. A logikai programozások konferenciái között a legjelentősebbek az Inter- 
national Conference on Logic Programming (ICLP) és az International Logic Program- 
ming Symposium (ILPS). 

A kutatások a matematikai tételbizonyítások (mathematical theorem proving) terü- 
letén már az első teljes elsőrendű logikai rendszerek kifejlesztése előtt megkezdődtek. 
Herbert Gelernter Geometriai Tételbizonyítója (Gelernter, 1959) heurisztikai keresési 
módszereket használt diagramokkal kombinálva, hogy kiselejtezze a hamis részcélokat, és 
képes volt bebizonyítani néhány nagyon bonyolult eredményt az euklideszi geometriában. 
Ettől kezdve azonban nem volt jelentős együttműködés a tételbizonyítás és az MI között. 

A korai munkák a teljességre koncentráltak. Robinson korszakalkotó tanulmányát köve- 
tően a demodulációs és a paramodulációs szabályokat az egyenlőségi következtetésekre 
"Wos (Wos és társai, 1967), valamint Wos és Robinson (Wos és Robinson, 1968) vezették 
be, ebben a sorrendben. Ezeket a szabályokat a term átírási rendszerek kontextusában is 
kifejlesztették (Knuth és Bendix, 1970). Az egyenlőségi következtetés beépítése az egye- 
sítési algoritmusba Gordon Plotkinnak köszönhető (Plotkin, 1972); ez fontos vonása volt a 
OLISP-nek is (Sacerdoti és társai, 1976). Jouannaud és Kirchner (Jouannaud és Kirchner, 


9.6. ÖSSZEFOGLALÁS 381 


1991) az egyenlőségi egyesítést a termek átírásának szempontjából vizsgálják. Hatékony 
algoritmusokat a standard egyesítésre Martelli és Montanari (Martelli és Montanari, 1976), 
valamint Paterson és Wegman (Paterson és Wegman, 1978) fejlesztettek ki. 

Az egyenlőségi következtetések mellett a tételbizonyítások tartalmaztak különféle 
speciális célú döntési folyamatokat. Nelson és Oppen (Nelson és Oppen, 1979) javasol- 
tak egy nagy hatású sémát az ilyen eljárásoknak egy általános következtetési rendszer- 
be integrálására. Más módszerek is hasonló problémákkal foglalkoztak, beleértve 
Stickel (Stickel, 1985) , elméleti rezolúcióját", valamint Manna és Waldinger (Manna 
és Waldinger, 1986) , speciális relációit". 

Számos vezérlési stratégiát javasoltak a rezolúcióra, kezdve az egységpreferencia 
stratégiával (Wos és társai, 1964). A támogató halmaz stratégiát Wos (Wos és társai, 
1964) javasolta, hogy biztosítson egy bizonyos fokú célorientáltságot a rezolúcióban. 
A lineáris rezolúció először Lovelandnél (Loveland, 1970) jelent meg. Genesereth és 
Nilsson (Genesereth és Nilsson, 1987, 5. fejezet) rövid, de átfogó elemzést nyújtanak a 
vezérlési stratégiák széles skálájáról. 

Guard és társai (Guard és társai, 1969) egy korai SAM tételbizonyítót írnak le, amely 
segített megoldani egy megoldatlan problémát a rácselméletben. Wos és Winkler (Wos 
és Winkler, 1983) áttekintést nyújtanak az AURA tételbizonyító eredményeiről, amelye- 
ket a matematika és a logika különböző területein fellelhető problémák megoldása terén 
ért el. McCune (McCune, 1992) ezt folytatja, amikor felhasználja ezeket az eredménye- 
ket az AURA utódjának, az OTTER-nek alkalmazásában megoldatlan problémák megoldá- 
sára. Weidenbach (Weidenbach, 2001) bemutatja a SPASS-t, az egyik legerőteljesebb je- 
lenlegi tételbizonyítót. A Computational Logic (Boyer és Moore, 1979) című könyv az 
alapreferencia a Boyer-Moore-tételbizonyítókhoz. Stickel (Stickel, 1988) leírja a Prolog 
Technológiai Tételbizonyítót (PTTP), amely egyesíti a Prolog fordítás előnyeit a mo- 
dell elimináció teljességével (Loveland, 1968). A SETHEO (Letz és társai, 1992) egy 
másik széles körben használt tételbizonyító, amely hasonló megközelítésen atapul; 
másodpercenként több millió következtetést tud végrehajtani egy 2000-es munkaállo- 
máson. A LEANTAP (Beckert és Posegga, 1995) hatékony tételbizonyító, amelyet mind- 
össze 25 Prolog sorral valósítottak meg. 

Az automata programszintézisről szóló korai munkákat Simon (Simon, 1963), Green 
(Green, 1969a), valamint Manna és Waldinger (Manna és Waldinger, 1971) készítették. 
Burstall és Darlington transzformációs rendszere (Burstall és Darlington, 1977) egyen- 
lőség következtetést használt a rekurzív programszintézishez. A Kips (Smith, 1990, 1996) 
az egyik legerősebb modern rendszer; amely egy szakértő segédeszközként működik. 
Manna és Waldinger (Manna és Waldinger, 1992) egy áttekintő bevezetést adtak a téma- 
kör aktuális helyzetéről fókuszba állítva a saját deduktív megközelítésüket. Az Automating 
Software Design (Lowry és McCartney, 1991) számos, a témáról szóló tanulmányi gyűj- 
tött össze. A logikának a hardvertervezésben való felhasználásáról Kern és Greenstreet 
(Kern és Greenstreet, 1999) adott egy áttekintést; Clarke (Clarke és társai, 1999) műve 
pedig a modellellenőrzéssel foglalkozik a hardververifikálásban. 

A Computability and Logic (Boolos és Jeffrey. 1989) egy jó referencia a teljesség és 
a nem eldönthetőség témaköréhez. Számos korai tanulmány a matematikai logikáról 
megtalálható a From Frege to Gödel: A Source Book in Mathematical Logic (van 
Heijenoort, 1967) című könyvben. A tiszta matematikai logika témakörének folyóirata 
a Journal of Symbotic Logic. Az automatizált dedukció irányába haladó könyvek közé tar- 
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tozik a klasszikus Syenbotic Logic and Mechanical Theorem Proving (Chang és Lee, 
1973), és számos más írás, köztük Wos, Bibel és Kaufmann később íródott munkái (Wos 
és társai, 1992; Bibel, 1993; Kaufmann és társai, 2000). Az Automation of Reasoning c. 
antológia (Siekmann és Wrightson, 1983) sok fontos korai tanulmányt tartalmaz az auto- 
matizált dedukcióról. További áttekintő műveket írtak Loveland (Loveland, 1984) és 
Bundy (Bundy, 1999). A legjelentősebb folyóirat a tételbizonyítások területén a Journal 
of Automated Reasoning: a legfontosabb konferencia az évente megtartott Conference on 
Automated Deduction (CADE). A tételbizonyítás területén folyó kutatás szintén szoros 
kapcsolatban áll a logika használatával a programok és programozási nyelvek elemzésé- 
ben, amely tárgyban a legfőbb konferencia a Logic in Computer Science. 


Feladatok 


9.1. — Vezesse le az alaptételekből, hogy az univerzális példányosítás helyes, és azt, 
hogy az egzisztenciális példányosítás következtetési szempontból egyenértékű 
tudásbázist hoz létre. 


9.2. A Szereti( János, Fagylalt) mondatból kiindulva logikusnak tűnik arra követ- 
keztetni, hogy Ax Szeretitx, Fagylalt). Adjon meg egy általános következtetési 
szabályt, az egzisztenciális bevezetést (Existential Introduction), amely meg- 
erősíti ezt a következtetést. Gondosan vizsgálja meg a feltételeket, amelyeket ki 
kell elégíteni a felhasznált változókkal és termekkel. 


9.3. — Tételezzük fel, hogy egy tudásbázis csak egy mondatot tartalmaz: 3x OlyanMa- 
gasMinkx, Everest). A következők közül melyek a törvényszerű következmé- 
nyei az Egzisztenciális Példányosítás alkalmazásának? 

(a) OlyanMagasMint( Everest, Everest) 
(b) OlyanMagasMinkKilimandzsáró, Everest) 
(c)  OlyanMagasMint(Kilimandzsáró, Everest) N 
OlyanMagasMini( BenNevis, Everest) 
(a szabály kétszeri alkalmazása után). 


9.4. — Adja meg az alábbi atomi mondatpárok legáltalánosabb egyesítőjét, ha egyáltalán 
létezik ilyen: 
(a) P(A, B, B), Pex,y, 2) 
(b) 00. G(A, B)), O(G(x, x). y) 
(c) Idősebb(Apjaty), y), Idősebb(Apja(x), János) 
(d)  Ismeri(Apjaty), y), Ismeri(x, x) 


9.5. Figyelje meg a 9.2. ábrán bemutatott bennfoglalási rácsokat. 
(a) Hozza létre a rácsot a következő mondatra: Alkalmaz(AnyjatJános), Ap- 
Jja(Richárd)). 
(b) Hozza létre a rácsot a következő mondatra: AlkalmaztIBM, y) (,. Mindenki 
az IBM-nél dolgozik"). Figyeljen arra, hogy minden olyan lekérdezést fel- 
soroljon, amely egyesíthető a mondattal. 
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9.6. 


9.7. 


9.8. 


9.9. 


9.10. 


(c) Tételezzük fel, hogy a TÁROL indexel minden egyes mondatot, minden 
egyes csomópontra a bennfoglalási rácsban. Magyarázza meg, hogy a 
BETÖLT eljárásnak hogyan kell működnie, amikor néhány mondat ezek kö- 
zül változókat is tartalmaz; példaként használja a mondatokat az (a) és (b) 
részfeladatokból, és a következő lekérdezést: Alkalmaz(x, Apjatx)). 


Tételezzük fel, hogy betöltjük egy logikai adatbázisba az amerikai választási 
címjegyzéket, amely felsorolja a korát, a lakóhelyét, a születési dátumát és az 
anyja nevét minden személynek, társadalombiíztosítási számokat használva azo- 
nosító adatként. Így tehát György kora így van megadva: Kora(443-65-1282, 
56). A következő $1-S5 indexelő sémák melyike tesz lehetővé hatékony meg- 
oldást a 01-04 lekérdezésekre (tekintsünk egy normál hátrafelé láncolást)? 


S1: egy index minden egyes atomra minden egyes pozícióban. 





gy index a predikátum és az első argumentum minden egyes kombiná- 
ciójára. 

s — §5: egy index a predikátum és a második argumentum minden egyes kormn- 

binációjára, és egy index minden egyes első argumentumra (nem standard). 

O1: Kora(443-44-4321, x) 

02: Lakik(x, Houston) 

03: Anyja(x, y) 

04: Kora(x, 34) A Lakikíx, PiciVárosUSA) 





.... 


Feltételezhetnénk, hogy az egyesítés során a változó konfliktus problémáját el- 
kerülhetjük úgy, ha minden mondatnál egyszerre átnevezzük az összes változót 
a tudásbázisban. Mutassa meg, hogy léteznek olyan mondatok, amelyekre ez a 
megközelítés nem alkalmazható. (Segítség: tekintsünk egy olyan mondatot, 
amelynek egyik része egyesíthető a többivel.) 


Mutassa meg, hogy hogyan írhatunk meg egy tetszőleges méretű adott 3-SAT 
problémát, egy elsőrendű határozott klózt és nem több, mint 30 alaptényt fel- 
használva. 


Adja meg az alábbi mondatok olyan logikai reprezentációját. amely alkalmas arra, 
hogy az Általánosított Modus Ponens szabályt alkalmazzuk rájuk: 

(a) A lovak, a tehenek és a malacok emlősök. 

(b) Egy ló leszármazottja is ló. 

(c) Kékszakáll egy ló. 

(d) Kékszakáll Charlie szülője. 

(e) A leszármazott és a szülő inverz relációk. 

(0. Minden emlősnek van szülője. 


Ebben a problémában a 9.4. feladatban bemutatott mondatokat fogjuk használni. 
Válaszolja meg a következő kérdéseket hátrafelé láncolást alkalmazva! 
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9.11. 


9.12. 


9.13. 


9.14 


9.15. 
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(a) Rajzolja fel egy kimerítő hátrafelé láncolás algoritmus bizonyítási fáját a 
következő mondat igazolásához: 3k Ló(h) 

(b) Mi figyelhető meg erről a tárgyterületről? 

(c) Hány megoldás származtatható le A-ra a mondatokból? 

(d) Tudna-e olyan módszert mondani, amellyel mindet megkaphatjuk? (Segítség: 
érdemes megnézni (Smith és társai, 1986).) 


Egy népszerű találós kérdés gyerekeknek a következő: , Nincs se bátyám, se nő- 
vérem, mégis annak az embernek az apja az én apám fia." Használja fel a család 
tárgykör szabályait (lásd 7. fejezet), és mutassa meg, hogy ki is az említett em- 
ber. Használhatja bármelyik, a fejezetben bemutatott következtetési módszert. 


Kövesse nyomon a 9.6. ábrán látható hátrafelé láncolási algoritmus végrehajtá- 
sát, amikor azt a bűntény probléma megoldására alkalmazzuk. Mutassa be azt az 
érték-szekvenciát, amelyet a célok változó vesz fel, és rendezze egy fa formába. 


A következő Prolog kód egy P predikátumot határoz meg: 


P(X, [XIYI) 
P(X, [Y]21) :-P(x,2) 


(a) Mutasson be bizonyítási fákat és megoldásokat ezekre a lekérdezésekre: 
P(Af1,2,3])ésP(2,[1,A,3)) 
(b) Milyen standard operációs listát reprezentál a P? 


Ebben a feladatban megvizsgáljuk egy sorbarendezés megvalósítását a 

Prologban. 

(a) Írjon Prolog-klózokat, amelyek definiálják a rendezés (L) predikátu- 
mot, amely akkor és csakis akkor igaz, ha az L lista emelkedő sorrendben 
van rendezve. 

(b) Írjon egy Prolog-definíciót erre a predikátumra: perm (LL, M), amely akkor 
és csakis akkor igaz, ha az L a permutációja az M-nek. 

(c) Definiálja a rendez (ILL, M)-et (az M egy válogatott verziója az L-nek) 
a perm és a rendezés használatával. 

(d) Futtassa a rendez predikátumot minél hosszabb listákon, amíg el nem 
veszíti a türelmét. Mekkora a programjának az időkomplexitása? 

(e) Írjon egy gyorsabb rendező algoritmust Prologban, mint amilyen például a 
beszúrásos válogatás vagy a gyorsválogatás (guicksort). 


Ebben a feladatban megvizsgáljuk az újraíró szabályok rekurzív alkalmazását a 
logikai programozás felhasználásával. Egy újraíró szabály (vagy demodulátor 
az OTTER terminológiában) egy egyenlet egy megadott iránnyal. Például az 
x-40— x újraíró szabály azt sugallja, hogy minden, az x -- 0-hoz illeszkedő ki- 
fejezést fel kell cserélni x-re. Az újraíró szabályok alkalmazása központi része 
az egyenletkövetkeztető rendszereknek. Ezt a predikátumot fogjuk használni: 
újraír(X, Y) az újraíró szabályok reprezentálására. Például a korábbi újraíró 
szabályt így írtuk: újraír (X-0 , X). Néhány term primitív, és nem lehet tovább 
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9.16. 


9.17. 


9.18. 


9.19. 


egyszerűsíteni; így tehát ezt fogjuk írni: primitív (0) , ami azt jelenti, hogy a 

0 egy primitív term. 

(a) Írjon egy definíciót az egyszerűsít (X, Y) predikátumra, amely akkor 
igaz, amikor az Y az egyszerűsített változata X-nek — tehát amikor már több 
újraíró szabály nem alkalmazható az Y egyik részkifejezésére sem. 

(b) Írjon egy szabálygyűjteményt az aritmetikai operátorokat tartalmazó kife- 
jezések egyszerűsítésére, és alkalmazza az egyszerűsítési algoritmusát né- 
hány minta kifejezésre. 

(c) Írjon egy újraíró szabálygyűjteményt a szimbolikus differenciálásra, és 
használja az egyszerűsítési szabályaival együtt, hogy differenciáljon, és 
egyszerűsítsen aritmetikai kifejezéseket tartalmazó kifejezéseket, beleértve 
a hatványozást. 


Ebben a feladatban megvizsgáljuk a keresési algoritmusok alkalmazását a Pro- 
logban. Tételezzük fel, hogy a következő (X, Y) akkor igaz, ba az Y állapot 
az X állapotot követi; és ha a cél (X) akkor igaz, amikor az X a célállapot. Ír- 
jon egy definíciót a megold (X , P) -re, ami azt jelenti, hogy a P az útvonal (az 
állapotok listája), amely az X-szel kezdődik, a célállapotban végződik, és szabá- 
lyos lépésekből áll. amelyeket a következő határoz meg. Valószínűleg a 
mélységi keresés a legkönnyebb módja annak, hogy ezt végrehajtsa. Mennyire 
lenne könnyű egy heurisztikus keresési vezérlés hozzáadása? 


Hogyan alkalmazható a rezolúció annak megmutatásra, hogy egy mondat 
(a) érvényes-e? 
(b) kielégíthetetlen-e? 


Abból a mondatból, hogy ,a lovak állatok" következik-e, hogy , egy ló feje egy 

állat feje". Demonstrálja, hogy ez a következtetés érvényes, ha végrehajtjuk a 

következő lépéseket: 

(a) Fordítsa le a premisszát és a következményt az elsőrendű logika nyelvére. 
Használjon három predikátumot: Feje(li, x), LÓ(x) és Állattx)! 

(b) Negálja a következményt, és konvertálja a premisszát és a negált következ- 
ményt konjunktív normál formára! 

(c) Mutassa meg a rezolúció felhasználásával. hogy a következmény valóban 
következik a premisszából! 


Tekintsük a következő két elsőrendű logikai mondatot: 

(A): vx gy 462y) 
(B): 3y Vx 42y) 

(a) Legyenek a változók lehetséges értékei a természetes számok 0), I, 2, ..., 00. 
és jelentse a , 2" predikátum azt, hogy , nagyobb vagy egyenlő". Fordítsa le 
ezeket a mondatokat magyarra ebben az interpretációban! 

(b) Igaz-e (A) ebben az interpretációban? 

(c) [Igaz-e (B) ebben az interpretációban? 

(d) Maga után vonja-e az (A) mondat a (B) mondatot? 

(e) Maga után vonja-e a (B) mondat az (A) mondatot? 
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9.21. 
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(f) Próbálja meg a rezolúció felhasználásával bizonyítani, hogy (A) követke- 
zik (B)-ből! Tegye meg ezt akkor is, ha azt gondolja, hogy (B) nem vonja 
maga után (A)-t; folytassa az eljárást addig, amíg a bizonyítás már nem 
folytatható. Tüntesse fel az egyesítő helyettesítéseket minden rezolúciós 
lépésnél! Ha a bizonyítás sikertelen. magyarázza meg, hogy hol, hogyan és 
miért akad meg! 

(g) Most próbálja meg igazolni azt, hogy (B) következik (A)-ból! 


A rezolúció változókkal való lekérdezésekre létrehozhat nem konstruktív bizonyí- 
tásokat, ezért egy speciális eljárást kell bevezetnünk a definit válaszok kinyerésére. 
Magyarázza meg, hogy ez a probléma miért nem merül fel csak definit klózokat 
tartalmazó tudásbázisokkal! 


Ebben a fejezetben azt mondtuk, hogy a rezolúció nem használható egy mondat- 
halmaz összes logikai következményének a generálására. Van olyan algoritmus, 
ami képes erre? 


10. TUDÁSBÁZIS REPREZENTÁCIÓ 


Ebben a fejezetben megmutatjuk, hogy az elsőrendű logikát hogyan kell használni a 
valódi világ olyan legfontosabb aspektusainak ábrázolására, mint a cselekvés, a tér, 
az idő, a mentális események és a bevásárlás. 


Az utolsó három fejezet a tudásalapú ágens technológiáját mutatta be, avagy az ítélet- 
és az elsőrendű logika szintaxisát, szemantikáját, bizonyításelméletét és az ilyen logi- 
kákat használó ágens implementációját. Ebben a fejezetben azzal a kérdéssel foglalko- 
zunk, hogy milyen tartalmat tegyünk az ágens tudásbázisába, azaz, hogy a világról szóló 
tényeket hogyan reprezentáljuk. 

A 10.I. alfejezet bevezeti az általános ontológia gondolatát, amely világban mindent 
a kategóriák hierarchiájába szervez. A 10.2. alfejezet az objektumok és a szubsztan- 
ciák alapvető kategóriáival foglalkozik. A 10.3. alfejezet a cselekvések reprezentációját 
elemzi, amelyek a tudásalapú ágens megtervezése szempontjából központi fontossá- 
gúak, továbbá bemutatja a tér-idő darabkák, az események (events) általánosabb 
fogalmát. A 10.4. alfejezet a hiedelmekkel foglalkozik, a 10.5. alfejezet pedig az egé- 
szet egybefogja az internetes bevásárlás kontextusában. A 10.6. és a 10.7. alfejezet 
a bizonytalan és a változó ismeretekkel dolgozó specializált következtető rendszerek- 
kel foglalkozik. 


10.1. ONTOLÓGIASZERVEZÉS 


s Játék" tárgyterületeken a reprezentáció megválasztása nem annyira lényeges. Könnyű 
egy konzisztens fogalomkészletet kialakítani. Az olyan komplex területeken azonban, 
mint például az interneten történő bevásárlás vagy egy robot vezérlése változó fizikai 
környezetben, általánosabb és rugalmasabb reprezentációra van szükség. Ebben a feje- 
zetben megmutatjuk, hogy ilyen reprezentációkat hogyan lehet létesíteni, olyan általá- 
nos fogalmakra fókuszálva, mint a Cselekvés, az Idő, a FizikaiObjektum és a Hiedelem, 
amelyek számos tárgyterületen fordulnak elő. Ezen absztrakt fogalmak reprezentálását 
néha ontológiaszervezésnek (ontological engineering) nevezik. Az ontológiaszervezés 
kapcsolatban áll a 8.4. alfejezetben leírt tudásszervezés folyamatával, de a hatása 
szélesebb körű. 

A világról mindent reprezentálni ijesztő perspektíva. Valójában természetesen nem 
fogjuk mindennek a komplex leírását megadni — ez még egy 1000 oldalas könyvnek is 
sok lenne -, de megjelöljük világosan annak a helyét. ahova egy tetszőleges területről 
szóló új tudás beilleszthető. Így például definiálni fogjuk, hogy mit is jelent fizikai 
objektumnak lenni, és a különböző objektumok részletei — robotok, tv-készülékek, köny- 
vek vagy bármi más — később illeszthetők ebbe a keretbe. A fogalmak egy általános 
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keretét felső ontológiának (upper ontology) nevezzük, mert az az általános konvenció, 
hogy a gráfszerű ábrázolásnál az általánosabb fogalmak felül helyezkednek el, a konk- 
rétabb fogalmak pedig alul (lásd 10.1. ábra). 

Mielőtt az ontológiát tovább tekintenénk, egy fontos figyelmeztetést kell tennünk. 
A tudás tartalmának és szervezésének a megvitatására elsőrendű logikát választottunk. 
A valódi világ bizonyos aspektusait ezen a nyelven nehéz lesz kifejezni. Egy alapvető 
tulajdonságot kénytelenek leszünk kihagyni: azt, hogy minden általánosítás alól létez- 
nek kivételek. vagy hogy a részletesebb információ hiányában csupán az alapértel- 
mezést tekinthetjük, vagy pedig hogy minden általánosítás csak egy bizonyos mértékig 
érvényes. Bár a ,paradicsom piros" hasznos szabály. van zöld, sárga és narancssárga 
paradicsom is. Hasonló kivételeket ebben a részfejezetben majdnem mindegyik állítás 
esetén lehet találni. A kivételek és a bizonytalanság kezelése nagyon fontos képessé- 
gek, azonban egy általános ontológia megértéséhez viszonyítva ortogonálisak. Ezért a 
kivételek és az alapértelmezés megvitatását a 10.6. alfejezetre, a bizonytalan információ 
sokkal általánosabb témáját pedig a 13. fejezetre hagyjuk. 

Milyen haszna van egy felső ontológiának? Gondoljunk vissza a 8.4. alfejezet áram- 
köri ontológiájára. Megkonstruálásánál igen sok egyszerűsítő feltételezéssel éltünk. Így 
például az időt teljes egészében ki is hagytuk. A jelek rögzítettek voltak, és a jeltovább- 
terjedésről nem is esett szó. Az áramkörök struktúrája változatlan maradt. Az általá- 
nosság felé úgy tudnánk lépni, hogy a jeleket konkrét időpillanatokban definiálnánk és 
foglalkoznánk a vezetékek hosszával, valamint a vezetékekben és a berendezésekben 
fellépő jelterjedési késleltetésekkel. Ezzel szimulálni tudnánk az áramkör időzítési tulaj- 
donságait; és valóban az áramkörtervezők gyakran folyamodnak is az ilyen elemzéshez. 
A kapuk érdekesebb osztályait is be lehetne vezetni, például leírva a technológiát (TTL, 
MOS, CMOS stb.) és a bemeneti/kimeneti specifikációkat is. Ha a megbízhatósággal 
vagy diagnózissal szeretnénk foglalkozni, engedélyezni kellene, hogy az áramkör struktú- 
rája spontán módon megváltozhasson. A szórt kapacitások figyelembevételéhez a tisztán 
topológiai reprezentációval fel kellene hagyni, és át kellene térni a geometriai tulajdonsá- 
gok valósághűbb leírására. 





Akármi 


sz eT Te 


Absztrakt objektumok Események 


Halmazok Számok  Reprezentációs intervallumok Helyek Fizikai —— Folyamatok 
objektumok objektumok 





Kategóriák —— Állítások — Mérések Pillanatok Dolgok Anyagok 


Idők — Súlyok Állatok Ágensek Szilárd Folyadékok Gázok 
tesrek 


Emberek 


101. ábra. A világ ontológiájának felsőbb szintjei, amelyek a fejezetben később tárgyalt témákat mutatják. 
Minden él azt jelzi, hogy az alsó fogalom a felső fogalom egy specializálódása. 
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Hasonló megfontolások érvényesek, ha a wumpus világát nézzük. Bár foglalkozunk 
az idővel, ennek struktúrája igen egyszerű. A dolgok csak az ágens cselekvésével egy 
időben történnek, és minden változás azonnali jellegű. Egy általánosabb, a valódi világ- 
hoz jobban illeszkedő ontológia engedélyezné például, hogy az egyidejű változásoknak 
legyen időbeli kiterjedésük. Arra, hogy egy konkrét négyzetben csapda van, a Csapda 
konstanst használtuk, mert minden csapda azonos volt. Engedélyezni lehetne a csapdák 
több fajtáját is, a csapdák osztályához tartozó, eltérő tulajdonságú példányokat használ- 
va. Hasonló módon több állatfajtát is be tudnánk vezetni a wumpuson kívül. Elképzel- 
hető, hogy a rendelkezésre álló érzékelésekből az állat konkrét fajtáját nehéz lenne 
megállapítani. Az ágens megsegítésére a wumpus világ biológiai taxonómiáját fel le- 
hetne állítani, hogy gyenge nyomravezető jelekből képes legyen megjósolni az állat vi- 
selkedését. 

Az ilyen módosítások révén minden speciális rendeltetésű ontológiában lehetséges 
egy nagyobb általánosság felé elmozdulni. A nyilvánvaló kérdés ilyenkor az, hogy kon- 
vergálnak-e ezek a módosítások egy általános célú ontológiához? Évszázadokon át folyó 
filozófiai és számítási kutatások után a válasz az, hogy , lehetséges", Ebben a fejezetben 
egy lehetséges változatot mutatunk be, amely az évszázadok során született gondolatok 
szintetizálását képviseli. Az általános célú ontológiának két olyan fő jellemzője van, 
ami azt a speciális rendeltetésű ontológiák sokaságától megkülönbözteti: 


s Az általános ontológiát (a tárgytartományra vonatkozó axiómák hozzáadásával) többé- 
kevésbé minden speciális rendeltetésű tárgytartományban kell tudnunk alkalmazni. 
Lehetőség szerint tehát egyetlen reprezentációs problémával sem lehet ravaszkodni 
vagy azt a szőnyeg alá söpörni. 

" Minden kellően igényes tárgytartományban a tudás egyes részeit egyesíteni kell, 
hiszen a következtetés és a problémamegoldás egyszerre több területet is igényel- 
het. Egy robot áramkörjavító rendszer esetén például az áramkörökről a villamos 
összeköttetések és a fizikai elrendezés szempontjából kell tudnunk következtetni, 
de az idő az áramkör-időzítési analízis és a munkaköltségek szempontjából egy- 
aránt lényeges. Az időt leíró állításokat tehát össze kell tudnunk kombinálni a fizi- 
működniük nanomásodpercekre é. és percekre is, valamint nanométerekre és méte- 
rekre is. 


Miután az általános ontológiát megalkottuk, felhasználjuk az internetes bevásárlás 
tárgytartományra. Ez a tárgytartomány több mint alkalmas arra, hogy az ontológiánk- 
kal kísérletezzünk. Sok helyet hagy az olvasó részére is, hogy a reprezentációba a saját 
kreativitását is bevihesse. Gondoljunk például arra, hogy egy interneten bevásárló 
ágensnek rengeteg témát és szerzőt kell ismernie, hogy az Amazon.com-tól könyveket 
vásároljon, élelmiszerek egész választékáról kell tudnia, hogy a Peapod.com-nál élel- 
miszert vásároljon, és mindenről, amit egy bolhapiacon találni lehet ismeretekkel kell 
rendelkeznie, hogy az Ebay.com1-nál az alkalmi jó üzletekre vadásszon. 


1 Az olvasó elnézését kérjük, ha rajtunk kívül eső okok miatt ezen online boltok valamelyike a könyv olva- 
sásának pillanatában már nem működik. 
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10.2. KATEGÓRIÁK ÉS OBJEKTUMOK 


Az objektumok kategóriákba (categories) való szervezése a tudásreprezentáció szem- 
pontjából létfontosságú. Bár a világgal való kölcsönhatás az egyedi objektumok szintjén 
történik, a következtetések zöme a kategóriák szintjén valósul meg. A bevásárló célja egy 
kosárlabda megvásárlása és nem egy konkrét kosárlabdapéldánynak, mondjuk KL.9-nek 
a megvétele. Ha az objektumok osztályozását elvégeztük, kategóriák segítségével meg- 
jósolhatjuk az objektumok tulajdonságait. Érzékelő jelek alapján következtetünk bizo- 
nyos objektumok jelenlétére, az érzékelt tulajdonságokból következtetünk, hogy az ob- 
jektumok milyen kategóriákhoz tartoznak, majd a kategóriákra vonatkozó ismereteket 
felhasználhatjuk, hogy az objektumokra vonatkozóan előrejelzéseket hozzunk. Így pél- 
dául a zöld, foltos felület, a tekintélyes nagyság és az ovális vagy gömbszerű alak alap- 
ján görögdinnyére következtethetünk; a görögdinnyére vonatkozó ismereteink alapján 
pedig arra, hogy az felhasználható lenne gyümölcssaláta készítéséhez. 

Az elsőrendű logikában a kategóriák reprezentálására két alapvető választásunk le- 
het: a predikátumok és az objektumok. Használhatunk egy KosárLabda(!) prediká- 
tumszimbólumot, vagy a kategóriát KosárLabda objektumként reifikálhatjuk 
(reification). Mondhatjuk akkor, hogy Eleme(t, KosárLabda) (rövidítve ! e Kosár- 
Labda) annak a kifejezésére, hogy ! a kosárlabda-kategória eleme. Azt mondjuk, 
hogy Részhalmaza(KosárLabda, Labda) (rövidítve KosárLabda € Labda) annak a 
kifejezésére, hogy a KosárLabda a Labda egy alkategóriája vagy részhalmaza. Egy 
kategóriát tekinthetünk az elemeiből álló halmaznak, de egy sokkal bonyolultabb 
objektumnak is képzelhetjük, olyannak, amire az Eleme és a Részhalmaza relációk 
definiáltak. 

A kategóriák öröklődés (inheritance) révén szolgálják a tudásbázis szervezését és 
egyszerűsítését. Ha kijelentjük, hogy az Élelem kategória minden egyes példánya ehe- 
tő, és feltételezzük, hogy a Gyümölcs Élelem, az Alma viszont a Gyümölcs kategória 
egy alosztálya, akkor tudjuk, hogy minden alma ehető. Azt mondjuk, hogy az egyes 
almák az ehetőségi tulajdonságukat örökölték (inherit), jelen esetben az Élelem kate- 
góriához való tartozás révén. 

Az alosztály-relációk a kategóriákat taxonómiába vagy taxonomikus hierarchiába 
(taxonorny, taxonomic hierarchy) szervezik. A taxonómiákat tudományos területeken 
évszázadok óta alkalmazták. Így például a rendszerező biológia az összes élő és kihalt 
faj taxonómiáját igyekszik megadni, a könyvtártudomány az összes tudományos terü- 
letet átfogó taxonómiáját — a Dewey Decimális rendszert — alakította ki, az adóhatósá- 
gok és más kormányzati szervek a foglalkozások és termékek kiterjedt taxonómiáját 
hozták létre. A taxonómiák — ahogy a további elemzéseinkben látni fogjuk — fontos as- 
pektusai a józan ész tudásnak is. 

A kategóriákról az elsőrendű logikában könnyű állításokat megfogalmazni az objek- 
tumok és a kategóriák egymáshoz való rendelésével vagy a kategóriához tartozó egye- 
dek szerinti kvantifikálás révén: 


s Egy objektum egy kategória egyede, például: 
KL9 € KosárLabda 

s Egy kategória egy másik kategória alosztálya, például: 
KosárLabda C Labda 
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" Egy kategória összes egyede egy bizonyos tulajdonsággal rendelkezik, például: 
Vx € KosárLabda — Gömbölyű) 
" Egy kategória egyedeit bizonyos tulajdonságaik alapján fel lehet ismerni, például: 
Narancsszinűlx) A Gömbölyííx) A Ármérő(x) — 24 A x € Labda 5 x € KosárLabda 
" Egy kategóriának önmagában bizonyos tulajdonságai vannak, például: 
Kutya € HonosítottFajta 


Jegyezzük meg, hogy mivel a Kutya egy kategória és a HonosítottFajta kategóriának 
egy egyede, így a HonosítottFajta a kategóriák kategóriája. A kategóriák kategóriáinak 
a kategóriáiról is lehetne beszélni, de ennek kevés a haszna. 

Bár az alosztály- és az egyedrelációk a kategóriák szempontjából a legfontosabbak, 
olyan kategóriák közötti relációkat is ki szeretnénk fejezni, amelyek egymásnak nem 
alosztályai. Ha például azt mondjuk, hogy a Hím és a Nőstény az Állat alosztályai, ez- 
zel nem mondtuk azt, hogy egy hím nem lehet nőstény. Azt mondjuk, hogy két vagy 
több kategória diszjunkt (disjoint), ha közös egyedei nincsenek. Ha tudjuk azt is, hogy 
a hímek és a nőstények kölcsönösen kizárják egymást, attól még nem tudjuk, hogy egy 
állatnak, amely nem hím, nősténynek kell lennie, hacsak nem mondjuk ki, hogy a 
hímek és a nőstények az állatok kimerítő felosztását (exhaustive decomposition) 
képezik. A diszjunkt kimerítő felosztás a partíció (partition). Ezt a három fogalmat az 
alábbi példák illusztrálják: 


Diszjunkt(tÁllat, Zöldség) 
KimerítőFelosztás( tAmerikai, Kanadai, Mexikói) , ÉszakAmerikai) 
Partíció(( Hím, Nőstény), Áltar) 


(Jegyezzük meg, hogy az ÉszakAmerikai KimerítőFetosztás-a nem Partíció, mert vannak 
kettős állampolgárságú személyek is.) E három predikátum definíciója az alábbi: 


Diszjunkt(s) 62 (c, c2 CL ESACZESACp cz 5 Metszettc, c) — ( )) 
KimerítőFelosztás(s, c) nb (WiiEcs J3c2 cC2ESATE c) 
Partícióts, c) $ Diszjunkr(s) A KimerítőFetosztás(s. c) 


Kategóriákat úgy is definiálhatunk, hogy megadjuk a tagságuk elégséges és szükséges 
feltételeit. Például egy agglegény egy felnőtt, nem házas férfi: 


x € Agglegény s NemHázas(x) A x € Felnőtt A x € Férfi 


Ahogy erről a természetes fajtákról szóló rövid kitérőben szó lesz, a kategóriák szigorú 
logikai definíciója nem mindig lehetséges, és nem is mindig szükséges. 


Fizikai összetétel 


Az a gondolat, hogy egy objektum része lehet egy másik objektumnak, nem újkeletű. 
"Valakinek az orra része a fejének, Románia Európa része, ez a fejezet a könyvünk egy 
része. Hogy megmondhassuk, hogy egy dolog része egy másiknak, egy általános Része 
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relációt fogunk használni. Az objektumokat tehát Része hierarchiába lehet szervezni, 
ami hasonlít a Részhalmaza hierarchiára: 


RészelBukarest, Románia) 
Részei Románia, KeletEurópa) 
Része(KeletEurópa, Európa) 
Része(Európa, Föld) 


A Része teláció tranzitív és reflexív, azaz: 


Része(x, y) A Részety, 2) 5 Része(x, 2) 
Része(x, x) 


Ebből adódóan kikövetkeztethető, hogy Része(Bukarest, Föld) 

Az összetett objektumok (composite object) kategóriáit gyakran ezen objektumok 
részei között értelmezett strukturális relációkkal jellemezzük. Például egy kétlábúnak 
pontosan két lába van, ami egy testhez van rögzítve: 


KétLábú(a) — 314, 12, b LálXI)) A Lá4fo) A Test(b) A Részell, a) A Részeto, a) 
A Részetb, a) A Rögzített, b) A Rögzítettb,, b Ah zh 
A (wIz LábtIz) A Részetlz, a) 2 (3-hvhzb) 


A , pontosan kettő" jelölés egy kicsit fura. Kénytelenek vagyunk kijelenteni, hogy két láb 
van, és ezek nem azonosak, és ha valaki egy harmadik lábbal jön elő, annak azonosnak kell 
lennie a kettő valamelyikével. A 10.6. alfejezetben látni fogjuk, hogy a leíró logikának 
nevezett formalizmus a , pontosan kettő" típusú korlátozásokat egyszerűbben fejezi ki. 

A kategóriákra vonatkozó Partíció reláció mintájára egy RészPartíció relációt defi- 
niálhatunk (lásd 10.6. feladat). Egy objektum a RészPartíció-jában felsorolt részeiből 
Áll, és bizonyos tulajdonságaira ezekből a részekből lehet következtetni. Így például egy 
összetett objektum tömege a részeihez tartozó tömegek összege. Jegyezzük meg, hogy 
ez a kategóriákra nem vonatkozik: egy kategóriának nincs tömege annak ellenére, 
hogy az elemeinek lehet tömege. 

Hasznos olyan összetett objektumokat is definiálni, amelyeknek meghatározott részei 
vannak, de konkrét struktúrájuk nincsen. Előfordulhat, hogy azt szeretnénk mondani, 
hogy: , A zacskóban 3 kg alma van." Kísértést érezhetnénk, hogy a zacskóban-alma hal- 
mazhoz súlyt rendeljük, ez azonban hiba lenne, mert egy halmaz absztrakt matematikai 
fogalom, aminek vannak elemei, de súlya nincs. Ahelyett egy új fogalomra van szük- 
ségünk, amit kötegnek (bunch) fogunk nevezni. Ha az almák például az Almaj, az 
Alma; és az Almagz, akkor a: 

Köteg(fAlmaj, Alma2, Almaz)) 

a három almából (mint részből, de nem mint elemből) álló összetett objektumot jelöli. 
A köteget egy közönséges, bár nem strukturált objektumként használhatjuk. Jegyezzük 
meg, hogy Köteg((x)) — x.Továbbá, hogy a Köteg(Alma) az összes almából álló össze- 
tett objektum, amit az Alma kategóriával összetéveszteni nem szabad. 

A Köteg-et a Része relációval tudjuk definiálni. Az s minden eleme, eleme a Kö- 
teg(15))-nek is: 


Vx x E s 5 Része(x, Köteg(5)) 
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Továbbá, a Köteg(5) a legkisebb objektum. amely ezt a feltételt teljesíti. Más szóval a 
Köreg(5) részének kell lennie minden olyan objektumnak, amely az s összes elemét 
részeként tartalmazza: 


Vy [Vx x€ s 5 Részetx, yy1 — RészetKöteg(5), y) 


Ezek az axiómák a logikai minimalizálásnak (logical minimization) nevezett általános 
módszer egy példáját jelentik. A logikai minimalizálás azt jelenti, hogy egy objektumot 
bizonyos feltételeket kielégítő legkisebb objektumnak definiálunk. 


Mérések 


A világnak mind a tudományos, mind a józan ész elméleteiben az objektumoknak ma- 
gassága. tömege, ára van és így tovább. Az ezekhez a tulajdonságokhoz előírt értékek 
a mértékek (measures). Közönséges, kvantitatív mértékeket könnyű reprezentálni. 
Képzeljük el, hogy az univerzum absztrakt , mértékobjektumokat" tartalmaz, mint pél- 
dául a hossz, ami az itt látható vonalszegmens hossza: — ——————— i, Nevez- 
hetjük ezt a hosszot 1,5 hüvelyknek vagy 3,81 cm-nek. Ugyanannak a hossznak tehát a 
nyelvünkben több, különböző neve is lehet. Logikailag ez úgy lehetséges, hogy egy 
egységfüggvényt (unit function) egy számmal kombinálunk. (Egy alternatív sémával 
a 10.8. feladatban foglalkozunk.) Ha L, a vonalszegmens neve, akkor azt írhatjuk, 
hogy: 
HossztL1) — Hüvelyk(1,5) — Centiméter(3.81) 


Az egységek közötti konverziót olyan állításokkal lehet megoldani, amelyek az egyik 
egység többszörösét a másik egységgel teszik azonossá: 


Centimétert2,54 x 1 — Hűvelyk(h) 


Hasonló axiómákat a fontokra és kilogrammokra, a másodpercekre és a napokra, a dol- 
lárokra és a centekre is felírhatunk. A mértékekkel az objektumokat az alábbi módon 
tudjuk leírni: 


Átmérő(KosárLabdaip) — Hüvelyk(9,5) 
Ár(KosárLabdar2) — $(19) 
d € Napok — Tartamíd) — Óra(24) 


Jegyezzük meg, hogy a $(1) nem egy egydolláros bankó! Az egydolláros bankóból 
lehet kettő, de a $(1) nevű objektumból csak egy van. Jegyezzük meg azt is, hogy míg 
a Hüvelvk(0) és Centiméter(0) ugyanarra a zérushosszra hivatkozik, más zérusmérté- 
kekkel, mint például a Másodperc(0) nem azonosak. 

Egyszerű, kvantitatív mértékeket reprezentálni könnyű. Más mértékek több problé- 
mát okoznak, mert nincs hozzájuk elfogadott értékskála. A gyakorlat nehéz, a desszert 
finom és a vers szép, azonban e kvalitásokhoz nehéz számokat rendelni. Valaki meg- 
kísérelhetné az ilyen tulajdonságokat teljesen elutasítani, mint olyanokat, melyeknek 
a logikai következtetés szempontjából nincs hasznuk, vagy — ami még rosszabb — meg- 
kísérelhetne a szépségre egy numerikus skálát rákényszeríteni. Ez súlyos hiba lenne, 
mert ilyen lépésre nincs is szükség. A mértékek legfontosabb tulajdonsága nem az, 
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hogy valamilyen konkrét numerikus értékkel rendelkeznek, hanem, hogy rendezettek. 

Annak ellenére, hogy a mértékek nem számok, összehasonlításukra a 5 rendező 
szimbólumot fogjuk használni. Így például hihetjük azt, hogy a Norvig írta feladatok 
nehezebbek, mint azok, amiket Russell írt, és hogy egy nehezebb feladatnál kevesebb 
pontot lehet elérni: 


ez € Feladatok A e; € Feladatok A Írta(Norvig, ep) A Írta(Russell, ep) 2 
Nehézség(er) 2 Nehézségte) 

ej € Feladatok A e, € Feladatok A Nehézség(ep) A Nehézségte;) — 
VárhatóEredmény(e1) £ VárhatóEredményte) 


Ez elég is ahhoz, hogy valaki eldönthesse, melyik feladattal érdemes foglalkoznia, bár- 
mennyire nem használtunk semmiféle numerikus értéket a nehézség kifejezésére, 
(Azért azt meg kell tudnunk állapítani, hogy melyik feladatot ki írta.) A mértékek közöt- 
ti efféle monoton reláció az alapja a kvalitatív fizika (gualitative plhysics) területének. 
Ez az MI egy részterülete, amely azt vizsgálja, hogy hogyan lehetne a fizikai rendsze- 
rekre következtetni anélkül, hogy a részletes egyenletekbe és a numerikus szimulációk- 
ba belebonyolódnánk. A kvalitatív fizikával a történeti megjegyzésekben foglalkozunk. 


Természetes fajták 


Egyes kategóriáknak szigorú definíciói vannak. Egy objektum akkor és csak akkor háromszög, ha 
egy háromoldalú sokszög. A valódi világban viszont a kategóriák többsége természetes fajtájú 
(natural kind) anélkül, hogy bármilyen letisztult definíciója lenne, Tudjuk például. hogy a paradi- 
csomok mélyvörös színűek és nagyjából gömbszerűek szoktak lenni, a tetejükön, ahol a száruk csat- 
lakozott, egy kis bemélyedéssel rendelkeznek, nagyjából 5-8 cm átmérőjűek, és vékony, de erős bőr- 
rel, belll hússal, magvakkal és lével rendelkeznek. Azt is tudjuk azonban, hogy eltérések is vannak. 
Egyes paradicsomok narancsszínűek, az éretlen paradicsom zöld, egyesek kisebbek, illetve nagyob- 
bak, mint az átlag, a miniparadicsomok egységesen kisméretűek. Ahelyett hogy a paradicsomok töké- 
letes definíciójára törekednénk, inkább egy tulajdonsághalmazzal rendelkezünk, amely arra szolgál, 
hogy azonosítsonk bizonyos objektumokat, amelyek nyilvánvalóan tipikus paradicsomok, más objek- 
tuok esetén azonban lehet, hogy a felismerés csődöt mond. (Lehet egy paradicsom szőrös. mint egy 
őszibarack?) 

Egy logikai ágens részére ez problémát jelent. Az ágens nem lehet biztos abban, hogy az általa ér- 
zékelt objekturn valóban egy paradicsorn, és ha mégis biztos lenne benne, nem tudná eldönteni, hogy 
a tipikus paradicsom tulajdonságai közül az érzékelt objektum melyekkel rendelkezik, Ez a probléma 
egyenes következménye annak, hogy az ágens egy hozzáférhetetlen környezetben működik. 

Egy hasznos megközelítés szétválasztani mindazt, ami a kategória minden egyedére igaz, attól, 
ami csupán a kategória tipikus egyedeire igaz. A Paradicsom kategória mellett szükség van még 
a Tipikust(Paradicsom) kategóriára. A Tipikus függvény egy kategóriát egy olyan alosztályra képez le, 
amely csak tipikus egyedekből áll: 


Tipikus(c) C c 
A természetes fajtákra vonatkozó tudás többsége tulajdonképpen tipikus egyedekről szól 
x € Tipikus(Paradicsom) 3. Pirostx) A Gömbölvűtx) 


Ily módon képesek vagyunk a kategóriákra vonatkozó fontos tényeket feljegyezni anélkül, hogy 
pontos definíciókat kellene megadnunk. 

Azzal, hogy a természetes kategóriák többsége esetén az egzakt definíció megalkotása nehéz- 
ségekbe ütközik, részletesen Wittgenstein foglalkozott a Philosophicat investigations c. művében 
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(Wittgenstein. 1953). A játékok példáját használta fel, hogy kimutassa, a kategória egyedei inkább egy- 
fajta családi hasonlóságban" és nem valami szükséges és elégséges jellegzetességekben osztoznak. 

Ouine szintén támadta a szigorú definíció hasznosságát (Ouine, 1953). Azt mutatta ki, hogy az 
Agglegény" definíciója, mint egy nem házas felnőtt férfi is gyanús. Valaki megkérdőjelezhetné pél- 
dául, hogy , A Pápa agglegény" értelmes állítás-e. Bár nem kifejezetten hamis, ez a fogalomhasz- 
nálat mégis szerencsétlen, mert az olvasónak nem szándékolt következtetések levonását teszi lehe- 
tővé. A feszültséget fel lehetne oldani megkülönböztetést téve a tudásreprezentációban való belső 
használatra alkalmas logikai definíció és a helyes nyelvészeti használat jobban árnyalt kritériumai 
között. A másik megkapható az elsőből a levont következtetések szűrésével. Az is lehetséges, hogy 
a nyelvészeti használat kudarcai visszacsatolásként hatnak a belső definíció módosítása érdekében, 
fölöslegessé téve a szűrést. 


Szubsztanciák és objektumok 


A világot lehetne úgy szemlélni, hogy primitív objektumokból (részecskékből) és az 
azokból felépülő összetett objektumokból áll. Az olyan nagy objektumok, mint például 
az almák vagy az autók szintjén végzett következtetéssel meg tudunk birkózni a primi- 
tív objektumok óriási számából eredő bonyolultsággal. A valóság tekintélyes része 
azonban az egyedesítés (individuation) — az elkülönülő objektumokra való felbontás- 
nak - látszólag ellenáll. A valóságnak ezt a részét az anyag (stuff) általános névvel fog- 
juk illetni. Példaképpen tételezzük fel, hogy van előttem egy malac és egy kevés vaj.2 
Azt mondhatom, hogy malacból egy van, de a , vaj objektum" nem megszámlálható, hi- 
szen akármilyen része a vaj objektumnak szintén vaj objektum, legalábbis amíg az iga- 
zán kicsi részekhez el nem jutunk. Ez az anyag és a dolgok közötti fő különbség. Sajnos 
nem lesz két malacunk, ha a malacot kettészeljük. 

Vegyük észre, hogy a magyar nyelv az anyag és a dolgok között különbséget tesz.? 
Azt mondjuk , egy malac", de bizonyos éttermi vagy bolti gyakorlattól eltekintve, nem 
mondhatjuk azt, hogy ,egy vaj". A nyelvészek különbséget tesznek a megszámlálható 
főnevek (count nouns), mint például malacok, gödrök vagy tételek, és a nem meg- 
számlálható főnevek (mass nouns), mint például vaj, víz és energia között. Néhány 
versengő ontológiáról azt állítják. hogy e különbségeket képes kezelni. Az egyiket itt 
Írjuk le, a többiről a történeti feljegyzésekben lehet olvasni. 

Hogy az anyagot jól reprezentálhassuk, egy nyilvánvaló dologgal kezdünk. Ontoló- 
giánkban az anyag nagyobb kötegeit kell tudnunk objektumként kezelni. Például a vaj- 
ban felismerjük azt a vajat, amit tegnap este az asztalon hagytunk, esetleg felemelhet- 
jük, megmérhetjük, eladhatjuk vagy akármi mást csinálhatunk vele. Ilyen értelemben ez 
egy objektum, pontosan olyan, mint egy malac. Nevezzük Vajz-nak. Definiálni fogjuk 
a Vaj kategóriát is. Ennek elemei, informálisan, mindazok az objektumok, amikre azt 
lehet mondani: , Ez vaj", a Vajz-at is beleértve. A nagyon kícsi, de most elhanyagolt 
alkotórészek szerepére vonatkozó intésről nem megfeledkezve, a vaj objektum minden 
része szintén vaj objektum: 


x E Vaj A Részely, x) 5 y € Vaj 


2 A szövegben eredetileg . zardvark" (földimalac) szerepel, ami egy malacszerűi dél-afrikai állatfajta. (A ford.) 
3 A szövegben eredetileg természetesen angol példa szerepel — , an aardvark" és , a butterfbutter". (A ford.) 
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Most már mondhatjuk, hogy vaj kb. 30 foknál olvad meg: 
Vaj(x) 5 OlvadásiPont(x, Celsius(30)) 


A vaj sárga, kevésbé sűrű, mint a víz, szobahőmérsékleten puha, magas zsírtartalmú stb. 
Másrészt a vajnak nincs konkrét nagysága, alakja vagy súlya. Specializáltabb kategóriá- 
kat is definiálhatunk, mint például NemSózottVaj, ami szintén egy anyag, mert a nem 
sózott vaj objektum akármilyen része szintén nem sózott vaj objektum. Ha azonban az 
EgyKilóvaj kategóriát definiáljuk, amely az összes, egy kiló súlyú vaj objektumot tar- 
talmazza, nincs többé anyagunk! Ha egy kiló vajat kettévágunk, nem kapunk kétszer 
egy kiló vajat — ami a valódi világ azon bosszantó dolgainak egyike, amivel sajnos 
együtt kell élni. 

Valójában arról van szó, hogy vannak ún. belső (intrinsic) tulajdonságok: ezek 
inkább magához az objektum szubsztanciájához tartoznak, mint az objektum egészé- 
hez. Ha valamit kettévágunk, a részei a belső tulajdonságukat megtartják - legyen ez 
sűrűség, forráspont, íz, szín, a tulajdonos stb. A külső (extrinsic) tulajdonságok éppen 
az ellenkezőt jelentik: olyan tulajdonságokat, mint a súlyt, hosszat, alakot, funkciót stb., 
amelyeket a részekre bontásnál megtartani nem lehet. 

Az objektumok olyan osztálya, amelyek definíciójában csakis belső tulajdonságok 
szerepelnek, a szubsztanciák, illetve a nem megszámlálható főnevek osztálya. Az az 
osztály, amelynek definíciójában bármilyen külső tulajdonság is szerepel, a megszám- 
lálható főnevek osztálya. Az anyag kategória a legáltalánosabb szubsztanciakategória, 
egyetlen belső tulajdonsága sincs. A dolog a diszkrét objektumok legáltalánosabb kate- 
góriája, egyetlen külső tulajdonsága sincs. Minden fizikai objektum mindkét kategó- 
riába tartozik, így a kategóriák együtt léteznek — ugyanazokra az entitásokra utalnak. 
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A cselekvések eredményeiről következtetni kulcsfontosságú egy tudásalapú ágens 
számára. A 7. fejezetben példákat láttuk olyan ítéletállításokra, amelyek leírják, hogy a 
cselekvések hogyan hatnak a wumpus világra. A 283. oldalon lévő (7.3) egyenlet azt 
állítja például, hogy az ágens lokációja hogyan változik az ágens mozgásával. Az íté- 
letkalkulus egyik hátránya, hogy cselekvés leírásáról külön másolatokkal kell rendel- 
keznünk azokra az időpontokra, amikor a cselekvést végre fogják hajtani. Ebben az 
alfejezetben leírt, az elsőrendű logikára alapozó reprezentációs módszer ezt a problé- 
mát elkerüli. 





A szituációkalkulus ontológiája 


Az axiómák többszörös másolatainak az elkerülésére nyilvánvaló módszer az idő sze- 
rinti kvantifikálás — azaz azt mondani, hogy ,.Vf-re a 1-beli cselekvésnek ez a ft -k 1-beli 
eredménye". A t -- 1 típusú explicit időpillanatok helyett ebben az alfejezetben szituá- 
ciókkal dolgozunk, amelyek a cselekvések végrehajtásából adódó állapotok jelölései. 
E megközelítés neve szituációkalkulus (situation calculus) és az alábbi ontológiára 


támaszkodik: 
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" A 8. fejezethez hasonlóan a cselekvések logikai termek, például az Előre, a For- 
dulj(Jobbra). Egyelőre feltételezzük, hogy a környezetben csakis egy ágens tartóz- 
kodik, (Ha több lenne, egy további argumentummal megjelölhetjük, hogy melyik 
ágens hajtja végre a cselekvést). 

" A szituációk (situations) logikai termek, amelyekhez tartozik egy (általában S0-nak 
jelölt) kezdeti szituáció és minden más szituáció, amely a szituációra vonatkozó 
cselekvés végrehajtásából adódott. Ha az a cselekvést az s szituációban hajtották 
végre, az eredményezett szituációt Eredmény(a, s) (néha Csináld-nak nevezett) 
függvény nevezi meg. A gondolatot a 10.2. ábra illusztrálja. 

" A folyó események (fiuents) olyan függvények és predikátumok, amelyek szituá- 
cióról szituációra változnak. Ilyen például az ágens lokációja vagy a wumpus jóléte. 
A szótár szerint a folyó valamilyen folyadékszerű viselkedésre utal. Használatunk- 
ban a szituációk menti lefolyását vagy változását jelenti. -Tart(G), Sp) például azt 
mondja, hogy az ágens a kezdeti Sg szituációban a G) aranyat nem tartja a kezében. 
Kor(Wumpus, Sp) a wumpus $9-beli életkorára vonatkozik. 

"s Engedélyezzük az időtlen, örök (atemporal, eternal) predikátumokat és függ- 
vényeket is. Példaként tekinthetjük az Arany(G) vagy a BalLába(Wumpus) predi- 
kátumokat. 


Az egyedi cselekvéseken túlmenően hasznos, ha a cselekvések sorozatairól is tudunk 
következtetni, A sorozat eredményét az egyedi cselekvések eredménye alapján definiál- 
hatjuk. Először azt fogjuk mondani, hogy egy üres sorozat végrehajtása a szituációt 
változatlanul meghagyja: 


Eredményt(], 59) - s 









Eredmény(Fordulj(Jobbra), 
Eredmény(Etőre, Sg)) 
Forduljljobbra) 
Eredmény(Előre, Sa) 
Előre 


50 





10.2. ábra. Szituációkalkulusban minden szituáció (az §0-t kivéve) valamilyen cselekvés eredménye 
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Egy nem üres sorozat végrehajtása nem más, mint az első cselekvés végrehajtása, majd 
az eredményül adódó szituációban a maradó sorozatnak a végrehajtása: 


Eredménytlalsorozat, s) - Eredmény(sorozat, Eredményla, s)) 


Egy szituációkalkulus ágensnek tudnia kellene egy adott cselekvéssorozat eredményét 
kikövetkeztetni, ez az ún. előrevetítő feladat (projection task). A megfelelő konstruk- 
tív következtetési mechanizmus birtokában képesnek kellene lennie arra is, hogy egy 
kívánatos eredményt biztosító sorozatot megtaláljon, ez az ún. tervkészítési feladat 
(planning task). 

Egy módosított wumpus világról fogunk példát venni, ahol az ágens orientációjával 
nem törődünk, és ahol az ágens egy helyről egy szomszédos helyre Megy. Tegyük fel, 
hogy ágens az [1, 1]-nél és arany az (1, 21-nél van. A cél az aranyat az (1, 1] helyen bir- 
tokoljuk. A folyó esemény predikátumok a Nála(o, x, s) és Tart(o, 5). A kezdeti tudás- 
bázis az alábbi leírást tartalmazhatná: 


Nála(Ágens, (1, 1], $0) A Nála(G4, IL, 21, So) 
Ez azonban még nem elég, mert nem mondtuk, hogy az Sg-ban mi nem igaz (a problé- 
ma további elemzését lásd a 425. oldalon). A teljes leírás az alábbi: 
Nálato, x, Sg) 6 A [fo — Ágens A x — [1, ID) V. (o — GjAx- [1.2] 
"aTartío, 50) 
Arra is szükség van, hogy kijelentsük, G) egy arany, és [1, 1) és [1, 2] szomszédosak: 
Arany(Gy) A Szomszédosí((1, 1], [1, 21) A Szomszédos((1, 2], (1, 19) 


Valaki bizonyára azt szeretné bebizonyítani, hogy ágens a célját eléri, ha az (1. 2]-re át- 
megy, ott megfogja az aranyat és az (1. 1]-re visszatér. azaz: 


Nála(G4, (1, 1], Eredmény(IMegy((1, 1], (1, 21), Megfog(G), MegyXII., 2], (1, ID, So) 


Annál érdekesebb lehetőség az arany birtoklását biztosító tervet készíteni, amit a , mi- 
lyen cselekvéssorozat eredménye az arany az [1, I]-en?" kérdés megválaszolásával le- 
het megtenni. 


Zsorozat Nála(G), [1, 1], Eredmény(sorozat, Sp)) 
Nézzük, hogy e kérdések megválaszolásához mivel kellene a tudásbázist kiegészíteni. 


Cselekvések leírása a szituációkalkulusban 


A szituációkalkulus legegyszerűbb változatában minden cselekvést két axiómával lehet 
leírni. A lehetőségi axióma (possibility axiom) megmondja, hogy a cselekvést mikor le- 
het elvégezni, a hatásaxióma (effect axiom) pedig azt, hogy a cselekvés végrehajtásával 
mi is fog történni. Annak jelölésére, hogy az s szituációban az a cselekvés végrehajtása 
lehetséges, a Lehet(a, 5) predikátumot fogjuk használni. Az axiómák formája az alábbi: 


LEHETŐSÉGI AXIÓMA: Előfeltételek 5 Lehet(a, s) 
HATÁSAXIÓMA: Lehet(a, 5) 5 A cselekvés végrehajtásából adódó változások 
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Ezeket az axiómákat a módosított wumpus világra fogjuk felírni. A mondatok rövidsé- 
ge érdekében el fogjuk hagyni az egész mondatra vonatkozó univerzális kvantorokat. 
Feltételezzük, hogy az s változó a szituációkra, az a változó a cselekvésekre, az o változó 
az objektumokra (az ágenseket beleértve), a g változó az aranyra, az x és az y változók 
Pedig a helyre vonatkoznak. 

Az erre a világra vonatkozó lehetőségi axióma azt mondja, hogy egy ágens a szom- 
szédos helyek között mozoghat, az aktuális helyen megfoghatja az aranyat és elenged- 
heti az aranyat, amelyet tartott: 


Nála(Ágens, x, s) A Szomszédosíx, y) 3 Lehet(Megy(x, y), 5) 
Aranytg) A Nála(Ágens, x, s) A Nálatg, x, s) 5 Lehet(Megfog(g), 5) 
Tart(g, 5) 2  LehekElenged(g), 5) 


A hatásaxióma azt állítja, hogy ha egy cselekvés lehetséges, akkor a cselekvés végre- 
hajtásából adódó szituációban bizonyos tulajdonságok (folyó események) érvényesek 
lesznek. Az x-ről az y-ra menni cselekvés eredménye az y-ban tartózkodni, az aranyat 
megfogni eredménye az aranyat tartani, végül az aranyat elengedni eredménye az ara- 
nyat nem tartani: 


LeheMegytx.y), 5) -  Nála(Ágens, y, Eredmény(Megy(x, y), 5)) 
LeheMegfog(g), 5) 5 Tart(g, Eredmény(Megfog(g), s)) 
LehetElengedíg), s) 5 -Tart(g, Eredmény(Elenged(g), s)) 


Az axiómák megállapításával tudjuk-e bizonyítani, hogy a tervünk biztosítja a cél el- 
érését? Sajnos még nem! Először minden jól működik: a Megy((1, 1], [1, 2]) valójában 
lehetséges az $o-ban, és a Megy hatásaxiómája meggyőzhet minket, hogy az ágens tény- 
leg eléri az (1, 2]-t: 

Nála(Ágens, (1, 2], EredménytMegyí[1, 1], [1, 20. $9)) 


Most tekintsük a Megfog(G4) cselekvést. Ki kell mutatni, hogy ez lehetséges az új szi- 
tuációban, azaz: 


Nála(G1, (1, 2], Eredmény(MegyX(I, 1], (1, 2, 599) 


Sajnos a tudásbázisunkban az ilyen konklúziót semmi sem támasztja alá. Intuitíve persze 
megértjük, hogy az ágens Megy cselekvése az arany helyzetére nincs hatással. így az még 
mindig az [1, 2]-ben van, ahogy ott volt az $g szituációban is. A probléma az, hogy a hatás- 
axióma kijelenti, hogy mi változik, de nem mond semmit arról, hogy mi nem változik. 

A változatlanul megmaradó dolgok reprezentálása az ún. keretprobléma (frame 
problem). A keretproblémára hatékony megoldást kell találnunk, mert a valódi világ- 
ban az idő többségében majdnem minden változatlan marad. Minden egyes cselekvés 
a folyó eseményeknek csak kis töredékét befolyásolja. 

Az egyik megközelítés az explicit keretaxiómák (frame axioms) felírása, amelyek 
azt mondják. hogy mi marad változatlan. Az ágens mozgásai például más objektumok 
helyzetét változatlanul hagyják, hacsak azokat az ágens nem tartja magánál: 


Nálato, x, 5) A (o s Ágens) A -Tart(o, 5) 5 Nála(o, x, Eredmény(Megy(y, 2), 5) 


Ha összesen F folyó esemény és A cselekvés lenne, akkor O(AF) keretaxiómára lenne 
szükségünk. Másfelől, ha minden cselekvésnek legfeljebb E hatása lenne, ahol az 
E tipikusan jóval kisebb, mint F, akkor a történteket sokkal kisebb, O(AE) nagyságú 
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tudásbázissal is ki tudnánk fejezni. Ez a reprezentációs keretprobléma (representa- 
tionai frame problem). A vele szorosan kapcsolódó következtetési keretprobléma 
(inferential frame problem) egy f-lépéses cselekvéssorozat eredményeinek O(Er) idő- 
ben, és nem (Ft) vagy O(AE?) időben való kivetítése. Sorban egymás után az összes 
problémával fogunk foglalkozni. Azonban egy probléma mégis marad — biztosítani, 
hogy egy cselekvés sikeres elvégzéséhez minden feltételt sikerült megfogalmazni. Így 
például a Megy kudarccal fenyeget, ha az ágens útközben meghal. Ez az ún. kvalifiká- 
ciós probléma (gualification problem), melynek teljes megoldása nincs. 


A reprezentációs probléma megoldása 


A reprezentációs probléma megoldása csak egy kis változást igényel abban, hogy az 
axiómákat hogyan írjuk fel. Ahelyett hogy felírnánk minden cselekvés hatását, azzal 
foglalkozunk inkább, hogy egy folyó esemény időben hogyan evolvál.§ Az általunk 
használt axiómákat követő állapot axiómáknak (successor-state axioms) hívják. 
Alakjuk a következő: 


KÖVETŐ-ÁLLAPOT AXIÓMA: 
Cselekvés lehetséges 
(Folyó esemény igaz az eredmény állapotban 43 A cselekvés hatása igazzá tette 
V Igaz volt a cselekvés előtt 
és a cselekvés nem változtatta) 


Feltételezve, hogy lehetetlen cselekvésekkel nem foglalkozunk, vegyük észre, hogy a 
definícióban 6 szerepel — helyett. Ez azt jelenti, hogy a folyó esemény akkor és csak 
akkor lesz igaz, ha a jobb oldali rész igaz. Más szóval minden folyó eseménynek a kö- 
vetkező állapotban érvényes igazságértékét a cselekvésnek és az aktuális állapotban 
érvényes értékének a függvényeként határozzuk meg. Ez azt jelenti, hogy a következő 
állapot teljesen meghatározott az aktuális állapottól kiindulva, és így pótlagos keretaxió- 
mákra nincs szükség. 

Az ágens helyére érvényes követő állapot axióma azt mondja, hogy ágens egy cselek- 
vés után az y-ban lesz, ha a cselekvés lehetséges. és az az y-ba való mozgásból áll, vagy 
ha az ágens már az y-ban tartózkodott. és a cselekvésnek a mozgáshoz nem volt köze: 


Lehet(a, 5) — 
(Nála(Agens. y. Eredményta. 5)) 5 (a — Megy(x, y)) 
V (Nála(Ágens, y, 5) A (a z Megy, 2). 


A Tart axiómája azt fejezi ki, hogy ágens tarja a 8-t, ha a cselekvés a g megfogását 
jelentette, és a cselekvés lehetséges volt, vagy ha az ágens már tartotta a g-t és a cse- 
lekvés nem annak elengedése volt: 


Lehetla, 5) — 
(Tart(g, Eredmény(a, 5)) 5 (a — Megfog(g)) 
v (Tartg, 5) A (a z Elengedíg))) 


4 Ez lényegében az a megközelítés, amit a 7. fejezetben a logikai áramkör-ágens tervezésénél alkalmaztunk. 
Az olyan axiómákat, mint a (7.4) és a (7.5), valóban követő állapot axiómáknak lehet nézni, 
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A követő állapot axiómák a reprezentációs keretproblémát megoldják, mert az axiómák 
öÖssz-száma O(AE) literál. Az E hatások és az A cselekvések mindegyike pontosan egy- 
szer kerül említésre. A literálok különböző axióma között vannak szétosztva, így egy 
axióma átlagos nagysága A£/F. 

Az éles szemű olvasó észreveszi, hogy ezek az axiómák a Nála folyó eseményt keze- 
lik az ágens számára, de nem így az arany esetében. Még mindig nem tudjuk bebizo- 
nyítani, hogy ez a háromlépéses terv eljut a célhoz, az arany eléréséhez az [1, 1]-ben. 
Amire szükségünk lenne még, az annak a kijelentése, hogy az ágens x-től v-ig való 
mozgásának implicit hatása (implicit effect), hogy minden, általa megfogott arany is 
vele fog mozogni (ahogy az aranyon a hangya, a hangyán a bacilus stb.). Az implicit 
hatások kezelését ramifikációs problémának (ramification problem) nevezzük. 
A problémát általánosságban később vitatjuk meg. A jelenlegi speciális tárgyterületen 
e probléma a Nála számára kissé általánosabb követő állapot axiómák felírásával meg- 
oldható. Az új axiómák, amelyek a régieket magukban foglalják, azt fejezik ki, hogy 
minden o objektum y-ban tartózkodik, ha az ágens az y-ba ment, és az o maga az ágens, 
vagy bármi, amit az ágens tart; vagy ha az o már az y-ban volt, és az ágens nem ment 
sehová, miközben az o maga az ágens, vagy bármi, amit az ágens tart. 


Leheka, s) 5 

Nála(o, y, Eredmény(a, 5)) 6 (a — Megy(x, y) A (o — Ágens V Tartto, s))) 
V (Nála(o, y, s) A -(3z y sz A a — Megyly, 2) A 
(o — Ágens V Tart(o, s)))). 


Egy további technikai nehézséggel számolnunk kell. Az ilyen axiómákat felhaszná- 
ló következtetési eljárásnak képesnek kell lennie az azonosság hiányát kimutatni. 
A tegegyszerűbb eset a két konstans esete, például Ágens z G, 1: Az elsőrendű logika 
általános szemantikája lehetővé teszi, hogy a különböző konstansok ugyanazt az 
objektumot jelentsék, a tudásbázisnak tartalmaznia kell tehát az ilyen eseteket kitiltó 
axiómát. Az egyedi elnevezések axiómája (unigue names axiom) a konstansok azo- 
nossághiányát fejezi ki, a tudásbázisban létező minden konstanspárra. Ha a tétel- 
bizonyító rendszer az azonossághiányt feltételezi, ahelyett hogy explicit módon a tu- 
dásbázisban ez le lenne írva, az egyedi elnevezések feltételezésről (unigue names 
assumption) beszélünk. Az azonossághiányát ki kell jelentenünk a cselekvésekre is: a 
Megytíl, 1], (1, 2]) cselekvés és a Megy(f1, 2], [1, 1), vagy a Megfog(G/) cselekvés 
nem ugyanaz. Először azt fogjuk mondani, hogy a cselekvések minden típusa különbö- 
ző - semmilyen Megy cselekvés nem lehet egy Megfog cselekvés. A cselekvésnevek 
minden párjára: 


ACL. 1. Xm) 2 B, ...5 In) 


Most kijelentjük, hogy két, ugyanahhoz a cselekvéshez tartozó cselekvésterm ugyanazt 
a cselekvést jelenti, ha a benne szereplő objektumok mind azonosak: 


AC. sss Xg — BO... Im) xy gy A... A xy 7 Im 


Ezeket az állításokat együttesen egyedi cselekvés axiómáknak (unigue action axioms) 
nevezzük. A kezdeti állapotleírás, a követő állapot axiómák, az egyedi elnevezések 
axiómák és az egyedi cselekvésaxiómák együttese elegendő annak bizonyításához, 
hogy a javasolt terv megvalósítja a célt. 
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A következtetési keretprobléma megoldása 


Követő állapot axiómák a reprezentációs keretproblémát ugyan megoldják, de a következ- 
tetési keretproblémát nem. Tekintsünk egy olyan t-lépésű p tervet, hogy S, — Eredmény(p. 
59). Hogy eldönthessük, mely folyó esemény igaz S,-ben, szükséges minden egyes F keret- 
axiómát minden ? időlépésben kiértékelni. Mivel az axiómáknak átlagosan AE/F a nagy- 
ságuk, O(AE?) következtetéssel kell számolnunk. A munka zöme rá fog menni arra, hogy 
a folyó eseményeket az egyik szituációról a másikra változatlanul másoljuk át. 

A következtetési keretprobléma megoldására két lehetőségünk van. Először is, el- 
dobhatjuk a szituációkalkulust, és kitalálhatjuk az axiómák egészen új felírási módját. 
Ez történt meg az olyan formalizmusokban, mint a folyó esemény kalkulus (fluent 
calculus). Másodszor, megváltoztathatjuk magát a következtetési eljárást, hogy a keret- 
axiómákat hatékonyabban dolgozza fel. Erre utalást ad magának az egyszerű megköze- 
lítésnek az O(AE?) jellege. De miért függ ez a cselekvések A számától, amikor ponto- 
san tudjuk, hogy mindegyik időlépésben melyik cselekvés kerül végrehajtásra? Hogy 
belássuk, hogyan tudnánk a dolgokon javítani, nézzük meg először a keretaxiómák for- 
mátumát: 


Lehet(la, 5 
F(Eredmény(a, s)) 5 (a — Aj V a — A; ...) 
V Fj(5) A (a z Ag) A (a Ag) ... 


Vagyis mindegyik axióma említ tehát néhány cselekvést, amelyek a folyó eseményt 
igazzá, és néhányat, amelyek azt hamissá teszik. Ezt a körülményt formalizálhatjuk a 
PozHatásta, F;) és a NegHatás(a, Fi) predikátumok bevezetésével. A PozHarás(a, Fp) 
azt jelenti, hogy az a cselekvés az F;-t igazzá, a NegHatás(a, F;) pedig azt, hogy hamis- 
sá teszi, A fenti axióma ezzel a következőképpen írható át: 


Leheka, s) 
F4AEredmény(a, s)) 6 PozHatás(a, F;) V IF(s) A -NegHatás(a, F)) 
PozHatás(Ai, F) 
Pozttatás(A;, F;) 
NegHatás(A;z, F;) 
NegHatás(Ag, F;) 


Az, hogy ez mennyire automatizálható, a keretaxiómák pontos formátumán múlik. 
Hogy az ilyen axiómákra alapozva hatékony következtetési eljárást dolgozhassunk ki, 
három dolgot kell még megtenni: 


1. Indexeljük a PozHatás és a NegHatás predikátumokat az első argumentumaik sze- 
Tint, hogy amikor adott egy f időpontban bekövetkező cselekvés, a hatásait 0(1) idő- 
ben meg lehessen keresni. 

2. Indexeljük az axiómákat úgy. hogy amikor világos már, hogy egy cselekvés hatása 
F;, 001) idő alatt ki lehessen keresni az F;-re vonatkozó axiómákat. Ekkor a cselek- 
vés hatásai között nem szereplő folyó esemény axiómáival nem is kell törődni. 

3. Minden szituációt reprezentáljunk egy megelőző szituáció plusz egy növekmény- 
ként. Így, amikor lépésről lépésre nem változik semmi, nem kell semmiféle munkát 
végeznünk. A régebbi megközelítésben 0(F) munka ment volna rá, hogy minden 


10.3. CSELEKVÉSEK, SZITUÁCIÓK ÉS ESEMÉNYEK 403 


folyó esemény esetén a megelőző FÁ5) feltételezésből F(Eredmény(a, 5)) feltétele- 
zést generáljunk. 


Minden időlépésnél tehát megnézzük az aktuális cselekvést, megkeressük a hatásait és 
az igaz folyó események halmazát felfrissítjük. Minden időlépésben átlagosan E ilyen 
frissítéssel kell számolnunk, ami az eredő komplexitásra O(E?)-t ad. Ez megadja a kö- 
vetkeztetési keretprobléma megoldását. 






Idő- és eseménykalkulus 


A szituációkalkulus akkor működik jól, ha egy ágens diszkrét, azonnal lezajló cselekvé- 
seket hajt végre. Ha cselekvéseknek időtartamuk is van, és egymással át is lapolódhatnak, 
a szituációkalkulus nehézkessé kezd válni. Emiatt e kérdésekkel egy más megközelítésen 
belül próbálkozunk, amit eseménykalkulusnak (event calculus) fogunk nevezni és amely 
inkább az időpontokon, mini a szituációkon alapul. (Az , esemény" és a , cselekvés" fogal- 
makat felváltva is használhatjuk. Egy ,esemény" informálisan a cselekvések tágabb osz- 
tályát jelenti, az explicit ágenst nélkülöző cselekvéseket beleértve. Az eseményeket az 
eseménykalkulusban könnyebben kezelhetjük, mint a szituációkalkulusban.) 

Az eseménykalkulusban a folyó események időpillanatokra és nem szituációkra vo- 
natkoznak, és a kalkulust úgy tervezték, hogy az időintervallumokról is lehessen követ- 
keztetni. Az eseménykalkulus axióma azt mondja ki, hogy egy folyó esemény igaz egy 
időpontban, ha a folyó eseményt valamilyen múltbeli esemény kezdeményezte, és idő- 
közben a folyó eseményt semmilyen közbenső esemény nem állította le. Az Inicializál 
és a Leállít relációk a szituációkalkulus-beli Eredmény relációhoz hasonló szerepet töl- 
tenek be. Az inicializálte, f, t) azt jelenti, hogy az e esemény t időpontban történő bekö- 
vetkezése az f folyó eseményt igazzá teszi, míg a Leállít(w, f, 1) jelentése, hogy f igaz 
értéke megszűnt. A Történik(e, f) azt fogja jelenteni, hogy az e esemény a ! időpontban 
történik, a Levág(f, t, t9)-t pedig arra fogjuk használni, hogy leírhassuk, hogy az f-et 
valamilyen esemény a ft és a 1, időpontok között leállította. Formálisan az axióma a 
következő: 


FESEMÉNYKALKULUS AXIÓMA: 
T(f. 12) 5 Je, t Történike, t) A Iniciatizále, f, 1) A (t 2 12) A -Levágíf; t, 1) 
Levágíf, t, t)) 6 3e, ty Történik(e, ty) A Leállíke, f, tp) A (ect) A (ty 2 42) 


A kapott funkcionalitás hasonlít a szituációkalkulusra, azonban az időpontokról és az 
időintervallumokról is nyilatkozhatunk. Így képesek vagyunk a Történik(Kikapcs(Lám- 
paKapcsi), 1:00)-val azt mondani, hogy a lámpakapcsolót pontosan 1:00-kor kapcsol- 
ták ki. 

Az eseménykalkulus számos továbbfejlesztését dolgozták ki, hogy a közvetett hatá- 
sokkal, a nem zérus időtartalmú eseményekkel, a folyamatosan változó eseményekkel, 
a nemdeterminisztikus hatásokkal, a kauzális korlátozásokkal és más bonyodalmakkal 
is tudjanak dolgozni. Egyes kérdésekkel a következő alfejezetben fogunk találkozni. 
A tisztesség kedvéért megjegyezzük, hogy teljesen elfogadható megoldások máig sem 
születtek, azonban legyőzhetetlen akadályok sem merültek fel. 
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Általánosított események 


Egyelőre két fő fogalommal — a cselekvésekkel és az objektumokkal — foglalkoztunk. 
Ideje most utánanézni annak, hogyan illeszkednek ezek a fogalmak egy olyan befogadó 
ontológiába, ahol mind a cselekvések, mind az objektumok a fizikai univerzum aspektu- 
sának foghatók fel. Egy konkrét univerzumróől feltesszük, hogy térbeli és időbeli dimen- 
ziója is van. A wumpus világ a kétdimenziós rács által definiált térbeli dimenzióval és 
diszkrét idővel rendelkezett. A világ térben háromdimenziós és időben egydimenziós, 5 
mely dimenziók mindegyike folytonos. Egy általánosított esemény (generalized event) 
a többdimenziós univerzum egy részének — a , tér-idő darabkának" — aspektusaiból áll 
Össze. Ez az absztrakció az eddig látott fogalmak többségét általánosítja, a cselekvéseket, 
a lokációkat, az időket, a folyó eseményeket és a fizikai objektumokat beleértve. Az általá- 
nos ötletet a 10.3. ábra szemlélteti. Mostantól kezdve az , esemény" egyszerű fogalommal 
az általánosított eseményeket fogjuk nevezni. 

A második világháború például egy olyan esemény, amely a tér-idő különböző pont- 
jaiban történt meg, ezt a szabálytalan szürke folt jelzi. Az eseményt a részeseményekre 
(subevents)6 bonthatjuk szét; 


RészEsemény(AngliaiCsata, MásodikvilágHáború) 
Hasonlóképpen a második világháború a 20. század részeseménye: 
RészEsemény(MásodikVilágHáború, HuszadikSzázad) 


A 20. század az időnek egy intervalluma. Intervallumok a tér-idő olyan darabkái, ame- 
lyek két időpont között az egész teret tartalmazzák. A Periodus(e) függvény az e ese- 
ményt bezáró legkisebb intervallumot jelöli. A Tartam(i) egy intervallum által foglalt 
idő hossza, mondhatjuk tehát, hogy Tartam(Periodus(MásodikVilágHáború)) 5 Év(5). 

Ausztrália egy hely, egy darabka rögzített térbeli határokkal. A határok időben vál- 
toznak, geológiai vagy politikai okoknál fogva. A Benne predikátumot fogjuk használ- 
ni az olyan részesemény reláció megjelölésére, amely akkor áll fenn, ha egy esemény 
térbeli vetülete Része egy másik esemény vetületének: 





Benne(Sydney, Ausztrália) 
A Hely(e) függvény az e eseményt befogadó legkisebb helyet jelenti. 

Mint minden más objektumot, az eseményeket szintén lehet kategóriákba szervezni. 
A MásodikvilágHáború például a Háború kategóriába tartozik. Azt, hogy Angliában 
1640-ben polgárháború zajlott, a következőképpen mondhatjuk: 

Hw w € PolgárHáború A RészEsemény(w, 1640) A Benne(Lokáció(w), Anglia) 
Az eseménykategória fogalma segít megválaszolni azt a kérdést, amit igyekeztünk 
elkerülni, amikor a 10.3. alfejezetben a cselekvések hatásairól beszéltünk. Mire hivat- 
koznak pontosan az olyan logikai termek, mint a Megy((1, 1], (1, 25? Események ezek? 





5 A füzérelméletet tanulmányozó néhány fizikus a I0 vagy több dimenzió mellett foglal állás, mások diszkrét 
világról beszélnek. a 4-D folytonos tér-idő azonban a józan ész következtetési céloknak megfelelő reprezentáció. 
5 Jegyezzük meg, hogy a RészEsemény a Része reláció speciális esete. és ugyanúgy tranzitív és reflexív. 
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s HuszadikSzázad 


10.3. ábra. Általánosított események. Az univerzumnak térbeli és időbeli dimenziója van. Ezen az ábrán 
csak egy térbeli dimenziót mutatunk. Minden esemény az univerzum Része. Az olyan esemény, mint a 
MásodikvVilágHáború a tér-idő egy tartományában történik, melynek határai kissé szabadon választhatók, 
és időben változók. Egy intervallum, mint amilyen a HuszadikSzázad, rögzített és korlátos időbeli, vala- 
mint maximális térbeli kiterjedéssel rendelkezik. A Hely, amilyen például Ausztrália, nagyjából rögzített 
térbeli és maximális időbeli kiterjedéssel rendelkezik. 





A válasz, talán meglepő, de az, hogy mem. Ennek megértéséhez nézzünk meg két , azo- 
nos" cselekvést tartalmazó tervet, mint például: 


(Megytt1, 1], [L, 20), MegytI, 2], [1, 1, Megy(I1, 1, (1, 201 


Ebben a tervben a Megy(l I, 1], [1, 2]) nem lehet egy esemény neve, mert két különböző 
esemény van, amelyek különböző időpontban történnek meg. Helyette a Megy((1, 1], 
[1, 2]) egy eseménykategória neve — azoké az eseményeké, amikor az ágens az [1, 11-ről 
az [1, 2]-re lép át. A háromlépéses terv azt mondja ki, hogy e három eseménykategória 
példányai fognak előfordulni. 

Jegyezzük meg, hogy ez az első alkalom, amikor a kategóriák megnevezésére komp- 
lex termeket vetettünk be, egyszerű konstansszimbólumok helyett. Ez nem jelent új 
nehézséget. Az argumentumstruktúrát valójában a hasznunkra is fordíthatjuk. AZ argu- 
mentumok eliminálása az általánosabb kategóriák bevezetését teszi lehetővé: 


Megy(x, y) C MegyHováty) Megy(x, y) C MegyHonnun(x) 


Hasonlóan, argumentumok hozzáadásával még specifikusabb kategóriákat hozhatunk 

létre. Más ágensek cselekvéseinek leírásához például hozzáadhatjuk az ágenseket jelö- 

lő Ból Üsd ese Így ahhoz, hogy azt mondhassuk, hogy , tegnap Shankar New York- 
jdelhibe utazott", azt írhatnánk, hogy: 


Be e c RepüKShankar, NewYork, Újdelhi) A RészEseményte, Tegnap) 
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Az állítás e formája annyira gyakori, hogy külön rövidítést fogunk rá alkalmazni: E(c, i), 
aminek az a jelentése, hogy a c eseménykategória egy eleme egy f intervalium, vagy az 
esemény részeseménye: 


E(c,i) 6 de e €c A RészEseményete, í) 
Így: 
E(Repül(Shankar, NewYork, Újdelhi), Tegnap) 


Folyamatok 


Az eddig látott események meghatározott struktúrával rendelkező diszkrét események 
(diserete events) voltak. Shankar utazásának van kezdete, közepe és vége. Ha félbe- 
szakítjuk, az esemény megváltozik — nem lesz többé egy New York és Újdelhi közötti 
utazás, hanem helyette egy New York és egy Európában valahol fekvő pont közötti 
utazás. A Repül( Shankar) által jelölt eseménykategóriának ezzel szemben más a jel- 
lege. Ha Shankar repülésének egy rövid intervallumát vesszük, mondjuk a harmadik 
20 perces időszakaszát (amikor ís türelmetlenül várja már a második csomag mézben 
pörkölt földimogyorót), ez az esemény még mindig a Repül(Shankar) egy része. Való- 
jában ez akármilyen részintervallum esetében is igaz. 

Az ilyen tulajdonságú események kategóriáit folyamat- (process) kategóriáknak, illet- 
ve folytonos esemény (liguid event) kategóriáknak nevezzük. Egy folyamat akármilyen 
részintervalluma ugyanannak a folyamatkategóriának a tagja. A diszkrét eseményekre ki- 
alakított jelölést alkalmazva mondhatjuk például, hogy Shankar valamikor tegnap repült: 


El(Repülk Shankar), Tegnap) 


Gyakran ki szeretnénk jelenteni. hogy valamilyen folyamat egy teljes intervallumon 
keresztül tartott, és nem csak annak valamilyen részintervallumában. Erre 7 predikátu- 
mot fogjuk használni: 


RDolgozik(istván), MaiEbédidő) 








T(c, i)-nek az a jelentése, hogy egy c típusú esemény az egész i intervallum ideje alatt 
tartott — azaz az esemény pontosan akkor kezdődik és fejeződik be, amikor az inter- 
vallum. 

Folyékony és nem folyékony események közötti megkülönböztetés pontosan analóg a 
szubsztanciák, avagy az anyag és az egyedi objektumok közötti különbséggel. Tény, hogy 
egyes kutatók folyékony eseményeket temporális szubsztanciáknak (temporal substan- 
ces) nevezték el, míg a vajszerű dolgok térbeli szubsztanciák (spatial substances). 

A folytonos események a folyamatosan változó folyamatokon túlmenően képesek a 
folyamatosan nem változó folyamatok leírására is. Ezeket gyakran állapotoknak 
(States) nevezzük. A , Shankar New Yorkban tartózkodik" például egy olyan állapotka- 
tegória, amit Benne(Shankar, NewYork)-kal lehetne jelölni. Azt, hogy Sankar az egész 
mai napot New Yorkban töltötte, úgy írhatnánk, hogy: 


T(Benne(Shankar, NewYork), Ma) 
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10.4. ábra. Összetett események ábrázolása. (a) TiMindkettőtp, a). i), másképpen T(p o 4, i), (b) TEgyiktp, 
9). 1), tc) TVagyVagwwp, 4). i). 


Primitív állapotok vagy események kombinálásával bonyolultabb képződményeket is ki- 
alakíthatunk. Ez a megközelítés a folyó esemény kalkulus (fiuent calculus). A folyó 
esemény kalkulus nem egyedi folyó eseményeket, hanem folyó események kombinációit 
reifikálja. Láttuk már annak a módját, hogy az egyszerre történő két dolog eseményét 
hogyan reprezentáljuk, azaz láttuk a Mindkettőlej, en) függvényt. A folyó kalkulusban 
ezt általában az ej o ez infix jelöléssel rövidítik. Hogy megmondhassuk, hogy például 
,, valaki sétált és közben rágógumit rágott", azt írhatjuk, hogy: 


3p,i (p e Ember) A T(Sétál(p) o RágótRág(p), i) 


A ,o" függvény kommutatív és asszociatív, pontosan úgy, mint a logikai konjunkció. 
Definiálhatjuk a diszjunkció és a negálás analógiáját is, azzal viszont óvatosabban kell el- 
járnunk, mivel a diszjunkciót kétféle módon lehet értelmesen interpretálni. Amikor azt 
mondjuk, hogy , az ágens az utóbbi két percben vagy sétált, vagy rágógumit rágott", gon- 
dolhatunk arra, hogy az ágens az egész idő alatt az egyik cselekvést végezte, vagy pedig, 
hogy a két cselekvést felváltva tette. E két lehetőség megjelölésére az Egyik és a VagyVagy 
függvényeket fogjuk használni. A komplex eseményeket a 10.4. ábra szemlélteti. 


intervallumok 


Az idő fontos minden cselekvő ágens számára, és az időintervallumok reprezentálására 
számos erőfeszítés történt. Az időintervallumok két fajtájával foglalkozunk: az idő- 
pillanatokkal és a kiterjesztett intervallumokkal. A különbség köztük az, hogy csak az 
időpillanatnak lehet zérus időtartama: 


Partíció( (IdőPillanatok, Kiterjesztettintervaliumok), Időintervallumok) 
i € Időlntervallumok $- (Tartam(i) — Másodperc(0) 


Most egy időskálát konstruálunk, amelynek pontjait időpillanatokhoz rendeljük hozzá: 
ezzel abszolút időpontokat kapunk. Az időskála tetszőleges lehet. Az időt másod- 
percekben fogjuk mérni, és kimondjuk, hogy a 0. idő az 1900. január 1-jei (GMT) éjfél. 
A Kezdet és a Vég függvények az időintervallum legkorábbi és a legkésőbbi időpillana- 
tát adják vissza, az Idő függvény egy időpillanathoz tartozó pontot keres ki az időskálán. 
Az IdőTartam függvény megadja a kezdeti idő és a végidő közötti különbséget. 


Időlntervallum(i) — IdőTartam(i) — (Idő(Vége(i)) — idő(Kezdete(i))) 
Idő(Kezdete(AD1900)) — Másodperc(0) 
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Idő(Kezdete(AD2001) — Másodperc(3187324800) 
Idő(Vége(AD200L1)) — Másodperc(3218860800) 
IdőTartam(AD2O01) — Másodperc(31536000) 


Hogy a számokat könnyebb legyen olvasni, vezessünk be egy határgumentumú 
Dátum függvényt (óra, percek, másodpercek, hónap, nap és év), melynek visszaadott 
értéke egy pont az időskálán: 

Idő(Kezdete(AD2001)) — Dátum(0, 0, 0, 1, Január, 2001) 

Dátun0, 20, 21, 24, 1, 1995) — Másodperc(3000000000) 


Két intervallum Találkozik, ha az egyiknek a végideje megegyezik a másiknak a kez- 
deti idejével. Már egyedül a Találkozik segítségével is lehetséges olyan további predi- 
kátumokat definiálni, mint az Előtte, az Utána, a Közben és az Átlapolódik. Azonban 
sokkal intuitívebb, ha a definiálásuk az időskála pontjainak segítségével történik (lásd 
10.5. ábrán a grafikus reprezentációt). 


Találkozik(i, j) 5 Idő(Vége(i)) — Idő(Kezdete(j)) 

Előtte(i, j) 6 Idő(Vége(i)) c IdővKezdetekj)) 

Utána(j, i) 5 Előtte(i, j) 

Közben(i,j) 6 Idő(Kezdete(j)) £ Idő(Kezdete(i)) A Idő(Végeti)) £ Idő(Vége(j)) 
Átlapolódik(i, j) 4 3k Közben(k, i) A Közbentk, j) 


Annak megadására, hogy II. Erzsébet uralkodása VI. György uralkodását követte, Elvis 
uralkodása viszont az 1950-es évekkel átlapolódott, a következőt írhatjuk: 


Utána(Uralkodása(II.Erzsébet), UralkodásatVI.György)) 
Átlapolódik(ÖtvenesÉvek, Uralkodása(Elvis)) 
KezdetefÖtvenesÉvek) — Kezdete(AD1950) 
VégefÖtvenesÉvek) — Vége(AD1950) 
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10.5. ábra. Az időintervallumok predikátumai 
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Folyó események és objektumok 


Említettük, hogy fizikai objektumokat általánosított objektumoknak lehet tekinteni, abban 
az értelemben, hogy egy objektum a tér-idő egy darabkája. Az USA például egy olyan 
eseménynek képzelhető el, amely mondjuk 1776-ban, 13 állam uniójaként kezdődött és 
"ma, 50 állam uniójaként, még folyamatban van. Az USA változó aspektusait állapot folyó 
eseményekkel írhatjuk le. Mondhatjuk például, hogy valamikor, az 1999. évben a lakos- 
sága 271 millió fő volt: 


E(Lakosság(USA, (271000000), AD1999) 


Egy másik ilyen aspektus, amely a szerencsétlenségektől eltekintve, négy- vagy nyolc- 
évenként változik, az ország elnöke. Felvehető, hogy az Elnök( USA) egy olyan logikai 
term, amely különböző időkben különböző objektumokat jelent. Ez sajnos nem lehet- 
séges, mert egy term egy adott modellstruktúrában pontosan egy objektumot jelöl meg. 
(Az EInök(USA, t) jelölhetne különböző objektumokat ! értékének megfelelően, az 
ontológiánk azonban az időpontokat és a folyó eseményeket szétválasztja.) Egyetlen 
lehetőség, hogy az EInök( USA) egy olyan egyedi objektumot jelöl, amely különböző 
időkben különböző emberekből áll. Az ElInök( USA), mint objektum, George Washington 
volt 1789-tól 1796-ig, John Adams volt 1796-tól 1800-ig stb. (lásd 10.6. ábra). Azt, hogy 
George Washington 1790-ben elnök volt. a következőképpen írhatjuk le: 


T(Elnök( USA) — GeorgeWashington, AD1790) 


Azonban óvatosnak kell lenni. Ebben a mondatban az ,,—" inkább egy függvény, és nem 
egy standard logikai operátor. Az interpretáció nem az, hogy GeorgeWashington és az 
EInök( USA) 1790-ben togikailag azonosak. A logikai azonosság nem olyan dolog, ami 
időben változhat. A logikai azonosság az egyes objektumok azon részeseményei között 
áll fenn, amelyeket az 1790-es elnöki periódus definiált. 

Ne tévessze össze a GeorgeWashington fizikai objektumot az atomok egy gyűjtemé- 
nyével. George Washington logikailag nem azonos semmilyen konkrét atomgyűjte- 
ménnyel, mert az az atomhalmaz, amiből áll, időben lényegesen változik. Neki rövid 
élettartama van, minden atomnak saját hosszú élettartama van. Bizonyos periódusban 
metszik egymást, amikor is az atom temporális szelete a RészEseménye George-nak, 
majd külön útjukat járják. 





1789 
10.6. ábra. Az Elnök( USA) objektum sémaszerű ábrázolása létezésének első 15 évében 
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10.4. MENTÁLIS ESEMÉNYEK ÉS MENTÁLIS 
OBJEKTUMOK 


Az eddig megkonstruált ágenseknek hiedelmeik vannak, továbbá az ágensek új hiedel- 
mek kikövetkeztetésére is képesek. Ennek ellenére Ariedelmekre és következtetésre vo- 
natkozó tudással egy ágens sem rendelkezik. Az egyágenses problématerületeken egy 
ágensnek a saját tudásáról és következtető eljárásáról meglévő tudása hasznos a követ- 
keztetés irányításában. Ha például valaki tudatában van annak, hogy Románia földraj- 
záról semmit sem tud, nem kell óriási erőfeszítéseket tennie, hogy az Arad és Buka- 
rest közötti legrövidebb utat kiszámítsa. Következtethetünk a saját tudás állapotunkról 
annak érdekében, hogy terveket készítsük annak megváltoztatására — például azáltal, 
hogy Románia térképét megvásároljuk. Többágenses problématerületeken fontos, 
hogy egy ágens más ágensek mentális folyamataira tudjon következtetni. Egy román 
rendőr nyilván jól tudja, hogy melyik a legjobb út Bukarest felé, így az ágens kérhet 
tőle segítséget. 

Végeredményben tehát olyan mentális objektumok és az azokat manipuláló mentális 
folyamatok modelljére van szükségünk, amelyek másvalaki fejében (vagy másvalami 
tudásbázisában) találhatók meg. A modellnek valósághűnek kell lennie, azonban nem 
kell a részletekre kitérnie. Nem kell. hogy képesek legyünk megjósolni, hogy egy konk- 
rét ágens a következtetéseit hány milliszekundum alatt állítja elő, vagy hogy egy konkrét 
vizuális ingerrel szembesítve, mely neuronok tüzelnek az állat agyában. Boldogok leszünk, 
ha kikövetkezhetjük, hogy román rendőr eligazít minket Bukarest irányába, ha tudja az 
utat, és azt hiszi, eltévedtünk. 


A hiedelmek formális elmélete 


Az ágensek és a , mentális objektumok" közötti olyan kapcsolatokkal kezdünk. mint a 
Hiszi, a Tudja és az Akarja. Az ilyen relációkat ítéletlogikai attitűdöknek (proposi- 
tional attitudes) nevezzük, mert egy ágens attitűdjét írják le egy ítéletlogikai állítással 
szemben. Tegyük fel, hogy Lujza hisz valamit, azaz Hiszi(Lujza, x). Vajon milyenfajta 
dolog az x? Először is világos, hogy x logikai állítás nem lehet. Ha RepüllSuperman) 
egy logikai állítás, akkor nem mondhatjuk azt, hogy HiszüLujza, Repül(Superman)), 
mert predikátumok argumentumaként csak termeket (és nem állításokat) fogadunk el. 
Ha azonban a Repül egy függvény, akkor a Repül( Superman) már jó jelölt egy mentális 
objektumra, és a Hiszi lehet az a reláció, amely egy ágenst összekapcsol ezzel az ítélet 
jellegű folyó eseménnyel. Egy állítás átalakítása objektummá nem más, mint reifikálás? 
(reification). 

Úgy tűnik meg is kaptuk, amit akartunk: egy ágensnek azt a képességét, hogy követ- 
keztetni tudjon más ágensek hiedelmeiről. Sajnos e megközelítésnek vannak nehézségei. 
Ha Clark és Superman egy és ugyanaz a személy (azaz Clark — Superman), akkor Clark 
repül és Superman repül egy és ugyanaz az eseménykategória, azaz Repül(Clark) — Re- 





7 A areifikálás" szó a latin res, avagy dolog szóból származik. John McCarthy a , dolgosítás" (thingification) 
elnevezést javasolta, de ez nem terjedt el. 
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pül(Superman). Azaz el kell fogadnunk, hogy ha Lujza azt hiszi, hogy Superman tud 
repülni, el kell hinnie, hogy Clark tud repülni, akkor is, ha nem hiszi, hogy Clark Super- 
man. Azaz: 


(Superman — Clark) k (Hisz(ILujza, RepükSuperman)y) 5 Hisziü(Lujza, RepükClark))) 


Bizonyos értelemben ez igaz is. Egy bizonyos személyről, akit néha Clarknak hívnak, 
Lujza azt hiszi, hogy tud repülni. Más értelemben azonban ez nincs rendjén. Ha meg- 
kérdezzük Lujzát, hogy , Clark tud-e repülni?", minden bizonnyal nemmel válaszolna. 
A reifikált objektumok és események jól működnek a Hiszi első értelmezése esetén, a 
másodikhoz viszont az szükséges, hogy reifikáljuk ezen objektumok és események 
leírását, így Clark és Superman különböző leírások legyenek, annak ellenére, hogy 
ugyanarra az objektumra vonatkoznak. 

Azt a tulajdonságot, hogy egy termet egy vele ekvivalens termmel szabadon helyet- 
tesíthetünk, formálisan referenciális átláthatóságnak (referential transparency) ne- 
vezzük. Elsőrendű logikában minden reláció referenciálisan átlátható. Számunkra az 
lenne a jó, ha a Hiszi (és más ítéletlogikai attitűdök is) olyan relációkként lennének de- 
finiálhatók, melynek második argumentuma elmosódott (opague) — azaz, ahol ekvíva- 
lens termeket egymással nem lehet helyettesíteni az értelmezés megváltoztatása nélkül. 

Ennek két módja van. Az első a logika egy új változatának — az ún. modális logiká- 
nak (modal logic) a használata, amelyben az olyan ítéletlogikai attitűdök, mint a Hiszi 
és a Tudja referenciálisan elmosódott modális operátorok (modal operators) lesznek. 
Ezzel a megközelítéssel az irodalmi és történeti megjegyzések keretében foglalkozunk. 
A második, a továbbiakban kifejtett megközelítés a hatékony elmosódottság elérése a 
különben referenciálisan átlátható nyelvben a mentális objektumok ún. szintaktikai 
elmélete (syntactic theory) révén. Ez azt jelenti, hogy mentális objektumokat fűzérek- 
kel (strings) reprezentálunk. Az eredmény az ágens tudásbázisának egy olyan durva 
modellje, ahol a tudásbázis az ágens által elhitt állításokat reprezentáló füzérekből áll. Egy 
füzér nem más, mint egy szimbólumlistát megjelölő komplex term, így a Repük Clark) 
eseményt a [R, e, p, ü, t, (, C, I, a, r, k, )l karakterfüzérrel reprezentáljuk, amit 
, Repül Clark)"-ként fogunk rövidíteni. A szintaktikai elmélet eleme az egyedi füzér 
axióma (unigue string axiom), amely azt mondja ki. hogy két füzér akkor és csak ak- 
kor azonos, ha azonos karakterekből áll. Ebben a megfogalmazásban a Clark — 
Superman ellenére , Clark" zt , Superman". 

Most meg kell adnunk a füzér reprezentációs nyelv részére a szintaxist, a szemanti- 
kát és a bizonyítási elméletet, pontosan úgy, ahogyan ezt a 7. fejezetben tettük. A kü- 
lönbség az, hogy ezeket most mind elsőrendű logikában kell definiálnunk. A Jelent 
függvénnyel kezdünk, amely a füzért arra az objektumra képezi le, amit jelöl. A Neve 
egy olyan függvénnyel definiálható, amely egy objektumot az azt megnevező füzérre 
képezi le. A ,.Clark" és a , Superman" jelölés jelentése egy objektum, amire a 
VasEmber konstansszimbólummal fogunk hivatkozni. és aminek a neve a tudásbázis- 
ban lehet , Clark", , Superman" vagy valamilyen más konstans, mondjuk ,Xh47. 


dJelent( Clark") — VasEmber A Jelent, Superman") — VasEmber 
NevelVasEmber) — ,Xuu" 


A következő lépés a következtetési szabályok definiálása egy logikai ágens számára. 
Kívánhatnánk például, hogy egy logikai ágens képes legyen Modus Ponenst elvégezni: 
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ha elhiszi a p-t, és elhiszi, hogy p — 9. akkor elhiszi a g-t is. Az axióma első verziója 
valahogy így nézhetne ki: 


Logikaiágens(a) A Hiszi(a, p) A Hiszi(a, ,p 5 §") 2 Hiszi(a, ag) 


Ez azonban helytelen, mert a ,p 5 g" füzér tartalmazza ugyan a ,p" és ,,§" betűket, de 
semmi köze az olyan füzérekhez, amelyekben a p és g változók értékei szerepelnek. 
A helyes megfogalmazás az alábbi: 


LogikaiÁgens(a) AN Hiszí(a, py-A Hiszi(a, Concakp, ,—", g)) - Hiszí(a, 9) 


ahol a Concat egy füzérfüggvény, amely az elemeit konkátenálja. A Concatíp, 2", g)-t 
le fogjuk rövidíteni ,p 5 g"-ra. Azaz x előfordulása egy füzéren belül azt jelenti, hogy 
az .x változó értékét be kell helyettesíteni. A Lisp-programozók ebben felismerik a back- 
gyote operátort, a Pearl-programozók pedig a $-változó interpolációt. 

Ha Modus Ponensen kívül más következtetési szabályokat is hozzáveszünk, olyan 
kérdések megválaszolására leszünk képesek, mint a , Feltéve, hogy a togikai ágens eze- 
ket a premisszákat ismeri, képes-e azt a konklúziót kikövetkeztetni?", A közönséges kö- 
vetkeztetési szabályokon túlmenően szükségünk van hiedelemspecifikus szabályokra is. 
Így például az alábbi szabály azt mondja ki, hogy ha egy logikai ágens elhisz valamit, 
akkor azt is elhiszi, hogy elhiszi azt. 


LogikaiÁgens(a) A Hiszi(a, p) - Hiszita, , Hiszi(Neveta), py) 


Az ilyen ágens, axiómáinkból adódóan, minden érvényes konklúziót képes azonnal 
kikövetkeztetni. Ezt a jelenséget logikai mindentudásnak (logical omniscience) hív- 
ják. Számos kísérlet történt arra, hogy korlátos racionalitású ágenseket definiáljunk, 
amelyek véges idő alatt korlátozott számú következtetésre képesek. Ezek egyike sem 
teljesen kielégítő, azonban e megfogalmazások lehetővé teszik. hogy korlátos ágensek- 
ről igen korlátozott terjedelmű jóslásokat végezzünk. 





Tudás és hiedelem 


A filozófusok évszázadok óta tanulmányozták a hinni és a tudni közötti kapcsolatot. Általá- 
nosan elfogadott, hogy tudás a bizonyított, igaz hiedelem. Azaz, ha , megtámadhatatlanul jó 
oknál fogva" hiszünk valamiben, és ez a valami igaz is, akkor ezt a valamit tudjuk is. A , meg- 
támadhatatlanul jó oknál fogva" lényeges, hogy ne mondhassunk olyat, hogy: , Tudom, hogy 
ez a feldobott érme fejjel felfelé fog leesni", és ne legyen igazunk az esetek felében. 
Legyen a Tudja(a, p) jelentése az, hogy egy a ágens tudja, hogy a p állítás igaz. A tudás 
más fajtáját is lehet definiálni. Nézzük például a , tudja, hogy vagy..., vagy" definícióját: 


TudjaVagyVagy(a, p) 6 Tudjata, p) V Tudjala, ,—p") 


Példánkat folytatva, Lujza tudja, hogy Clark vagy tud repülni, vagy nem, ha tudja, hogy 
Clark tud repülni, vagy ha tudja, hogy Clark nem tud repülni. 

A , tudja, mi" koncepció valamivel bonyolultabb. Kísértést érezhetünk arra, hogy azt 
állítsuk, egy ágens tudja, mi Béla telefonszáma, ha létezik egy x, amiről az ágens azt 
tudja, hogy x — TelefonSzáma(Béla). De ez így nem jó, mert például az ágens tudhatja, 
hogy Aliz és Béla telefonszáma ugyanaz (azaz TelefonSzáma(Aliz) — TelefonSzáma 
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(Béla)), de ez sokat nem segít, ha Aliz telefonszámát sem tudja. A , tudja, mi" jobb 
definíciója azt mondja ki, hogy az ágensnek valami olyan x-et kell ismernie, amely egy 
számjegyekből álló füzér és amely Béla telefonszáma: 


TudjaMíita, ,TelefonSzáma(by") 5 
3x Tudja(a, ..x — TelefonSzáma(by") A x € SzámjegyFüzér 
Természetesen más kérdések esetén az elfogadható válasznak mások lesznek a kritéri- 
umai. Arra a kérdésre, hogy , Mi New York állam fővárosa?", a jó válasz , Albany", és 
nem az, hogy ,.az a város, ahol a városháza áll". Hogy ez lehetséges legyen, a TudjaMi-t 
háromargumentumos relációvá alakítjuk át: lesz benne egy ágens, egy term és egy predi- 
kátum, amelynek igaznak kell lennie a válaszra alkalmazva. Például: 


TudjaMi(Ágens, , Főváros(NewYork"), SajátNév) 
TudjaMi(Ágens, , TelefonSzáma(Béla"), SzámjegyFüzér) 


Tudás, idő és cselekvés 


A valódi esetek többségében az ágensnek az időben változó — saját vagy más ágensek — 
hiedelmeivel kell foglalkoznia. Az ágensnek terveket kell szőnie, amelyek a saját hiedel- 
meinek változásaival járnak együtt — mint amilyen például egy térkép vásárlása, hogy 
Bukarestbe találjon. Más predikátumokhoz hasonlóan lehetséges a Hiszi reifikálása, és 
egy időperiódus alatt történő hiedelmek megtárgyalása. Így mondhatjuk például, hogy 
Lujza ma hiszi, hogy Superman tud repülni: 


T(Hiszi(Lujza, , Repül(Supermany", Ma) 
Ha a hiedelem objektuma egy olyan állítás, amely időben változhat. ezt a 7 operátorral a 


füzéren belül írhatjuk le. Ekkor mondhatnánk azt, hogy Lujza ma hiszi, hogy Superman 
tegnap tudott repülni: 
T(Hiszi(Lujza, , (RepükSuperman), Tegnap)", Ma) 

Ha már az időben evolváló hiedelmeket le tudjuk írni, felhasználhatjuk az esemény- 
kalkulus mechanizmusát, hogy hiedelmeket tartalmazó terveket készítsünk. A cselek- 
véseknek lehetnek tudás-előfeltételei (knowledge preconditions) és tudáshatásai 
(knowledge effects). Annak a cselekvésnek például, hogy valakinek a telefonszámát 
tárcsázzuk, az az előfeltétele, hogy tudjuk a számot, és annak a cselekvésnek, hogy a 
telefonszámot a könyvből kikeressük, az a hatása, hogy a számot tudni fogjuk. Ezt az 
utolsó cselekvést az eseménykalkulus mechanizmusával az alábbi módon írhatjuk le: 


IniciálizákKikeres(a, , TelefonSzáma(by"), 
TudjaMí(a, ,, TelefonSzáma(b)", SzámjegyFüzér), 1) 
Az információgyűjtő és az azt felhasználó terveket sokszor röviden futási idejű vál- 
tozóknak (runtime variables) nevezzük, ami a korábban leírt értékbehelyettesítő 


változó konvenciójához szorosan kapcsolódik. Béla telefonszámának a kikeresésére, 
majd a tárcsázására vonatkozó tervet az alábbi alakban fel lehet írni: 


IKikeres(Ágens, vFelefonSzámaíBélay , n), Tárcsázín)] 
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Itt 7 egy futási idejű változó, aminek értékét a Kikeres cselekvés fogja rögzíteni, és amit 
majd a Tárcsáz cselekvés felhasználhat. Az ilyen tervek sűrűn előfordulnak a részben 
megfigyelhető tárgyterületeken. Látni fogunk erre példákat a következő alfejezetben és 
a 12. fejezetben. 
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Ebben az alfejezetben az internetes bevásárlással kapcsolatos tudás egy részét fogjuk 
kódolni. Egy olyan vásárló-kutató ágenst fogunk tervezni, amely segíti a vásárlónak az 
interneten megtalálni a termékek ajánlatait. A vásárló ágens a vásárlótól a termék leírá- 
sát kapja és feladata a termék eladását hirdető weblapok listáját előállítani. Egyes ese- 
tekben a vásárló leírása pontos lesz, mint amilyen például a Coolpix 995 digitális fény- 
képezőgép — a feladat ekkor a legjobb ajánlatot tevő boltot megtalálni. Más esetekben 
a leírás csak részben lesz specifikált, mint például a 300 dollárnál olcsóbb digitális 
fényképezőgép, és az ágens kénytelen lesz különböző termékeket összehasonlítani. 

A vásárló ágens környezete az egész világháló — ami semmiképpen sem egy játék- 
környezet. Ugyanaz a komplex, folyamatosan evolváló környezet, amit az emberek 
milliói mindennap használnak. Az ágens érzetei weblapok, de amíg egy emberi web- 
felhasználó a lapokat a képernyőre kivetített pixelek formájában látja, a vásárló ágens 
a lapokat karakterfüzérek alakjában fogja érzékelni, ahol közönséges szavak kevered- 
nek a HTML jelölőnyelv formattáló utasításaival. A 10.7. ábra egy weblapot mutat és a 
hozzá tartozó HTML-karakterfüzért. A vásárló ágens érzékelési problémájának lényege 
a hasznos információnak az ilyen fajtájú érzetből való kiemelése. 

Világos, hogy weblapokat érzékelni egyszerűbb, mint mondjuk, Kairóban taxi 
vezetése közben érzékeléseket szerezni. Az internetes érzékelés mégsem mentes a bo- 
nyodalmaktól. A 10.7. ábrán látható weblap igen egyszerű a valódi vásárlási lapokhoz 
képest, ahol találkozni lehet olyan elemekkel, mint sütik, Java, Javascript, Flash, robot 
kizáró protokollok, elgépelt HTML, hangfájlok, filmfelvételek és egy JPEG kép része- 
ként megjelenő szövegek. Egy ágens, amely képes az internet egészével elbánni, 
majdnem olyan bonyolult, mint egy robot, amely a valódi világban képes mozogni. Mi 
egy egyszerű ágensre összpontosítunk, amely e bonyodalmak zömét nem fogja figye- 
lembe venni. 

Az ágens első feladata, hogy releváns termékajánlatokat találjon (majd később meg- 
látjuk, hogy a releváns ajánlatok közül hogyan kell kiválasztani a legjobbat). Legyen 
a lekérdezés a terméknek a felhasználó által begépelt leírása (például , laptop"), akkor 
egy weblap a lekérdezés szempontjából releváns ajánlat, ha a lap releváns és tényleg 
egy ajánlat. A lappal kapcsolatos URL-t is nyomon fogjuk követni: 


RelevánsAjánlat(lap, urt, lekérdezés) §2 Releváns(lap, urt, lekérdezés) A Ajánlatílap) 


A legmodernebb laptopot bemutató lap releváns lenne, ha azonban a vásárlásra nem ad 
lehetőséget, nem ajánlat. Egyelőre azt fogjuk mondani, hogy egy lap ajánlat, ha a lapon 
egy HTML-hivatkozáson, vagy űrlapon belül a , vásárol" vagy az ,ára" szavakat tartal- 
mazza, Más szóval, ha a lap tartalmaz egy , ca ... vásárol ... c/a:" alakú füzért, 
akkor ez egy ajánlat. A ,vásárol" helyett lehetne az , ára", illetve az ,a" helyett 
a , form", Felírhatjuk ennek axiomatikus alakját: 
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Egy absztrakt online bolt 

Válasszon a termékeink listájából: 
Számítógépek 

Fényképezőgépek 

Könyvek 

Videók 

Zene 





ch1sEgy absztrakt online boltc/h1: 
cisVálasszonc/is a termékeink listájából: 
culs 

elis ca href 
elis ca hrei 


z"http://absz-bolt.com/szmg":Számítógépekc/az 
http: //absz-bolt . com/ feny"Fényképezőgépekc/as 
elis ca hrefz"http://absz-bolt .com/konyv"?Könyvekc/a? 

lis ca href-"http://absz-bolt.com/video"sVideókc/az 

lis ca hrefs"http://absz-bolt.com/zene"sZenec/az 

S/uls 














10.7 ábra. Egy absztrakt online bolt weblapja, ahogy egy böngészőt használó ember látja (felül). és 
a hozzá tartozó HTML-füzér, ahogy azt a böngésző vagy a vásárló ágens látja (alul). A HTML-ben a c 
És a 5 közötti karakterek a jelölő direktívák, amelyek meghatározzák, hogy a lapot hogyan kell kijelez- 
ni. Az cisVálasszonc/i: füzér például jelzi. hogy dőlt betűre kell átkapcsolni, a Válasszon szót 
kijelezni és a dőlt betű használatát befejezni. Egy lapazonosító, mint amilyen a http: //absz- 
bolt.com/zene az ún. egységes erőforrás azonosító (uniform resource locator. URL). 
Az ca hrefz"urt" hivatkozás /az bejelölés jelzi, hogy az urf felé létesíteni kell egy hipertext- 
kapcsolatot a hivatkozó szöveg (anchor text) hivatkozással. 


Ajánlaklap) 42 (CímkébenK,,a", füzér, lap) V 

Címkében(, forn", füzér, lap)) 

A (Benne(, vásárol", füzér) V Bennet, ára", füzér)) 
Címkébent , címke", füzér, lap) 6 Benne(, c" 4 címke 4- füzér -t ,,£/" 4 címke, lap) 
Bennelalfüzér, füzér) sz Ji füzérli : i 4 Hossza(alfüzén) — alfüzér 


Most szükséges releváns lapokat találni. A stratégia az online bolt honlapjától kezdeni, és 
azokkal a lapokkal foglalkozni, amelyet a releváns linkek mentén el lehet érni.§ Ágen- 
sünk számos boltról fog tudni, például: 


Amazon E OntineBolt A HonLap(Amazon, , amazon.com") 
Ebay € OnlineBolt A HonLaj(Ebay, ,ebay.com") 
ÁltBolt E OnlineBolt A HonLap(ÁltBolt, ,ált-bolt.com") 


E boltok termékeit termékkategóriákba sorolják, és a fő kategóriákhoz linkeket biztosí- 
tanak a honlaptól kiindulva. Kisebb kategóriákat a releváns linkek láncának követésé- 
vel lehet elérni, és végül az ajánlatokhoz is eljutunk. Más szóval, egy lap a lekérdezés 
szempontjából releváns, ha a bolt honlapjától a releváns kategóriakapcsolat láncán át 
elérhető, és egy további link követésével a termékajánlathoz is eljutunk: 


8 A hivatkozáskövető stratégia alternatívája egy internetkereső gépnek a használata. Az internetkeresésről, 
az információkinyerés mögött húzódó technológiákról a 23.2. alfejezetben lesz szó. 
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Relevánsílap, urt, lekérdezés) 2 
Abolt, hon bolt c OnLineBolt A Honlapíbolt,hon) 
A Jurt, RelevánsLánc(hon, url), lekérdezés) A Link(urt,, url) 
A lap - VeddElőLapottíur!) 


A Link(tól, ig) predikátum jelentése, hogy a tól! URL-től az ig URL-ig létezik egy 
hiperhivatkozás (lásd 10.13. feladat). Hogy a RelevánsLánc-ot definiálhassuk, nem 
valamilyen régi hiperhivatkozást kell követnünk, hanem azokat, amelyeknél a csatolt 
hivatkozó szöveg jelzi, hogy a hivatkozás a lekérdezés szempontjából releváns. Erre 
a LinkSzöveg(tól, ig, szöveg)-et fogjuk használni, melynek jelentése, hogy létezik egy 
hivatkozás tól-tól ig-ig, szöveg-gel mint hivatkozó szöveggel. A start és a vége URL-ek 
közötti hivatkozáslánc a d leírás szempontjából releváns, ha minden hivatkozás hivat- 
kozó szövege a d szempontjából releváns kategórianév. A lánc létezését egy rekurzív 
definíció biztosítja, az üres lánccal (start — vége) mint kiinduló állapottat: 


RelevánsLánc(start, vége, lekérdezés) 4 (start — vége) 
V. (du, szöveg LinkSzöveg(start, u, szöveg) 
AN RelevánsKategóriaNévílekérdezés, szöveg) 
A RelevánsLánc(u, vége, lekérdezés)) 


Most definiálnunk kell, hogy egy lekérdezés szempontjából egy szöveg mikor lesz 
egy RelevánsKategóriaNév. Először tudnunk kell a füzéreket és az általuk megnevezett 
kategóriákat kapcsolatba hozni. Jó lesz erre a Név(s, c), amely azt állítja, hogy az s füzér 
a c kategória neve — mondhatjuk például hogy Néw(, laptop", LaptopSzámítógép). A Név 
predikátumra további példák a 10.8. ábrán találhatók. A következő a relevancia definiá- 
lása. Tegyük fel, hogy a lekérdezés a , laptop". RelevánsKategóriaNéXlekérdezés, szöveg) 
igaz lesz, feltéve, hogy az alábbiak közül egy teljesül: 


" A szöveg és a lekérdezés ugyanazt a kategóriát nevezi meg — például , laptop számí- 
tógép" és , laptop". 

s A szöveg egy szuperkategóriát nevez meg, mint például , számítógép". 

s A szöveg egy alkategóriát nevez meg, mint például , ultrakönnyű laptop". 


A RelevánsKategóriaNév logikai definíciója az alábbi: 


RelevánsKategóriaNévílekérdezés, szöveg) 
3cs, c2 Név(lekérdezés, cp) A Névíszöveg, c2) A (cp C €2) V (c2 CG c) (10.1) 


Máskülönben a hivatkozó szöveg irreleváns, mert egy, ezen a vonulaton kívüli kategó- 
riát nevez meg, mint például a , mainframe számítógép" vagy , pázsit és kert". 

Hogy képesek legyünk releváns kapcsolatokat követni, lényeges, hogy rendelkeznünk 
kell a termékek gazdag kategóriahierarchiájával. E hierarchia legfelső része hasonlíthat 
például a 10.8. ábrán látható hierarchiára. Nem lenne jó ötlet az összes lehetséges bevá- 
sárlási kategóriát listázni, mert a bevásárlónak mindig lehetnek új kívánalmai, és a ter- 
mékgyártók mindig új termékekke! fognak előrukkolni, hogy a vásárlókat kielégítsék 
(elektromos térdmelegítő?). Egy, mondjuk ezer kategóriából álló ontológia azonban 
a vásárlók többsége számára hasznos eszköznek fog bizonyulni. 

A termékhierarchián túlmenően rendelkeznünk kell a kategórianevek gazdag szótárá- 
val. Az élet sokkal egyszerűbb lenne, ha a kategóriák és az azokat megnevező füzérek 
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Könyv C Termék 

ZeneiFelvétel c Termék 
ZeneiCD C ZeneiFelvétel 
ZeneiSzalag C ZeneiFelvétet 

Elektronika C Termék 
DigitálisFényképezőgép C Elektronika 


SztereóBerendezés C Elektronika 

Számítógép C Elektronika 
LaptopSzámítógép C Számítógép 
AsztaliSzámítógép C Számítógép 


(a) 


Néw(,, könyv", Könyv) 
Néw, zene", ZeneiFelvétel) 
Né, CD", ZeneiCD) 
Néw, szalag", ZeneiSzalag) 
Név(, elektronika", Elektronika) 
NéwW,,digikamera", DigitálisFény- 
képezőgép) 
Néw,, sztereó", SztereóBerendezés) 
Néw, számítógép", Számítógép) 
Néw , laptop", LaptopSzámítógép) 
Név(,, PC", AsztaliSzámítógép) 


b) 








10.8. ábra. (a) A termékkategóriák taxonómiája. (b) Ezen kategóriák számára a hivatkozó szövegek. 


között egy-egyértelmű kapcsolat állna fenn. A szinonima (synonymy) problémáját — két 
név, például , laptop számítógép" és , laptop" ugyanazon kategória számára — már láttuk. 
Van még továbbá az egyértelműsítés (ambiguity) problémája — egy név két vagy több 
különböző kategória számára. Ha például a 10.8. (b) ábrán látható tudásbázishoz a: 


Név(,, CD", DiplomataJármű) 


mondatot is hozzáadjuk, akkor a , CD" két különböző kategóriát fog megnevezni. 

A szinonimák és az egyértelműsítés lényegesen megnövelheti az ágens által követen- 
dő utak számát, és néha megnehezítheti annak eldöntését, hogy egy adott lap tényleg 
releváns-e. Sokkal komolyabb probléma, hogy a felhasználó által begépelhető leírások 
vagy a bolt által használt kategórianevek választéka igen széles lehet. A link például a 
.Japtop"-ról szólhat, holott a tudásbázis csak , laptopok"-ról tud, vagy pedig a felhasz- 
náló , egy számítógépet" keres, , amely elférne a Boeing 737 turistaosztályán az étkező- 
asztalkán". Lehetetlen előre végig felsorolni egy kategória megnevezéseinek minden 
változatát, így az ágensnek bizonyos esetekben tovább kell következtetnie, hogy kide- 
rítse, érvényes-e a Név reláció. A legrosszabb esetben ez a természetes nyelv teljes 
megértését igényelné, mely téma tárgyalását a 22. fejezetig késleltetjük. A gyakorlatban 
néhány egyszerű szabály, mint például engedélyezni, hogy a ,.laptop" illeszkedjen a 
.Japtopok" kategóriára, igen jól szuperál. A 10.5. feladatban megkérjük majd az olvasót, 
hogy egy ilyen szabálykészletet fejlesszen ki, azt követően, hogy az online boltokban 
egy kicsit körbenézett. 

Az előbbi bekezdésben megadott logikai definíció, valamint a termékkategóriákat és 
a megnevezési konvenciókat tartalmazó megfelelő tudásbázisok birtokában készek 
vagyunk-e már, hogy a lekérdezésünkre vonatkozó releváns ajánlatok halmazát kikö- 
vetkeztető algoritmust alkalmazzuk? Még nem! A hiányzó elem a VeddElőLapottur!) 
függvény, amely egy adott ur! címen lévő HTML lapra hivatkozik. Az ágens nem ren- 
delkezik a tudásbázisában minden URL lap tartalmával, és az ilyen tartalom kitalálásá- 
Ta vonatkozó explicit szabályokkal sem rendelkezik. Ehelyett elintézhetjük, hogy amikor 
egy részcél a VeddElőLapot függvényre hivatkozik, a megfelelő HTTP eljárás fog meg- 
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hívódni. A következtető gép számára ily módon mintha az egész világháló jelenne meg 
a tudásbázisában. Ez az ún. procedurális kibővítésként (procedural attachment) ismert 
általános módszer egy példája, ahol az egyes predikátumokat és függvényeket speciális 
rendeltetésű eljárásokkal kezeljük. 


Ajánlatok összehasonlítása 


Tegyük fel, hogy az előbbi részfejezet következtetési eljárása a , laptop" lekérdezésünk- 
re több ajánlatlapot is adott vissza. Az ajánlatok összehasonlításához az ágensnek a 
lapokból releváns információt — ár, sebesség, diszkkapacitás, súly stb. — ki kell nyerni. 
Az előbb említett okoknál fogva, valódi weblapok esetén, ez igen nehéz feladatnak 
bizonyulhat. E probléma kezelésének megszokott módja a lapról információt kinyerő 
ún. csomagolóprogramok (wrappers) használata. Az információkinyerés technológi- 
ájával a 23.3. alfejezetben foglalkozunk. Egyelőre feltételezzük, hogy csomagolóprogram 
létezik, és egy lap és a tudásbázis birtokában a tudásbázishoz tényeket ad hozzá. A lapra 
tipikusan csomagolóprogramok egész hierarchiáját lehetne alkalmazni. Egy általánosat 
a dátumok és az árak kinyeréséhez, egy specifikusabbat, hogy a számítógépes termékek 
atrribúrumait találja meg, végül, ha szükséges, egy weboldal-specifikust, amely az adott 
bolt weboldalformátumát is tudja. Ha az álh-boltcom egy weboldalt tartalmaz: 


YVM ThinkBook 970. Ára: 300.000.- Ft 


szöveggel, amit mindenféle technikai specifikáció követ, a csomagolótól elvárnánk, 
hogy az alábbi információt nyerje ki: 


lc, ajánlat lc € LaptopSzámítógép N ajánlat € TermékAjánlat NM 
KépernyőNagyságtic, Cm(32)) A KépernyőtTípus(ic, SZÉNLCD) A 
MemóriaNagyság(ic, Mbyte(512)) A CPUSebesség(lc, GHA2A)) A 
AjánlottTermék(ajánlat, lc) A Bolkajánlat, AbsztBolt) N 
URL(ajánlat, , abszt-bolt.com/szg/34356.htmI") A 
Áralajánlat, Ft(300000)) A Dátum(ajánlat, Ma) 


Ez a példa néhány olyan problémát hivatott megmutatni, amelyek akkor jelentkeznek, ha 
a kereskedelmi tranzakciókhoz szükséges tudásszervezést komolyan vesszük. Vegyük ész- 
re például, hogy az ár az ajánlatnak, és nem magának a terméknek az attribútuma. Ez fon- 
tos, mert egy adott bolt ajánlata napról napra változhat, akár ugyanarra az egyedi laptopra 
nézve. Egyes kategóriák esetén — mint például a házak és a festmények esetén — ugyanazt 
az egyedi objektumot különböző közvetítők egy időben különböző áron is ajánlhatják. 
Több bonyodalom is elképzelhető, amelyek kezelésével nem foglalkoztunk. Ilyen például 
annak a lehetősége. hogy az ár függhet a fizetés módjától, vagy hogy a vásárlóra bizonyos 
kedvezmények vonatkozhatnak. Összegezve, sok érdekes munka még hátramaradt. 

Az utolsó feladat a kiemelt ajánlatok összehasonlítása. Tekintsük például az alábbi 
három ajánlatot: 


A: 24 GHz CPU, 512 Mbyte RAM. 80 Gbyte diszk. DVD. CDRW, 350000 Ft 


,0 GHz CPU, 1 Gbyte RAM, 120 Gbyte diszk, DVD, CDRW, 400000 Ft 
C: 2.2 GHz CPU, 512 Mbyte RAM, 80 Gbyte diszk, DVD, CDRW, 400000 Ft 
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A C-t az A dominálja. Az A olcsóbb és gyorsabb, különben ugyanolyan. Általánosságban 
azt mondjuk, hogy X dominálja Y-t, ha X legalább egy attribútum esetében kedvezőbb érté- 
kű, és semmilyen más attribútum esetében sem rosszabb. Az A és a 8 közül egyik sem do- 
minálja a másikat. Hogy megállapítsuk, melyik a jobb, tudnunk kell, hogy a vásárló hogyan 
mérlegeli a CPU sebességét és árát a memóriához és a diszkkapacitáshoz képest. Többszö- 
rös attribútum esetében a preferenciák általános tárgyalását a 16.4. alfejezet tartalmaz- 
Za. Most az ágensünk egyszerűen ki fogja jelezni a vásárló leírásával megegyező, nem 
dominált ajánlatok listáját. Ebben a példában sem az A, sem a B nem dominált. Jegyez- 
zük meg, hogy ez az eredmény azon a feltevésen alapul, hogy mindenki jobban kedveli 
az olcsóbb árakat, a gyorsabb processzorokat és a nagyobb tárat. Bizonyos attribútu- 
mok, mint például a notebook képernyőmérete, a vásárló partikuláris preferenciáitól 
függenek (a hordozhatóság a láthatósággal szemben). Az ilyenekről a vásárló ágensnek 
a felhasználót kell kérdeznie. 

A leírt vásárló ágens egy egyszerű rendszer, és számos finomítása lehetséges. Mégis 
elegendő a képessége arra, hogy a megfelelő területspecifikus tudással a vásárlót tény- 
legesen tudja segíteni. Deklaratív konstrukciója miatt könnyen felskálázható bonyolul- 
tabb alkalmazásokhoz. Ennek az alfejezetnek a fő célja az volt, hogy kimutassuk, hogy 
bizonyos tudásreprezentáció — különösképpen a termék hierarchiája — szükséges az 
ilyen típusú ágensek számára, és ha már az ilyen formájú tudás rendelkezésre áll, a töb- 
bi már nem is olyan nehéz egy tudásalapú ágens számára. 
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Láttuk, hogy a kategóriák alapvető építőkockái bármely nagyobb méretű reprezentációs 
sémának. Ebben az alfejezetben a kategóriák szervezéséhez és a kategóriákkal való kö- 
vetkeztetéshez célzottan megtervezett rendszereket mutatjuk be. Két szoros kapcsolatban 
lévő rendszercsaládról beszélhetünk. A szemantikus hálók (semantic network) grafikus 
segítséget nyújtanak a tudásbázis vizualizálásában, és hatékony algoritmusokat biztosíta- 
nak, hogy egy objeknmm tulajdonságait a kategóriához való tartozásából kikövetkeztes- 
sük. A leíró logikák (description logics) formális nyelvet adnak a kategóriadefiníciók 
konstruálásához és kombinálásához, valamint hatékony algoritmusokat annak eldöntésé- 
hez, hogy a kategóriák között fennáll-e a részhalmaz- és a szuperhalmaz-reláció. 


Szemantikus hálók 


1909-ben Charles Peirce egy egzisztenciális gráfoknak (existential graphs) elnevezett 
grafikus jelölésrendszert javasolt, ami az ő elnevezése szerint a , jövő logikája". Ezzel 
kezdetét vette a , logika" és a , szemantikus hálók" szószólóinak hosszú vitája. Sajnos 
a vita elfedte azt a tényt, hogy a szemantikus hálók - legalább a jól definiált szemanti- 
kával ellátottak — a logika egy formáját jelentik. Bizonyosfajta állítások számára a sze- 
mantikus hálók nyújtotta jelölés gyakran kényelmesebb, azonban ha az , emberi inter- 
fész" problémáktól eltekintünk, a mögötte felsorakozó fogalmak — az objektumok, 
a relációk, a kvantifikálás stb. — mind ugyanazok. 
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A szemantikus hálóknak több változata van, mindegyik képes azonban az egyedi 
objektumokat, az objektumok kategóriáit és az objektumok közötti relációkat repre- 
zentálni. A tipikus grafikus jelölés objektumok, illetve kategóriák neveit ovális kere- 
tekben vagy dobozokban mutatja, címkézett élekkel összekapcsolva. A 10.9. ábrán 
például a Mária és a NőneműSzemély között Tagja kapcsolat van, ami annak a logikai 
állításnak felel meg, hogy Mária e NőneműSzemély. Hasonlóan a Mária és a János 
közötti Húga kapcsolat annak az állításnak felel meg, hogy Húga(Mária, János). A ka- 
tegóriákat a Részhalmaza éllel kapcsolhatjuk össze. A krumplik és a nyilak rajzolása 
annyira szórakoztató, hogy könnyű kísértésbe esni. Tudjuk például, hogy minden sze- 
mély anyja egy nőnemű személy, szabad-e akkor a Személy-től a NőneműSzemély-ig 
egy Anyja élt húzni? A válasz nem, merthogy az Anyja egy reláció egy személy és az 
anyja között, a kategóriáknak viszont nincsen anyjuk.? Emiatt a kapcsolatra a 10.9. ábrán 
egy külön jelölést használtunk — egy kettős vonallal történő bekeretezést. Ez a kapcsolat 
azt állítja, hogy: 


Vx x € Személy 5 [Vy Anyjatx, y) 2 y € NőneműSzemély] 
Esetleg azt is állíthatnánk, hogy egy személynek két lába van, azaz: 
Vx x E Személy 5 Lábatx, 2) 


Mint korábban, most ís óvatosnak kell lennünk, nehogy azt állítsuk, hogy kategóriának 
van két lába, A 10.9. ábra egyszeres vonallal végzett keretezése jelzi az egy kategória 
minden tagjának tulajdonságaira vonatkozó állítást. 

A szemantikus háló jelölésrendszere igen alkalmas a 10.2. alfejezetben bevezetett 
típusú öröklődéses (inheritance) következtetés végrehajtására. Így személy révén, 
Mária örökli azt a tulajdonságot, hogy két lába van. Ahhoz, hogy kitaláljuk, hány lába 
van Máriának, az öröklődéses algoritmus követi a Tagja élt a Máriá-tól az őt tartal- 
mazó kategóriáig, majd a Részhalmaza élt a hierarchiába felfelé, amíg egy olyan kate- 
góriát nem talál meg, amelyhez létezik egy bekeretezett Lába él — ebben ez esetben ez 
Személy kategória lesz. Ennek az öröklődéses algoritmusnak az egyszerűsége és ha- 
tékonysága a logikai tételbizonyítóhoz képest, a szemantikus hálók egyik fő vonzere- 
je volt. 

Az öröklődés komplikálódik, amikor egy objektum egyszerre több kategóriához tar- 
tozhat, vagy pedig amikor egy kategória több kategória részhalmaza. Ezt az esetet 
többszörös öröklődésnek (multiple inheritance) nevezzük. Az ilyen helyzetben a 
öröklődéses algoritmus esetleg két vagy több, egymással ellentétes választ talál a felké- 
résre. Ennél fogva a többszörös öröklődés bizonyos objektumorientált programozási 
(object-oriented programming, OOP) nyelvekből, mint amilyen például a Java, ami 
az osztályhierarchiában öröklődést használ, ki van zárva. Szemantikus hálókban a több- 
szörös öröklődést általában megengedjük, de ennek részletes tárgyalását a 10.7. alfeje- 
zetre hagyjuk. 


9 Bizonyos rendszerek nem tudtak különbséget tenni egy kategória tagjának tulajdonságai és kategória mint 
egész tulajdonságai között. Ez egyenes úton vezethet inkonzisztenciákhoz, ahogy ezt Drew McDermott kiemelte az 
, Artificial Intelligence Mets Natural Stupidity" című cikkében (McDermott. 1976). Más gyakori probléma volt a 
részhalmaz és a tagság kapcsolatoknál alkalmazott isA választássat, az angol használatnak megfelelően: . a cat is 
a marnmal" (a macska egy emlős) és , Fifi is a caC" (Fifi egy macska). E témákról többet lásd 10.25. feladat. 
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Rész! seg TT llmenászenől) 
NőneműsSzemély Cimeműszemé) 
Húga Lába 
C Mária ae János mi 


10.9. ábra. Egy szemantikus háló négy objektummal (János, Mária, 1 és 2) és négy kategóriával. A relá- 
ciókat a címkézett élek jelölik 





A következtetés másik közönséges formája az inverz kapcsolatok (inverse links) 
használata. Például a VanHúga a Húga inverze, azaz: 


Wp, s VanHúgatp, s) 43 Húga(s, p) 


Ezt az állítást megfogalmazhatjuk szemantikus hálóval, feltéve hogy a kapcsolatok 
reifikáltak (reified), azaz önálló objektumnak tekinthetők. Így például VanHúga ob- 
jektumot az Inverze éllel lehetne összekapcsolni a Húga objektummal. Ha egy lekérde- 
zés azt firtatná, hogy ki Jánosnak a Húga, az öröklődéses algoritmus felfedezheti, hogy 
a VanHúga a Húga inverze, és a lekérdezést úgy megválaszolhatja, hogy a VanHúga 
kapcsolatot János-tól Máriá-ig követi végig. Az inverz információ nélkül esetleg szük- 
séges lehetne az összes nőnemű személyt megvizsgálni, van-e netán Húga kapcsolata 
Jánossal. Ez amiatt van így, mert a szemantikus háló közvetlen indexelést csak az 
objektumok, a kategóriák és a belőlük induló kapcsolatok esetén biztosít. Az elsőrendű 
logika nyelvében ez annak felel meg, mintha a tudásbázist a predikátumok csakis első 
argumentumai szerint indexelnénk. 

Az olvasó talán felfedezte már a szemantikus háló jelölésnek egy nyilvánvaló hátrányát 
az elsőrendű logikához képest. A krumplik közötti élek csak bináris relációkat reprezen- 
tálnak. A Repül(Shankar, NewYork, Újdelhi, Tegnap) állítást a hálóban közvetlenül meg- 
fogalmazni nem tudjuk. Az n értékű állítások hatását megkaphatjuk azonban, ha az állí- 
tást magát egy, az események megfelelő kategóriájához tartozó eseményként reifikáljuk 
(lásd 10.3. alfejezet). A 10.10. ábra ehhez a konkrét eseményhez tartozó szemantikus 
hálóstniktúrát mutat. Jegyezzük meg, hogy a bináris relációkra vonatkozó korlátozás a 
reifikált fogalmak gazdag ontológiáját teszi szükségessé. Az ebben a fejezetben kifejlesz- 
tett ontológia zöme ténylegesen a szemantikus hálós rendszerekben gyökerezik. 

Állítások reifikálása lehetővé teszi, hogy az elsőrendű logika minden rögzített, függ- 
vénymentes atomi állítása reprezentálható szemantikus hálós jelöléssel. Univerzálisan 
kvantifikált állítások bizonyos típusai reprezentálhatók a kategóriákra alkalmazott inverz 
kapcsolatok, valamint egyszeresen és kétszeresen bekeretezett élek alkalmazásával, ettől 
még persze az elsőrendű logikától messze vagyunk. A negálás, a diszjunkció, a beágya- 
zott függvényszímbólumok és az egzisztenciális kvantifikálás mind hiányzik. Manapság 
lehetséges a jelölés kiterjesztése, hogy az az elsőrendű logikával ekvivalens legyen — 
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RepülEsemény 





10.10. ábra. A szemantikus háló egy részlete, amely a RepüitShankar, NewYork, Újdelhi, Tegnap) logi- 
kai állítás reprezentációját valósítja meg 


ilyenek például a Pierce-féle egzisztenciális gráfok vagy Hendrix-féle particionált sze- 
mantikus hálók (Hendrix, 1975) — ez viszont a szemantikus hálók fő előnyét — az örök- 
lődéses folyamat egyszerűségét és átláthatóságát — semmisíti meg. A tervezők nagy 
hálókat építhetnek, és még mindig lehetnek jó ötleteik, hogy mely lekérdezések lesznek 
hatékonyak, mert (a) az öröklődéses eljárás lépéseit könnyű vizualizálni, (b) egyes ese- 
tekben a lekérdezés nyelve olyan egyszerű, hogy bonyolult lekérdezéseket feltenni nem 
is lehet. Azokban az esetekben, amikor a kifejezőerő túlságosan korlátozott, számos 
szemantikus hálórendszer a procedurális kiegészítéshez (procedural attachment) folya- 
modik, hogy a hiányokat kítöltse. A procedurális kiegészítés egy olyan módszer, amikor 
egy bizonyos relációra vonatkozó lekérdezés (néha állítás) egy, a relációhoz megtervezett 
speciális eljárás, és nem egy általános öröklődéses algoritmus meghívását eredményezi. 

A szemantikus hálók egyik legfontosabb aspektusa, hogy képesek a kategóriák szá- 
mára az alapértelmezett értékeket (default values) reprezentálni, A 10.9. ábra gondos 
végignézésével észrevehetjük, hogy Jánosnak egy lába van annak ellenére, hogy ő egy 
személy, és minden személynek két lába van. Egy tisztán logikai tudásbázisban ez egy 
ellentmondás lenne, de a szemantikus hálóban az az állítás, hogy minden személynek 
két lába van, egy alapeseti állítás, azaz egy személyről feltételezzük, hogy két lába van, 
ha nincs ezzel ellentmondó specifikusabb információ. Az alapeseti szemantikát termé- 
szetesen az öröklődéses következtetés kényszeríti ki. mert a kapcsolatokat magától az 
objektumtól (itt Jánostól) felfelé követi, és megáll, hacsak egy értéket meg nem talál. 
Azt mondjuk, hogy az alapeseti értéket egy specifikusabb érték felülírhatja (over- 
ridden). Vegyük észre, hogy lábak számát felül tudnánk írni egy EgyLábúSzemély kate- 
gória létesítésével, ami a Személy Részhalmaza lenne, és amelynek János lenne a tagja. 

A háló szigorúan logikai szemantikáját megtarthatjuk, ha azt mondjuk, hogy a Lába 
állítás a Jánosra vonatkozó kivételt tartalmazza: 


Vx x € Személy A x z János 5 Lába(x, 2) 


Egy rögzített háló esetén ez szemantikusan megfelelő, azonban ha sok kivételünk lesz, 
kevésbé tömör lesz a felírásunk, mint a hálós jelölés maga. Több állítással frissített háló 
esetén az ilyen megközelítés sajnos kudarcra van ítélve — amit valójában mondani 
szeretnénk az az, hogy minden, egyelőre még ismeretlen egylábú személy szintén kivé- 
telnek számít. Ezzel a témával és az alapeseti következtetésse! általában bővebben a 
10.7. alfejezet foglalkozik. 
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Leíró logikák 


Az elsőrendű logika szintaxisát úgy tervezték, hogy egyszerű legyen objektumokról 
kijelentéseket tenni. A leíró logikák (description logics) olyan jelölések, amelyeket a 
kategóriák definícióinak és tulajdonságainak könnyebb leírására terveztek. A leíró 
logikák a szemantikus hálókból alakultak ki, válaszul arra a nyomásra, hogy a hálók 
jelentését formalizáljuk, hangsúlyozva emellett a taxonómia szervezési elvként való 
használatát. 

A leíró logika alapvető következtetési feladata a részvizsgálat (subsumption) - 
annak ellenőrzése, hogy egy kategória része-e egy másiknak a definícióik alapján — 
és az osztályozás (classification) — annak ellenőrzése, hogy egy objektum egy kate- 
góriába tartozik-e. Bizonyos rendszerek egy kategóriadefiníció konzisztencia. 
vizsgálatát (consistency) is tartalmazzák arra, hogy a tagsági kritérium logikailag 
kielégíthető-e. 
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Fogalom Dolog ] Fogalomnév 
És(Fogatom, ...) 
Mind(SzerepNév, Fogalom) 
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10.11. ábra. A leírások szintaxisa a CLASSIC nyelv egy részhalmazában 


A CLASSIC nyelv (Borgida és társai, 1989) egy tipikus leíró logika. A 10.11. ábra mu- 
tatja a CLASSIC leírások szintaxisát (az érthetőség kedvéért a nyelv kulcsszavait magyar 
fordításban adjuk meg — a ford.).10 Azt az állítást például, hogy az agglegények nőtlen, 
felnőtt férfiak, következőképpen írhatnánk le: 


Agglegény — És(Nőtlen, Felnőtt, Férfi) 
Ennek elsőrendű logikai ekvivalense a következő lenne: 
Agglegény(x) 6 Nőtlerx) A Felnőtt(x) A Férfilx) 


Vegyük észre, hogy a leíró logika hatékonyan teszi lehetővé azt, hogy a predikátumo- 
kon direkt logikai műveleteket hajtsunk végre anélkül, hogy először mondatokat alkot- 
nánk, amiket azután összekapcsolunk kötőszavakkal. Bármilyen leírás a CLASSIC-ban 
kifejezhető elsőrendű logikával, de bizonyos leírások a CLASSIC-ban sokkal világosab- 
bak. Például az emberek egy olyan halmazának leírásához, akiknek legalább három 
fiuk van, és a fiúk mind munkanélküliek, és a feleségeik orvosok, valamint maximum 


10 Vegyük észre, hogy a nyelv nem engedi meg annak állítását. hogy az egyik fogalom vagy kategória egy 
másiknak a része, Ez egy átgondolt irányvonal: a kategóriák közötti részviszonyt a kategóriák bizonyos aspek- 
tusaiból kell tudni levezetni. Ha ez nem sikerül, akkor valami hiányzik a leírásból. 
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két lányuk van, akik vagy fizika, vagy matematika tanszéken professzorok, azt hasz- 
nálnánk, hogy: 


Ésí(Férfi, Legalább(3, Fiú), LegfeljebbX2, Lány), 
Mind(Fiú, És(Munkanélküli, Házas, Mind(Feleség, Orvos))), 
Mind(Lány, É(Professzor, BetölK Tanszék, Fizika, Matematika)))) 


Gyakorlatként meghagyjuk ennek lefordítását elsőrendű logikára. 

A leíró logikák talán egyik legfontosabb aspektusa a következtetés nyomon követhe- 
tőségére tett hangsúly. Egy problémaeset megoldása a leírásával kezdődik, majd annak 
megkérdezésével folytatódik, hogy része-e a lehetséges megoldás a kategóriák egyiké- 
nek. Standard elsőrendű logikában a válasz idejének megjóslása gyakran lehetetlen. 
Gyakran a felhasználóra vár a reprezentáció olyan átalakítása, hogy kikerülje azokat 
a mondathalmazokat, amelyek miatt úgy tűnik, hogy a rendszernek több hétbe telik a 
probléma megoldása. A leíró logikák viszont azt biztosítják, hogy a részvizsgálat meg- 
oldható legyen polinomiális idő alatt a probléma leírásától függően.!! 

Ez a gyakorlatban csodálatosan hangzik, míg az ember rá nem jön, hogy a követke- 
ző két konzekvencia valamelyike lehetséges csak: a nehéz problémákat vagy nem lehet 
kifejezni, vagy exponenciálisan nagy leírást igényelnek! Mindenesetre a kezelhetőség 
eredményei vetnek némi fényt arra, hogy milyen konstrukciók okoznak bajt, és így 
segítik a felhasználót annak megértésében, hogyan viselkednek különböző reprezen- 
tációk. Például a leíró logikákból általában hiányzik a negálás és a diszjunkció. Ezek 
mindketten arra kényszerítik az elsőrendű logikai rendszert, hogy lényegében egy ex- 
ponenciális eset analízisen menjen keresztül a teljesség biztosítása érdekében. A negá- 
lás és a diszjunkció ugyanezen ok miatt van kizárva a Prolog nyelvből is. A CLASSIC 
csak egy korlátozott formájú diszjunkciót engedélyez a Kitölt és az EgyBelőle szerke- 
zetekben, ami lehetővé tesz diszjunkciót explicit módon megszámolt egyedek felett, de 
nem a leírások felett. Diszjunktív leírással az egymásba ágyazott definíciók könnyen 
exponenciális számú alternatív úthoz vezethetnek, amelyekben az egyik kategória 
könnyen része lehet egy másiknak. 


10.7. KÖVETKEZTETÉS ALAPÉRTELMEZETT 
INFORMÁCIÓVAL 


Az előbbi alfejezetben láttunk egy egyszerű példát egy alapértelmezett státussal rendel- 
kező állításra: , az embereknek két lába van". Ezt az alapértelmezett értéket specifikusabb 
információval, mint például , a Kékszakállúnak egy lába van", felülírhatjuk. Láttuk, hogy 
a szemantikus háló öröklődési mechanizmusa az alapértelmezett értékek felülírását egy- 
szerű és természetes módon oldja meg. Ebben a részben az alapértelmezett értékeket 
mélyebben tanulmányozzuk annak érdekében, hogy az alapértelmezett értékek szeman- 
tikáját alaposabban megértsük, és ne szorítkozzunk csupán a procedurális mechanizmus 
megadására. 


II A €Lassic nyelv a gyakorlatban hatékony részvízsgálatot biztosít, a legrosszabb eset azonban exponen- 
ciális futásidejű. 
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Nyitott és zárt világok 


"Tegyük fel, hogy egyetemen a számítástudományi tanszék hirdetőtábláját nézzük, és azt 
az üzenetet látjuk, hogy: , Az alábbi tantárgyakat fel lehet venni: SZT 101. SZT 102, 
SZT 106 és VIM 101." Próbáljuk most megválaszolni, vajon hány tárgyat lehet felven- 
ni? Ha a válasza az, hogy , négy", ez megegyezik egy tipikus adatbázis válaszával. Ha 
adott egy relációs adatbázisa: 


Tantárgy(SZT, 101), Tantárgy(SZT, 102), Tantárgy( SZT, 106), 
Tantárgy(VIM, 101) (10.2) 


négy állítás megfelelőjével, acount " from Tantárgy SOL-felkérés 4-es válasszal 
tér vissza. Másfelől egy elsőrendű logikai rendszer válasza az lenne, hogy , egy és végte- 
len között valahány", és nem , négy". Ennek magyarázata, hogy a Tantárgy állítás nem 
zárja ki, hogy más, nem említett tantárgyakat is fel lehessen venni, és azt sem, hogy az 
említett tantárgyak mind különbözők. 

A példa mutatja, hogy az adatbázisok és az emberi kommunikáció konvenciója az el- 
sőrendű logikától legalább két aspektusban különbözik. Először, az adatbázisok (és az 
emberek) feltételezik, hogy a megadott információ teljes, vagyis hogy az igazként ki 
nem jelentett rögzített atomi formulákról feltételezhetjük, hogy hamisak. Ez az ún. zárt 
világ feltételezés (closed-world assumption, CWA). Másodszor, elfogadjuk általá- 
ban, hogy különböző nevek különböző objektumokat jelentenek. Ez az ún. egyedi el- 
nevezések feltételezés (unigue names assumption, UNA), amit a cselekvés-nevek 
kontextusában először a 10.3. alfejezetben vezettünk be. 

Az elsőrendű logika e konvenciókhoz nem folyamodik, így precízebbnek kell lennie. 
Hogy kijelentsük, csak négy különböző tantárgyat lehet választani, azt kellene írni, hogy: 

Tantárgy(d, n) 6 Id, n) — (SZT, 101) v [d, n]) — ISZT, 102] 

V [d, n) — (SZT, 106) V [d, n] — [VIM, 101] (10.3) 
A (10.3) egyenletet a (10.2) lezárásának!2 (completion) nevezzük. A lezárás általában 
minden predikátumhoz egy definíciót, egy , akkor és csak akkor" állítást rendel hozzá. 
Minden definícióban mindegyik, a predikátumot a fejében tartalmazó definit klózhoz egy 
diszjunkció fog tartozni. 13 A lezárást általánosságban az alábbi módon szerkesztik meg: 
1. Gyűjtsük ki az ugyanolyan (P) predikátum névvel és (1) aritással rendelkező klózokat. 
2. Minden klózt az ún. Clark Normál Formára (Clark Normal Form) transzformáljuk: 
cseréljük a: 
P(t,...s tn) — Törzs 
kifejezést, ahol a t;-k termek, a: 
P(ti...s tp) — 391... Wa IVa. Va) — af... tr) A Törzs 


kifejezésre, ahol a v,-k az újonnan bevezetett változók és a w;-k az eredeti klóz változói. 
Használjuk minden klóz esetén a v; változók ugyanazon halmazát. Eredményként a: 


12 A felfedezőjéről, Keith Clarkról néha Clark-lezárásnak ís nevezik. 
13 Jegyezzük meg, hogy ez egyben a 10.3. alfejezetben megadott követő állapot axiómák alakja is. 
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PV. Vo) — B 


PIV...s Vu) — By 
klózok halmazát kapjuk. 
3. Kombináljuk ezeket össze egy nagy diszjunktív klózzá: 
P(VI...sV) BV... VB, 
4. Zárjuk le azáltal. hogy a —-at ekvivalenciára cseréljük: 
PGy VE BIV...V B 


A Clark-lezárás egy példáját — szabályokat és rögzített tényeket tartalmazó tudásbázis 
esetén — a 10.12. ábrán láthatjuk. Hogy hozzáadhassuk az egyedi elnevezések feltétele- 
Zést is, egyszerűen adjuk meg az azonossági reláció Clark-lezárását, ahol csak azok az 
ismert tények, hogy SZT — SZT és 101 — 10! stb. Ennek megvalósítását gyakorláskép- 
pen meghagyjuk az olvasónak. 








Horn.kiózok Clark-lezárás 
TantárgyíSZT, 101) Tantárgyíd, n) 6 [d, n] — ISZT, 1011 
Tantárgy( SZT, 102) V [d, n) — ISZT, 1021 
TantárgyíSZT, 106) V [d. a) — ISZT. 106 
Tantárgy(VIM, 101) V Id, n) — (VIM, 1019 
Tantárgy(VIM, i) — Egész(i) V 31 [d, 1) — (VIM, 101) A Egész(ő) 
AIO1SIAi S 130 NIO SiAig 130 
TamtárgyX SZT. m 4 100) sz V Am [d, n] — ISZT, m 4- 100) 
Tantárgy(SZT. m) A 100 £ m A Tantárgy SZT. m) A 100 £ m 
Nm £ 200 Am £ 200 








10.12. ábra. Horn-klózok egy halmazának Clark-lezárása. Az eredeti Horn-program (balra) négy tap- 
tárgyat említ explicit módon, és azt is állítja, hogy minden egészre a 101 és a 130 között létezik egy 
matematikai tárgy, meg azt is, hogy minden SZT tárgyhoz a 100-as (BSc) sorozatban létezik egy meg- 
felelő tantárgy a 200-as (MSc) sorozatban. A Clark-lezárás (jobbra) azt mondja, hogy más tantárgy 
nincs is. A lezárással és az egyedi elnevezések feltételezéssel (valamint az Egész predikátum nyilván- 
való definíciójával) együtt eljutunk a kívánt konklúzióig, miszerint pontosan 36 tantárgy van: 30 mate- 
matikai és 6 SZT tárgy. 


A zárt világ feltételezés lehetővé teszi, hogy megtaláljuk egy reláció minimál- 
modelljét (minimal model). Ez azt jelenti, hogy a Tantárgy relációhoz a legkevesebb 
elemet tartalmazó modellt találhatjuk meg. A (10.2) egyenletben a Tantárgy minimál- 
modellje négyelemű, kevesebb már ellentmondáshoz vezet. Horn-klóz tudásbázisok 
esetén mindig létezik egy egyértelmű minimálmodell. Jegyezzük meg, hogy az egyedi 
elnevezések feltételezés mellett ez az azonossági relációra is vonatkozik: minden term 
csakis saját magával azonos. Paradox módon ez azt jelenti, hogy a minimál modellek egy- 
ben maximálisak abban az értelemben, hogy annyi objektumot tartalmaznak, amennyi 
csak lehetséges. 
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Lehetséges egy Horn-program Clark-lezárását képezni, majd a következtetések levoná- 
sa végett egy tételbizonyítónak átadni. Hatékonyabb azonban általában egy olyan speciá- 
lis rendeltetésű következtető gépet használni, mint amilyen a Prolog, amelynél a zárt világ 
és az egyedi elnevezések feltételezések a következtetési mechanizmusba be vannak építve. 

Akik a zárt világ feltételezéshez folyamodnak, óvatosan kell megválasztaniuk az ál- 
taluk használt következtetést. Egy népszámlálási adatbázisban példái 
világ feltételezést használni, ha a következtetés a városok populáci 
nyilván helytelen konklúzió lenne elfogadni, hogy a jövőben nem születnek gyerekek, 
csakis annak alapján, hogy az adatbázis a jövőbeli születési bejegyzéseket nem tartal- 
mazza. A zárt világ feltételezés az adatbázist teljessé (complete) teszi abban az érte- 
lemben, hogy minden atomi lekérdezésre vagy pozitív, vagy negatív választ kapunk. 
Ha valamely tényállásról (mint például a jövőbeli születések) tényleg tudatlanok 
vagyunk, a zárt világ feltételezést használni nem szabad. Egy komplikáltabb tudásrep- 
rezentációs rendszerben a felhasználónak esetleg szabad lenne specifikálni a zárt világ 
feltételezés használatát leíró szabályokat. 





Negálás mint kudarc és stabil modell szemantika 


A 7. és a 9. fejezetekben láttuk, hogy Hom-klóz formájú tudásbázisnak kedvező számí- 
tástechnikai tulajdonságai vannak. Sok alkalmazásban azonban nem kényelmes azt biz- 
tosítani, hogy klózok törzseiben csak pozitív literálok legyenek. Szeretnénk például azt 
mondani, hogy , Kimehetsz, ha nem esik", anélkül hogy olyan predikátumokhoz kelle- 
ne folyamodni, mint a NemEsik. Ebben a részben annak a lehetőségét kutatjuk, hogy a 
Horn-klózokhoz az explicit negálás egy formáját adjuk hozzá a negálás mint kudarc 
(negation as failure) ötletét felhasználva. Az ötlet az, hogy egy negatív , not P" literált 
igaznak , bizonyíthatunk", hasonlóan, mint ahogy P bizonyítása kudarcba fulladhat. Ez 
az alapeseti következtetés egy formája, ami a zárt világ feltételezéshez szorosan kap- 
csolódik: tételezzük fel, hogy valami hamis, ha nem bizonyítható, hogy igaz. Hogy 
a negálás mint kudarc-ot a logikai ,,—" operátortól megkülönböztethessük, megjelölésére 
a ,nor"-ot fogjuk használni. 

A Prolog megengedi a not operátort egy klóz törzsében. Tekintsük például az alábbi 
Prolog programot: 


IDEmeghajtó — Meghajtó N not SCSImeghajtó 

SCSImeghajtó — Meghajtó N not IDEmeghajtó 

ScCSlvezérlő — SCSImeghajtó 

Meghajtó 
Az első szabály azt mondja, hogy ha számítógépben merevlemez-meghajtónk van, és ez 
nem SCSI, akkor IDE-nek kell lennie. A másik szabály azt mondja, hogy ha ez nem IDE, 
akkor SCSI-nek kell lennie. A harmadik azt mondja, hogy az SCSI-meghajtó létezése 
egy SCSI-vezérlőt tételez fel, végül a negyedik kijelenti, hogy tényleg van egy meghaj- 
tó. Ennek a programnak két minimálmodellje van: 


— (Meghajtó, IDEmeghajtó) 
Ma — (Meghajtó, SCSImeghajtó, SCSIvezérlő) 
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A minimálmodellek nem képesek a negálás mint kudarc-ot használó programok szán- 
dékolt szemantikáját kifejezni. Tekintsük a következő programot: 


P— note 


Ennek két minimálmodellje van: (P) és (0). Az elsőrendű logika szemszögéből van ennek 
értelme, mivel aP — -0 a P V 0-val ekvivalens. A Prolog szemszögéből azonban aggód- 
ni kellene: 2 soha nem jelenik meg a nyíl bal oldalán, hogyan lehet hát egy következmény? 

Egy altematíva a stabil model? (stable model), ami egy olyan minimálmodeil, ahol 
minden atomnak igazolása (justification) van, azaz létezik hozzá olyan szabály, amelyben 
a fej az atom, és ahol a törzs minden literálja kielégített. Formálisan M egy H program egy 
stabil modellje, ha M a H az M-re vonatkozó redukáltjának (reduct) egy egyértelmű mi- 
nimálmodellje. Egy H program redukáltját úgy definiáljuk, hogy H-ból először minden 
olyan szabályt törlünk, amely törzsében a nor A literál szerepel, ahol A a modell része, majd 
a maradó szabályokban a negatív literálokat töröljük. Mivel / redukáltja most már egy 
Horn-klóz lista, egy egyértelmű minimálmodellel kell rendelkeznie. 

A P — not 0 redukáltja a (P)-re nézve maga a (P), aminek minimálmodellje (P). 
Így (P) egy stabil modell. A (0)-ra vonatkozó redukció egy üres program, aminek 
minimálmodellje (). (0) tehát nem stabil modell, mert 0-nak a (10.5) egyenletben 
nincs igazolás. Egy másik példa a (10.4) redukáltjára az M1-re nézve: 


IDEmeghajtó 1— Meghajtó 
SCSIvezérlő — SCSImeghajtó 
Meghajtó 


Ennek minimálmodellje M, így My egy stabil modell. A válaszhalmaz programo- 
zás (answer set programming) a logikai programozásnak a negálás mint kudarc-cal 
bővített fajtája, amely úgy működik, hogy a logikai programot rögzített formába transz- 
formálja, majd stabil modelleket (amelyeket válaszhalmazoknak — answer sets — is 
neveznek) keres, ítéletkalkulus modell-ellenőrzési technikákat felhasználva. A válasz- 
halmaz-programozás leszármazottja tehát mind a Prolognak, mind az olyan gyors ítélet- 
kalkulus-beli kielégíthetőségi tételbizonyítóknak, mint a WALKSAT. A válaszhalmaz 
programozást sikerre! alkalmazták tervkészítési problémákra, hasonlóan az ítéletkalku- 
lus-beli kielégíthetőségi tételbizonyítókhoz. A válaszhalmaz-programozás előnye más 
tervkészítőkkel szemben a rugalmassága: a tervkészítő operátorokat és a kényszereket 
logikai programokkal fejezi ki, és így azok nem kötődnek a konkrét tervkészítési for- 
malizmus korlátozott formátumához. A válaszhalmaz-programozás hátránya ugyanaz, 
mint minden ítéletkalkulus szintű technikáé: ha az univerzumban túl sok objektum létezik, 
egy exponenciális lassulással kell számolnunk. 


Körülírás és alapeseti logika 


Két példát láttunk, ahol látszólag természetes következtetési folyamatok megsértik a 10- 
gika a 7. fejezetben bebizonyított monotonitás (monotonicity) tulajdonságát.14 Az el- 


issza, hogy a monoronitás megköveteli, hogy minden vonzatállítás igaz maradjon, amikor 
isokat adunk hozzá. Azaz ha 7B F a, akkor7BA BE a. 
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ső példában egy szemantikus hálóban egy kategória összes tagja által megörökölt tulaj- 
donságot egy alkategóriára vonatkozó specifikusabb információ felülírhatja. A másik 
példában a zárt világ feltételezésből származtatott negált líterálokat pozitív literálok 
hozááadása szintén felülbírálja. 

Ha egy kicsit magunkba nézünk, rájövünk, hogy a monotonítás ilyen sérülései a józan 
ész következtetésben igen elterjedtek. Úgy tűnik, az emberek gyakran , elhamarkodott 
következtetéseket" vonnak le. Ha az utcán parkoló kocsit látunk, mindenki elhiszi, 
hogy a kocsinak négy kereke van, holott csak három kerék látszik (ha valaki a negye- 
dik kerék létezésében kételkedik, akkor vegye fontolóra azt a kérdést, vajon a három 
látható kerék valódi-e, vagy csupán a valódinak egy papírmása.) A valószínűség-elmélet 
nyilván igazolhatja, hogy a negyedik kerék nagy valószínűséggel létezik, az emberek 
többségében az a lehetőség, hogy a gépkocsinak esetleg nincs négy kereke, egyáltalán fel 
sem merül, hacsak valami új tényállás erre nem derít fényr. A négy kerék konklúzióját 
tehát alapesetként kezeljük, a kételkedésre okot adó tények hiányában. Ha új tények ér- 
keznek - észrevesszük például, hogy a tulajdonos a kereket elviszi. és a gépkocsi egy 
emelőn áll — akkor a konklúziót vissza kell vonni. Az ilyen következtetésről azt mondjuk, 
hogy nemmonoton (nonmunoton), mert a hiedelemek halmaza idővel, ahogy az új evi- 
denciák megjelennek, nem növekszik monoton módon. Az ilyen viselkedés leírására 
nemmonoton logikákat (nonmonoton logics) fejlesztettek ki, módosított igazságdefini- 
cióval és vonzatrelációval. Két ilyen intenzíven tanulmányozott logikát fogunk megnéz- 
ni: a körülírást és az alapeseti logikát. 

A körülírást (circumscription) a zárt világ feltételezés erősebb és precízebb változa- 
tának lehetne tekinteni. Az ötlet, hogy konkrét predikátumokat specifikálunk, amelyek- 
ről feltételezzük, hogy , amennyire csak lehetséges hamisak" — azaz minden objektumra 
hamisak, kivéve azokat, amelyekre tudjuk, hogy igazak. Tegyük fel például, hogy ki 
akarjuk jelenteni azt az alapértelmezett szabályt, hogy a madarak tudnak repülni. Vezes- 
sük be az Abnormálisj(x) predikátumot, és írjuk fel: 


Madár(x) A -Abnormálisj(x) 2 Repült) 


Ha azt mondjuk. hogy az Abnormálisy-et körül kell érni (circumseribed), a körülíró 
következtető feltételezheti. hogy -Abnormálisi(x), hacsak az Abnormálisj(x)-et nem 
fogja igaznak találni. Ez lehetővé teszi, hogy a RepülTweety) konklúziót levonjuk a 
Madár(Tweety) premissza alapján, azonban a konklúzió csak addig igaz, amíg az Ab- 
normál(Tweetv) ki nem jelentjük. 

A körülírást a modellpreferencia-logika (model preference logic) egy példájá- 
nak is tekinthetjük. Az ilyen logikákban egy állítás vonzatrelációban van (alapeseti 
státuson), ha igaz a tudásbázis minden preferált modelljében, ellentétben a klasszi- 
kus logika igazságkövetelményével, hogy minden modellben legyen igaz. Körülírás 
esetében egy modell egy másiknál preferáltabb, ha kevesebb abnormális objektuma 
van.15 Nézzük meg, hogy ez az ötlet hogyan működik szemantikus hálóban fellépő 
többszörös öröklődés esetén. A többszörös öröklődés standard példája az ún. 


15 A zárt világ feltételezésnél egy modell egy másiknál preferáltabb, ha kevesebb igaz atomja van — azaz a 
preferált modellek minimálmodellek. A CWA és a definit klóz tudásbázis között létezik természetes kapcsolat, 
mert az ilyen tudásbázisban az előrecsatolt következtetés révén elért fix pont az egyértelmű minirnálmodell (lásd 
274. oldal). 
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, Nixon-gyémánt".16 Az eredete az a megfigyelés, hogy Richard Nixon egy kvéker 
vallási szektához tartozott (és így alapesetben pacifista) és republikánus is volt (és 
így alapesetben éppen nem pacifista). Ezt az alábbi módon írhatjuk fel: 


Republikánus(Nixon) A Kvéker(Nixon) 
Republikánus(x) A -Abnormálisa(x) 5 -Pacifista(x) 
Kvékertx) A -Abnormálisz(x) 5 Pacifista(x) 


Ha az Abnormális2-t és az Abnormálisz-at körülírjuk, két preferált modellt kapunk: az 
egyikben igaz az Abnormátis (Nixon) és a Pacifista(Nixon), a másikban igaz az Abnor- 
málisz(Nixon) és a -PacifistatNixon). A körülíró következtető rendszer tehát megfelelően 
tudatlannak mutatkozik a pacifista Nixon ügyében. Ha ezentúl szeretnénk kijelenteni, 
hogy a vallásos meggyőződések elsőbbséget élveznek a politikai nézetekkel szemben, 
a prioritásos körülírás (prioritized circumsecription) formalizmusát használhatjuk, 
hogy azoknak a modelleknek adjunk elsőbbséget, ahol az Abnormálisz minimálizálva 
van. 

Az alapértelemzett iogika (default logic) egy olyan formalizmus, ahol alapértel- 
mezett szabályokat (default rules) lehet írni feltételes, nemmonoton következtetések 
generálásához. Egy alapértelmezett szabály a következőképpen néz ki: 


Madánr(x) : Repükx)Repül(x) 


A szabály jelentése, hogy ha a Madártx) igaz, és ha a Repül(x) a tudásbázissal konzisz- 
tens, akkor a Repül(x)-et alapértelmezésben lekövetkeztethetjük. Általánosságban egy 
alapértelmezett szabály formája a: 


P: Ja sa IAÍC 


ahol P-t előfeltételnek, C-t konkluziónak és a J;-ket igazolásoknak nevezik — ha ezek 
közül bármelyik igazolhatóan hamis, a konklúziót levonni nem szabad. A C-ben és a 
Jben előforduló minden változónak P-ben is meg kell jelennie. A Nixon-gyémánt 
példáját alapértelmezett logikában egy ténnyel és két alapértelmezett szabállyal fejez- 
hetjük ki: 

Republikánus(Nixon) A Kvéket"Nixon) 

Republikánus(x) : -Pacifistat) FPacifistatx) 

Kvékerx) : Pacifistatx) /Pacifista(x) 


Egy alapértelmezett szabály jelentésének interpretálásához az alapértelmezett elmélet 
kiterjesztését (extension) kell definiálnunk, az elmélet konklúzióinak maximális hal- 
mazaként. Egy S kiterjesztés tehát az eredetileg ismert tényekből és az alapértelmezett 
szabályokból levont konklúzióhalmazból áll úgy. hogy §-ből semmilyen más konklúziót 
levonni már nem lehet, és 5-beli alapértelmezett konklúzió minden igazolása §-sel kon- 
zisztens. A körülírásban tárgyalt preferált modellekhez hasonlóan a Nixon-gyémántra 
két lehetséges kiterjesztésünk van: egy, amelyben pacifista és egy, amelyben nem az. Lé- 
teznek prioritásos sémák, ahol egyes alapértelmezett szabályoknak precedenciát lehet 
biztosítani más szabályokkal szemben, és ezzel a nem egyértelmű helyzeteket valame- 
lyest fel lehet oldani. 


16 A , gyémánt" elnevezés a két úton futó öröklődési lánc gráfszerű alakjától származik. (A ford.) 
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1980 óta, amikor is a nemmonoton logikákat első ízben javasolták, igen nagy előreha- 
ladás történt a maternatikai tulajdonságuk megértésében. A késői 1990-es évektől kezdve 
a logikai programozáson alapuló gyakorlati rendszerek ígéretesnek bizonyultak a tudás- 
reprezentációs eszközök szerepében. Vannak azonban még meg nem válaszolt kérdések. 
Így például ha , a gépkocsiknak négy kerekük van" hamis, mit is jelent, ha egy ilyen állí- 
tás a tudásbázis része? Milyen az alapértelmezett szabályok egy jó halmaza? Ha minden 
szabályról külön-külön nem tudjuk eldönteni, hogy a tudásbázisunkhoz tartozik-e, akkor 
igen komoly problémánk van a modularitás hiányával. Végül. hogyan lehet alapértel- 
mezett státussal rendelkező hiedelmeket a döntéshozatalban felhasználni? Ez talán az 
alapértelmezett következtetés legnehezebb problémája. A döntések sokszor kompromisz- 
szumokkal járnak együtt, és így szükség van különböző cselekvések eredményeként meg- 
jelenő hiedelmek erősségét összehasonlítani. Azokban az esetekben, amikor ugyanilyen 
jellegű döntésket sokszor hozunk meg, lehetőség adódik, hogy az alapértelmezett szabá- 
lyokat .küszöb-valószínűségi" állításokként értelmezzük. Például ,a fékjeim rendben 
vannak" alapértelmezett szabály valójában azt jelenti, hogy . annak a valószínűsége, hogy 
a fékjeim rendben vannak, feltéve, hogy más információm nincs, elegendően magas ah- 
hoz, hogy az optimális döntés számomra az, hogy induljak útnak a fékek ellenőrzése nél- 
kül". Amikor a döntés kontextusa megváltozik - például amikor egy súlyosan megrakott 
teherkocsit vezetünk egy lejtős hegyi úton —, az alapértelmezett szabály hirtelen alkalmat- 
lanná válik, akkor is, ha semmilyen új evidenciánk nincs, ami azt sugallná, hogy a fékek 
hibásak. Az ilyen mérlegelések néhány kutatót arra vezettek, hogy mérlegeljék, hogyan 
ágyazzák be az alapértelmezett következtetést a valószínűség-elméletbe. 
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Az előbbi részben arról érveltünk, hogy egy tudásreprezentációs rendszer által levont 
sok következtetésnek csupán alapértelmezett és nem tökéletesen biztos státusa lehet. 
Az ilyen kikövetkeztetett konklúziókból néhány szükségszerűen hibásnak fog bizo- 
nyulni, és új információ fényében vissza kell vonnunk. Ez a hiedelemrevízió (belief 
revision) folyamata.17 Tegyük fel, hogy a tudásbázis tartalmazza P állítást — az előre- 
csatolt algoritmussal levont alapértelmezett konklúziót vagy egyszerűen egy hibás fel- 
tételezést —, és szándékunkban áll végrehajtani az ÁLLÍT(TB, -P)-t. Hogy az ellentmon- 
dást elkerüljük, először végre kell hajtani a VISSZAVON(TB, P)-t. Ez elég egyszerűnek 
tűnik. Probléma akkor jelentkezik, ba P-ből rovábbi állításokat következtettünk le és 
jegyeztünk fel a tudásbázisba. A P 5 0 implikációt például felhasználtuk a 0 tudás- 
bázishoz való hozzáadásához. A nyilvánvaló , megoldás" — a P-ből kikövetkeztetett 
összes állítás visszavonása — kudarcba fut, mert ilyen állításoknak P-n túlmenően más 
igazolásuk is lehet. Ha R és R 5 0 is bekerült a tudásbázisba, akkor 09-t mégsem kell 
eltávolítanunk. Az igazság-karbantartó rendszereket (truth maintenance systems) 
ilyen bonyodalmakat kezelésére tervezték. 


17 A hiedelemreviziót sokszor a hiedelemírissítéssel (belief update) állítják szembe, amelyról akkor van 
szó, amikor a tudásbázis inkább a világbeli változások hatására, és nem a rögzített világról befutó új informá- 
ció hatására kerül felülvizsgálásra. A hiedelemírissítés összekapcsolja a hiedelemrevíziót az időre és a válto- 
zásra vonatkozó következtetéssel. Kapcsolatban áll a 15. fejezetben leírt szűrés (filtering) folyarnatával. 
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Az igazság-karbantartás egyszerű módja, hogy nyomon követjük, ahogyan sorban 
hozzáadjuk a mondatokat a tudásbázishoz, a mondatok P)-től P,.-ig történő megszámo- 
zásával. Amikor a VISSZAVON(TB, P;) hívás megtörténik, a rendszert a P; hozzáadása 
előtti állapotába állítjuk vissza, a P;-t és a P;-ből levont összes következtetést vissza- 
vonva, Ha szükséges, akkor a P;,, és a P,, közötti mondatok ismét hozzáadhatók. Ez 
egyszerű megoldás, és garantálja, hogy a tudásbázis konzisztens lesz, de azt jelenti, hogy 
a P; visszavonása n - i állítás visszavonását és újbóli kijelentését, valamint ezen állítá- 
sokból történő következtetések visszavonását és újbóli lefuttatását igényli. Olyan rend- 
szerekben, ahol sok tény kerül hozzáadásra, az ilyen megoldás nem praktikus. 

Hatékonyabb megközelítés az igazolásalapú igazság-karbantartó rendszer vagy 
JITMS (justification-based truth maintenance system). Egy JTMS-ben a tudásbázis 
minden mondatát olyan igazolással (justification) látják el, amely meghatározza azokat 
a mondatokat, amelyekből lekövetkeztették azokat. Például ha a tudásbázis már tartal- 
mazza a P 5. 0-t, akkor az ÁLLÍP) hatására a 0-t hozzáadjuk, az (P, P -. 0) igazolás- 
sal. Általánosságban bizonyos mondatoknak egynél több igazolása lehet. Az igazolások 
felhasználhatók hatékony visszavonásokra. A VISSZAVON(P) bívást követően, a TTMS 
pontosan azokat a mondatokat fogja a tudásbázisból eltávolítani, amelyeknél P minden 
igazolás része. Így, ha egy 0 mondatnak a (P, P 5. 0) lenne az egyetlen igazolása, ak- 
kor törlődne; ha az (P, PV. R 5- 0) igazolása is létezne, még mindig visszavonásra ke- 
rülne, dehaaz (R, PV.R 5. 0) igazolása is létezne, akkor megmaradna. Ily módon a P 
visszavonásához szükséges idő csakis azon múlik, hogy P-ből hány állítást vezettünk le, 
és nem azon, hogy P hozzáadása után hány állítás került még be a tudásbázisba. 

A IJTMS feltételezi, hogy az egyszer figyelembe vett mondatokat máskor is használ- 
ni fogjuk, így ahelyett, hogy törölnénk a tudásbázisból, amikor elvesztik az összes iga- 
Zolását, csak megjelöljük őket, mint kintlevőket. Ha egy későbbi állítás visszaállítja az 
igazolások egyikét, akkor a mondat ismét bentlevő jelölést kap. Ily módon a JTMS 
megtartja a használt összes következtetési láncot, és nem kell újra lekövetkeztetnie azo- 
kat a mondatokat, amelyek igazolása ismét érvényessé válik. 

Azon túl, hogy a TMSek a hibás információt visszavonják, felhasználhatók a többszö- 
rös hipotetikus helyzet elemzésének a felgyorsításához is. Tegyük fel, hogy a Román 
Olimpiai Bizottság helyszíneket keres a 2048-ban Romániában megrendezendő olimpiai 
játékokhoz az úszó, a könnyűatlétikai és a lovas versenyszámok számára. Legyen az első 
hipotézis a következő: Helyszín( Úszás, Pitesti), Helyszír( Könnyűatlétika, Bukarest) és 
HelyszíntLovasverseny, Arad). A választás logisztikai következményeinek kiderítésé- 
hez, és így a helyszínek kívánatosságának meghatározásához igen sok következtetés 
szükséges. Ha figyelembe akarjuk venni a Helyszín(Könnyűatlétika, Nagyszeben)-t, 
a TMS elkerüli annak a szükségességét, hogy újra nullából induljunk ki. Egyszerűen 
viszavonjuk a Helyszín( Könnyűdatlétika, Bukarest)-t, és hozzáadjuk a Helyszín Könnyű- 
atlétika, Nagyszeben)-t, és a TMS a szükséges revíziókat magára vállalja. A Bukarestre 
vonatkozó következtetési láncok Nagyszeben esetén újrafelhasználhatók, feltéve, hogy 
a konklúziók ugyanazok lesznek. 

Egy feltételezésalapú igazság-karbantartó rendszert (assumption-based truth 
maintenance system, ATMS) arra terveztek, hogy ezt a fajta hipotetikus világok kö- 
zötti kontextusátkapcsolást kifejezetten hatékonnyá tegye. Egy JTMS-ben az igazolá- 
sok karbantartása lehetővé teszi, hogy az egyik állapotból gyorsan egy másikba lépjünk 
Át néhány visszavonással és kijelentéssel, de minden időpillanatban csak egyetlen álla- 
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potot reprezentálunk. Egy ATMS az összes állapotot egyszerre reprezentálja, amivel 
valaha is foglalkoztunk. Míg egy JTMS egyszerűen bent- vagy kintlevőnek jelöli a mon- 
datokat, egy ATMS nyomon követi, minden egyes mondatra, hogy a mondatot mely fel- 
tételezések tennék igazzá. Más szavakkal minden egyes mondatnak van egy címkéje, 
amely a feltételezés halmazokat tartalmazó halmazból áll. A mondat csak azon esetben 
áll fenn, amikor egy feltételezés halmaz összes feltételezése fennáll. 

Az igazság-karbantartó rendszerek mechanizmust biztosítanak magyarázatok 
(explanations) generálásához is. Technikailag, P mondat magyarázatát olyan E mon- 
datok halmazával definiáljuk, melyekre E maga után vonja P-t. Ha E mondatai igazak, 
akkor E egyszerűen P igazolásához egy szükségszerű alap. Azonban a magyarázat 
részei lehetnek feltételezések (assumptions) is — olyan állítások, amelyek nem igazak, 
de ha igazak lennének, elegendők lennének P igazolásához. Lehetséges például, hogy 
nincs elég tény bebizonyítani, hogy az autó nem fog indulni, de egy jó magyarázat része 
lehet az elromlott akkumulátor. Ez, összekapcsolva a gépkocsik működésére vonatko- 
zó tudással, elegendő, hogy a megfigyelt jelenséget megmagyarázza. Az esetek többsé- 
gében egy minimális E magyarázatot fogunk preferálni, azaz olyan magyarázatot, 
amelynek nincs olyan megfelelő részhalmaza, amelyik szintén egy magyarázat lenne. 
Egy ATMS a , gépkocsi nem indul" problémához magyarázatokat generál azáltal, hogy 
tetszőleges sorrendben feltételezéseket tesz (mint például , benzin a tankban" vagy 
s:hibás az akkumulátor"), akkor is, ha azok egy része ellentmondásos. Elég majd a , gép- 
kocsi nem indul" állítás címkéjét megnézni, hogy az állítást igazoló feltételezések 
halmazát megismerjük. 

Az igazság-karbantartó rendszereket megvalósító algoritmusok egy kicsit komplikál- 
tak, és itt nem tárgyaljuk őket. Az igazság-karbantartási probléma komplexitása legalább 
olyan nagy, mint az ítéletlogikai következtetésé — azaz NP-teljes. Ezért nem várható el 
az, hogy az igazság-karbantartás csodaszer legyen. Ugyanakkor, ha körültekintően hasz- 
nálják, a TMS-rendszer lényegesen javíthat egy logikai rendszer komplex környezeteket 
és hipotéziseket kezelő képességén. 
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Ez a fejezet eddig a könyv legrészletesebb fejezete. Azzal, hogy sokféle tudás reprezen- 
tálásának részleteivel foglalkozunk, remélhetően érzékeltetni tudtuk az olvasóval, hogy 
hogyan hozhatók létre valódi tudásbázisok. A lényegi témák az alábbiak: 


s Nagyméretű tudásreprezentáció egy általános rendeltetésű ontológiát igényel, a spe- 
cifikus problérmnaterületek szervezéséhez és az egymással való összekapcsolásához. 

" Egy általános ontológiának a tudás széles választékát kell lefednie, és elvben képes- 
nek kell lennie bármilyen problématerület kezelésére. 

s  Bemutattunk egy felső ontológiát (upper ontology), amely a kategóriákon és az 
eseménykalkuluson alapul. Foglaikoztunk strukturált objektumokkal, az idővel és 
a térrel, a változással, folyamatokkal, szubsztanciákkal és hiedelmekkel. 

s A cselekvéseket, az eseményeket és az időt vagy szituációkalkulusban, vagy az olyan 
nagyobb kifejezőerejű reprezentációkban, mint az eseménykalkulus vagy a folyó 
esemény kalkulus fejezhetjük ki. Az ilyen reprezentációk révén egy ágens cselekvési 
terveket konstruálhat logikai következtetés segítségével. 
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s Egy ágens mentális állapotait a hiedelmeket jelentő füzérekkel lehet reprezentálni. 

s Az internetes bevásárlási problématerület részletes elemzését mutattuk be általános 
ontológia bevetésével, megmutatva, hogy egy bevásárló ágens hogyan használhatja 
a problématerületi tudását. 

" A kategóriahierarchia szervezéséhez speciális rendeltetésű rendszereket terveztek, 
mint például a szemantikus hálók (semantic nets) és a leíró logikák (description 
logics). A következtetés fontos esete az öröklődés (inheritance), mely révén az 
objektumok tulajdonságait a kategóriatagságukból ki lehet következtetni. 

s A logikai programokban a zárt világ feltételezést (closed-world assumption) imp- 
lementáljuk, hogy rengeteg neg: információ megadását elkerülhessük. A legjobb, 
ha ezt alapeseti helyzetnek tekintjük, amit további információ felülírhat. 

s A nemmonoton logikák (nonmonotonic logics). amilyen például a körülírás (cir- 
umseription) vagy az alapeseti logika (default logic), az általános alapeseti követ- 
keztetés leírására készültek. Nemmonoton következtetést a válaszhalmaz-progra- 
mozás (answer set programming) lényegesen gyorsítja, hasonlóan ahhoz, ahogy 
a WALKSAT meggyorsítja az ítéletlogikai következtetést. 

" Az igazság-karbantartó rendszerek (truth maintenance systems) hatékonyan 
kezelik a tudásfelfrissítést és a tudásrevíziót. 





Irodalmi és történeti megjegyzések 


Hihetőnek hangzik (Briggs, 1985), hogy a formális tudásreprezentáció kezdete a sásztrai 
szanszkrit nyelvtanáról alkotott klasszikus indiai elméletekkel kezdődött az i. e. első 
évezredben.!8 A nyugati világban az ókori görög matematikusok által használt definíciók 
tekinthetők a tudásreprezentáció legkorábbi megjelenésének. Tény, hogy a műszaki 
szóhasználat vagy egy mesterséges nyelv kialakítása, bármilyen területről van is szó, 
tekinthető a tudásreprezentáció egyfajta formájának. 

Az MI-ben a reprezentációkról folytatott korai viták inkább a , problémareprezentá- 
cióra", mint a , tudásreprezentációra" irányultak [lásd például a misszionáriusok és 
kannibálok problémájáról szóló Amareltől származó elemzést (Amarel, 19689]. 
Az 1970-es években az MI-ben a hangsúly a , szakértő rendszerek" (, tudásalapú rend- 
szereknek" is nevezett) fejlesztésén volt, amelyek a megfelelő problématerületi tudás 
birtokában, szűkebb definiált feladatok esetén, az emberi szakértők hatékonyságát meg- 
közelítették, vagy akár túl is szárnyalták. Az első szakértő rendszer, a DENDRAL, pél- 
dául a tömegspektrométer (a szerves vegyi anyagok struktúraelemzését segítő berende- 
zés) kimeneti adatait képes volt szakértő vegyészek szintjén interpretálni (Feigenbaum 
és társai, 1971; Lindsay és társai, 1980). Bár a DENDRAL sikere meghatározó volt abban, 
hogy az MI kutatói ráébredjenek a tudásreprezentáció fontosságára, a benne alkalmazott 
reprezentációs formalizmusok igen specifikusak voltak, és kifejezetten a vegyészeti 
problématerülethez alakították ki azokat. Idővel a kutatók a szabványosított tudásrep- 
rezentációs formalizmusok és az ontológiák felé fordultak, hogy így a korábban még fel 
nem tárt területeken alkalmazandó új szakértő rendszerek előállítási nehézségeit csök- 
kentsék. Eme kutatás révén olyan területre merészkedtek ki, amit korábban a tudo- 


18 A szanszkrit nyelv több változata közül a sásztrai szanszkrit a vallás és a tudomány nyelve. (A ford.) 
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mányfilozófusok és a nyelvészettel foglalkozó filozófusok műveltek. Az elméletek 
, Munkába" állításával az MI területén kialakult új diszciplína sokkal mélyebb és gyor- 
sabb előrehaladáshoz vezetett a korábbi időkhöz képest, amikor ezek a problémák 
kizárólag a filozófia tárgyát képezték (bár időnként előfordult a spanyolviasz ismételt 
felfedezése is). 

Átfogó taxonómiák, illetve osztályozások megalkotása az ókori időkig nyúlik vissza. 
Az osztályozási és kategorizálási sémák fontosságát nyomatékosan hangsúlyozta Arisz- 
totelész. Halála után hallgatói révén megszerkesztett Organon, amely logikai munkák 
gyűjteménye volt, tartalmazta a Kategóriák c. tanulmányt is, amelyben Arisztotelész 
megkísérelt kimerítő osztályozást adni arra, amit ma felső ontológiának nevezünk. 
Alacsonyabb szintű osztályozás céljára bevezette a faj (genus) és a fajta (species) 
fogalmakat, bár e fogalmak akkor nélkülözték a ma velük asszociált precíz és specifiku- 
san biológiai jelentést. A biológiai osztályozás mai rendszerét, beleértve a , binomiális 
nómenklatúrát" (technikai értelemben a faj-, fajtaalapú osztályozást) is, Carolus Lin- 
naeus vagy másképpen Carl von Linné (1707-1778), svéd biológus találta fel. A termé- 
szetes fajtákkal és a pontatlan kategóriahatárokkal kapcsolatos problémákkal többek 
közt Wittgenstein, Ouine, Lakoff és Schwartz foglalkozott (Wittgenstein, 1953; Ouine, 
1953; Lakoff, 1987; Schwartz, 1977). 

Az érdeklődés a nagyméretű ontológiák iránt növekszik. A CYC projekt (Lenat, 1995; 
Lenat és Guha, 1990) kapcsán egy kb. 60 000 tényt és 6000 fogalmat tartalmazó felső 
ontológiát hoztak nyilvánosságra, és egy sokkal nagyobb globális ontológiát szabadal- 
maztattak. Az IEEE létrehozta a Pl600.1 albizottságot — a Standard Upper Ontology 
Working Groupot, az Open Mind Initiative viszont több mint 7000 internetfelhasználót 
kért fel, hogy több mint 400 000 tényt vigyenek be közhasználatú fogalmakról. 
A weben alakulóban vannak az olyan standardok, mint az RDF, az XML és a szeman- 
tikus háló (Berners-Lee és társai, 2001), ámbár azokat még nem használják széles kör- 
ben. A Formal Ontology in Information Systems (FOIS) konferenciákon sok érdekes 
cikket publikálnak mind területspecifikus, mind általános ontológiákról. 

A jelen fejezetben kialakított taxonómia a szerzőktől származik, és részben azokon a 
tapasztalatokon alapul, melyeket a CYC projektből nyertek, részben Hwang, Schubert 
és Davis munkájára támaszkodva (Hwang és Schubert, 1993; Davis, 1990). Józan ész 
reprezentációs projekt inspiráló vitái Hayes The Naive Physics Manifestójában jelentek 
meg (Hayes, 1978: 1985b). 

Az időt, a változást, a cselekvéseket és az eseményeket mind az MI-ben, mind a filo- 
zőfiában és az elméleti számítástudományban intenzíven tanulmányozták. A legrégebbi 
megközelítés a temporális logika (temporal logic), ami egy speciálizált logika. ahol 
minden modell egy teljes trajektóriát ír le az (általában lineáris vagy elágazó) időben, 
a statikus relációs struktúrák helyett. A logika modális operátorokat (modal operators) 
tartalmaz, amelyeket állításokra alkalmaznak. A Op azt jelenti, hogy , p a jövőben min- 
den pillanatban igaz lesz", a Op pedig azt, hogy ,p a jövőben valamikor igaz lesz". 
A temporális logika tanulmányozását az ókori Görögországban Arisztotelész, valamint 
a Megara és a sztoikus iskola kezdeményezte. A modern időkben elsőnek Findlay vetette 
fel az időről való következtetés , formális kalkulusának" a gondolatát (Findlay, 1941), 
azonban a legnagyobb hatásúnak Arthur Prior munkássága számít (Prior, 1967). Jó tan- 
könyvek Rescher és Urguhart, valamint van Benthem munkái (Rescher és Urguhart, 
1971; van Benthem, 1983). 
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Az elméleti számítástudomány kutatói régóta érdeklődtek az iráni, hogy számítási cse- 
lekvések szekvenciájaként értelmezett programok tulajdonságait hogyan lehetne formali- 
zálni. A modális logikát számítógépes programokról való következtetésre Burstall vezet- 
te be (Burstall, 1974). Rövidesen utána Vaughan Pratt a dinamikus logikát (dynamic 
logic) dolgozta ki (Pratt, 1976), amelyben a modális operátorok programok vagy más 
cselekvések hatását jelzik (lásd még Harel, 1984). Így példáut ha dinamikus logikában 
a egy program neve, akkor , [al p" azt jelenti, hogy ,p igaz lesz a világ minden olyan 
állapotában, amely az a: programnak a jelenlegi állapotból való indításából származik". 
Az , (a) p" pedig azt jelenti, hogy , p igaz lesz a világ legalább egy olyan állapotában, amely 
az a program mostani állapotából való indításából származik". Programok konkrét elemzé- 
sére a dinamikus logikát Fischer és Ladner használta (Fischer és Ladner, 1977). Pnueli prog- 
ramokról való következtetésre klasszikus temporális logikát javasolt (Pnueli, 1977). 

A temporális logikában az időt általában a nyelv modellelméletébe ágyazzák be. 
Az MI-ben a tendencia az volt, hogy az időpontokra és az eseményekre vonatkozó 
axiómákat explicit módon a tudásbázisban írjuk fel, anélkül hogy az időnek a logikában 
valamilyen speciális státust adnánk. Az ilyen megközelítés egyes esetekben nagyobb 
rugalmasságot és áttekinthetőséget biztosít. Ráadásul az elsőrendű logikában kifejezett 
temporális logika nagyobb eséllyel integrálható az ebben a formalizmusban felhalmo- 
zott más tudásanyaggal. 

Az MI-ben az idő és a cselekvés legkorábbi kezelő apparátusa John McCarthy 
szituációkalkulusa volt (McCarthy, 1963). A 0A3 volt az első MI-rendszer, amely 
nagyban felhasználta a cselekvésre vonatkozó általános rendeltetésű elsőrendű logi- 
kai következtetést (Green, 1969b). Kowalski fejlesztette ki az állítások reifikálását 
a szituációkalkuluson belül (Kowalski, 1979b). 

A keretproblémát, mint olyant, elsőként McCarthy és Hayes ismerték fel (McCarthy 
és Hayes, 1969). Számos kutató a problémát megoldhatatlannak tartotta az elsőrendű 
logikán belül, és ez intenzív kutatáshoz vezetett a nemmonoton logikák irányába. A fi- 
lozófusok Dreyfustól (Dreyfus, 1972) Crockettig (Crockett, 1994) a keretproblémát az 
egész MI-vállalkozás szükségszerű kudarca egyik tünetének tartották. A reprezentáci- 
ós keretprobléma részleges megoldása követő-állapot axiómák segítségével Ray 
Reitertől származik (Reiter, 1991). A következtetési keretprobléma megoldása Holl- 
dobler és Schneeberger munkájára vezethető vissza (Holldobler és Schneeberger, 
1990), amit most folyó esemény kalkulusnak nevezünk (Thielscher, 1999). Jelen feje- 
zetben bemutatott elemzés Lin és Reiter, valamint Thielscher elemzésein alapul (Lin 
és Reiter, 1997; Thielscher, 1999). A szituációkalkulusban a cselekvésről való követ- 
keztetés teljes. korszerű tárgyalását Shanahan és Reiter könyvei adják (Shanahan, 
1997; Reiter, 2001b). 

A keretprobléma részleges megoldásával újra fellángolt az érdeklődés a cselekvések- 
ről való következtetés deklaratív megközelítései iránt, amelyeket az 1970-es évek elejé- 
től a speciális tervkészítő rendszerek háttérbe szorítottak (lásd 11. fejezet). A kognitív 
robotika (cognitve robotics) zászlaja alatt lényeges előrehaladás történt az idő és a cse- 
lekvés logikai reprezentációja terén. A GOLOG programozási nyelv a cselekvések és a 
tervek kifejezésére a logikai programozás teljes kifejező erejét felhasználja (Levesgue 
és társai, 1997a). A nyelvet a parallel cselekvések (Giacomo és társai, 2000), a szto- 
chasztikus környezetek (Boutilier és társai, 2000) és az érzékelés (Reiter, 2001a) keze- 
lésére is kiterjesztették. 
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Az eseménykalkulust Kowalski és Sergot vezették be folytonos idő kezelésésre 
(Kowalski és Sergot, 1986). Ennek számos változata is született (Sadri és Kowalski, 
1995). Shanahan ad róla egy jó és rövid áttekintést (Shanahan, 1999). Ugyanerre a cél- 
ra James Allen vezette be az időintervellumokat (Allen 1983, 1984) azzal érvelve, hogy 
azok a szituációknál természetesebb eszközt jelentenek a kiterjedő és a konkurrens ese- 
mények leírására. Peter Ladkin , konkáv" időintervallumokat (intervallumok szakadá- 
sokkal, lényegében a közönséges , konvex" időintervallumok uniói) vezetett be, és az 
időreprezentációhoz alkalmazta a matematikai absztrakt algebra módszertanát (Ladkin, 
1986a; Ladkin, 1986b). Allen szisztematikusan vizsgálta az idő reprezentálásához ma 
hozzáférhető technikák széles választékát (Allen, 1991). Shoham leírta az események 
reifikációját, és e célból egy új sémát vezetett be (Shoham, 1987). Lényeges egybeesés 
lelhető fel az e fejezetben említett eseményalapú ontológia és Donald Davidson filozófus 
eseményelemzése között (Davidson, 1980). Hasonló jellegű a folyadékok Pat Hayestől 
származó ontológiája is (Hayes, 1985a). 

A szubsztanciák ontológiai státusának kérdése hosszú történet. Platón szerint a 
szubsztanciák a fizikai objektumoktól teljesen eltérő absztrakt entitások. A Vajz € Vaj 
helyett ő inkább BólVan(Vajz, Vaj)-at mondana. Ez elvezet a szubsztanciák egy olyan 
hierarchiájához, ahol pétdául SózatlanVaj a Vaj-nál specifikusabb szubsztancia. A jelen 
fejezetben elfogadott álláspontot, miszerint a szubsztanciák objektumok kategóriái, 
Richard Montague vette védelmébe (Montague, 1973). Ezt az álláspontot a CYC projekt- 
ben is elfogadták. Ezzel szemben egy komoly, ám nem kivédhetetlen támadást intézett 
Copeland (Copeland, 1993). A fejezetben említett alternatív megközelítést, ahol a vaj egy 
egyedi objektum, ami az univerzum összes vajszerű objektumából áll, eredetileg Le$- 
niewski lengyel logikus javasolta (Lesniewski, 1916). Mereotógiája (mereology) (a név 
a rész" görög nevéből származik) a rész-egész relációt matematikai halmazelmélet he- 
lyettesítésére használja a célból, hogy az olyan absztrakt entításokat, mint a halmazok, 
eltüntesse. A mereológia olvashatóbb változatát Goodman és Leonard adták (Leonard 
és Goodman, 1940). Goodman The Structure of Appearance c. művében ezeket az öt- 
leteket különböző problémák megoldására alkalmazza a tudásreprezentációk területén 
(Goodman, 1977). Bár a mereologikus megközelítés néhány aspektusa nehézkes — pél- 
dául a rész-egész reláción alapuló külön öröklődési mechanizmusra van szükség —, a meg- 
közelítést Ouine is támogatja (Ouine, 1960). A tudásreprezentációban való használatának 
kimerítő elemzését Harry Bunt adta meg (Bunt. 1985). 

A mentális objektumokat és állapotokat a filozófiában és az MI-ben is intenzíven 
tanulmányozták. A filozófiában a modális logika (modal logic) a tudásról való követ- 
keztetés klasszikus eszköze. Modális logika az elsőrendű logikát bizonyos modális ope- 
rátorokkal, mint a B (hisz, believes) és a K (tud, knows) kiterjeszti, ezek az operátorok 
nem a termekre, hanem az állításokra vonatkoznak. A modális logika bizonyításetmé- 
lete a behelyettesítést a modális kontextusra korlátozza, és így referenciális átláthatat- 
lansághoz vezet. A tudás modális logikáját Jaakko Hintikka találta fel (Hintikka, 1962). 
A modális logika szemantikáját Saul Kripke definiálta lehetséges világok (possible 
worlds) segítségével (Kripke, 1963). Durván fogalmazva egy világ lehetséges egy 
ágens részére, ha konzisztens mindazzal, amiről az ágensnek tudomása van. Ebből már 
meg lehet fogalmazni a K operátorra vonatkozó következtetési szabályokat. Robert C. 
Moore (Moore, 1980; 1985a) kapcsolatba hozza tudás modális logikáját azzal a következ- 
tetési stílussak, amely az elsőrendű logikában közvetlen módon a lehetséges világokra 
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hivatkozik. A modális logika ijesztően titokzatos terület lehet, azonban elosztott számító- 
gépes rendszereknél az információról való következtetést illetően jelentős alkalmazásra 
talált. A modális megközelítéshez részletes bevezetőt Fagin Reasoning about Know- 
ledge c. könyve ad (Fagin, 1995). A kétévente megrendezett Theoretical Aspects of. 
Reasoning About Knowledge (TARK) konferenciák mutatják be a tudáselmélet alkalma- 
zását az MI-ben, a gazdasági tudományokban és az elosztott rendszerekben. 

A mentális objekumok szintaktikai elméletét részletesen először Kaplan és Mon- 
tague tanulmányozták, akik megmutatták, hogy az elmélet, megfelelő elővigyázatosság 
hiányában, paradoxonokhoz vezet (Kaplan és Montague, 1960). Mivel ez a hiedelmeket 
egy fizikai rendszer konfigurációival kapcsolja össze, és ehhez rendelkezik egy termé- 
szetes modellel egy emberi agy vagy egy számítógép formájában, ez az elmélet az MI 
területén az utóbbi években igen népszerű volt. Az elméletet korlátos hatékonyságú 
következtető gépek leírására Konolige és Haas használta, Morgenstern viszont megmu- 
tatta, hogyan használható előfeltételek ábrázolására tervkészítés esetén (Konolige, 1982; 
Haas, 1986; Morgenstern, 1987). A megfigyelési cselekvések tervezésének a 13. fejezet- 
ben található módszerei szintaktikai elméleten alapulnak. A tudás szintaktikai és modális 
elméleteinek kiváló összehasonlítása található a (Davis, 1990)-ben. 

Arisztotelész Kategóriák c. művéhez kommentárt fűzve Porfiriusz görög filozófus 
(kb. i. e. 234-305) rajzolt fel valamit, amit első szemantikus hálónak lehetne minősíte- 
ni. Charles S. Peirce korszerű logikára alapozva egzisztenciális gráfokat fejlesztett ki, 
mintegy kifejlesztve az első modern logikát használó szemantikus háló formalizmusát 
(Peirce, 1909). Az MI-n belül a szemantikus hálók kutatását Ross Ouillian kezdemé- 
nyezte (Ouillian, 1961), a nyelvfeldolgozás és az emberi memória iránti érdeklődéséből ki- 
indulva. Marvin Minsky nagy hatású cikkében a szemantikus hálók kereteknek (frames) 
nevezett változatát mutatta be (Minsky, 1975). A keret egy objektum vagy egy kategória 
reprezentációja más objektumokkal vagy kategóriákkal képzett relációival. Bár a cíkk 
érdeklődést keltett magának a tudásreprezentációnak a területe iránt, mégis kritizálták, 
hogy a Minsky cikkét megelőző objektumorientált programozás eszközeit, illetve az 
öröklödés és az alapértelmezett értékek használatát újból felkínálja (Dahl és társai, 
1970; Birtwistle és társai, 1973). Nem világos, hogy az objektumorientált programozás- 
ról szóló későbbi cikkeket - viszonzásképpen - mennyire befolyásolta a szemantikus 
hálókkal kapcsolatos korai munka. 

A szemantika kérdése kül sen élesen merül fel Ouillan szemantikus hálójával kap- 
csolatban (és mindazokkal kapcsolatban, akik Ouillan megközelítését követték), a sze- 
mantikus hálóban mindeniitt jelen levő és nagyon bizonytalan ,ISA-kapcsolatok", 
valamint egyéb korai tudásreprezentációs formalizmusok — mint amilyenek MERLIN 
(Moore és Newell, 1973) misztikus , lapos" és , fedi" operációi — miatt. Az MI-kutatók 
figyelmét Woods híres What"s in a Link? c. cikke irányította a precíz szemantika kiala- 
kításának szükségességére a tudásreprezentációs formalizmusban (Woods, 1975). Brach- 
man dolgozta fel ezt a témát és a problémára megoldásokat is javasolt (Brachman, 1979). 
Patrick Hayes The Logic of Frames c. cikke még mélyebbre vágott azt állítva, hogy , a ke- 
ret formalizmusának többsége nem más, mint egy új szintaktika az elsőrendű logika egy 
részére" (Hayes. 1979). Drew McDermott farskian Semantics, or, No Notation Without 
Denoration! c. cikkében amellett érvelt, hogy az elsőrendű logika modellalapú szeman- 
tikáját kell alkalmazni mindenféle tudásreprezentációs formalizmus esetében (McDermott, 
1978b). Ez vitatott kérdés maradt. Megemlítendő, hogy McDermott maga is felülvizsgálta 
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álláspontját A Critigue of Pure Reason (McDermott, 1987) c. cikkében. A NETL (Fahl- 
man, 1979) egy kifinomult szemantikus háló rendszer volt, melynek ISA-kapcsolatai 
(amit virtuális másolásnak — virtual copy —, azaz VC-kapcsolatnak hívtak) sokkal inkább 
a keretrendszerek vagy az objektumorientált programozási nyelvek ,öröklődés" jellem- 
vonásának jelölésén alapult, mint a részhalmazkapcsolaton, és sokkal pontosabban volt 
definiálva, mint Ouillian kapcsolatai a Woods előtti időkből. A NETL különösen érdekes, 
mivel párhuzamos hardveren szándékoztak megvalósítani, hogy így leküzdhessék a nagy 
szemantikus hálókból történő információ-visszakeresés problémáját. David Touretzky az 
öröklődést rigorózus matematikai analízisnek vetette alá (Touretzky, 1986). Selman és 
Levesgue a kivételekkel kiegészített öröklődés komplexitását taglalja, megmutatva, hogy 
ez a legtöbb formalizmusban NP-teljes (Selman és Levesgue, 1993). 

A leíró logikák fejlődése csupán egy hosszú kutatási folyamat jelenlegi állása, mely 
az elsőrendű logika olyan használható részhalmazainak megtalálását célozza, melyekre 
a következtetés számítástechnikai alapon kezelhető. Hector Levesgue és Ron Brachman 
megmutatták, hogy bizonyos logikai konstrukciók, például a diszjunkció és a negálás 
bizonyos használata felelős elsődlegesen a logikai következtetés kezelhetetlenségéért 
(LLevesgue és Brachman, 1987). A KL-ONE rendszerre (Schmolze és Lipkis, 1983) ala- 
pozva számos olyan rendszert fejlesztettek ki, melyek tervezése magában foglalta az 
elméleti komplexitásanalízis eredményeit. Leginkább említésre méltó ilyen rendszerek 
a KRYPTON (Brachman és társai, 1983) és a CLAsSIc (Borgida és társai, 1989). Az ered- 
mény a következtetés sebességének lényeges növekedése lett, és a következtető rend- 
szerek komplexitása és kifejezőkészsége közötti hatások sokkal jobb megismerése. 
A kutatások állását Calvanese foglalta össze (Calvanese és társai, 1999). Más részről, 
ahogy Doyle és Patil érvelnek, egy nyelv kifejezőkészségének korlátozása vagy lehe- 
tetlenné teszi bizonyos problémák megoldását, vagy a nyelv nem logikai eszközökkel 
történő kitágítására ösztönöz (Doyle és Patil, 1991). 

A nemmonoton következtetés mind a három fő formalizmusát — a körülírást 
(McCarthy, 1980), az alapértelmezett logikát (Reiter, 1980) és a modális nemmonoton 
logikát (McDermott és Doyle, 1980) — az AZ Journal egyetlen különszámában publikál- 
ták. A válaszhalmaz-programozást a negálás mint kudarc kiterjesztésének vagy a körül- 
írás finomításának lehet nézni. A mögötte lévő stabil modell szemantikát Gelfond és 
Lifschitz vezették be (Gelfond és Lifschitz, 1988). A vezető válaszhalmaz-programozási 
rendszerek a DVL (Eiter és társai, 1998) és SMODELS (Niemelá és társai, 2000). A diszk- 
meghajtó példa a SMODELS felhasználói kézikönyvéből származik (Syrjánen, 2000). 
A válaszhalmazprogramozás használatát a tervkészítés számára Lifschitz tárgyalja 
(Lifschitz, 2001). A nemmonoton logika különböző megközelítéseiről jó áttekintést ad 
Brewka (Brewka és társai, 1997). A logikai programozás negálás mint kudarc megköze- 
lítésével és a Clark-lezárással Clark foglalkozik (Clark, 1978). Van Emden és Kowalski 
azt mutatták ki, hogy minden negálás nélküli Prolog programnak létezik egyértelmű 
minimálmodellje. Az utóbbi években tanúi lehetünk, ahogy növekszik az érdeklődés a 
nemmonoton logika nagyméretű tudásreprezentációs rendszerekben való alkalmazása 
iránt. Egy nemmonoton öröklődési rendszer első sikeres kereskedelmi alkalmazása talán 
a BENINO rendszereké volt a biztosítási feltételek megtudakolásához (Morgenstern, 
1998). A Logic Programming and Nonmonoton Reasoning (LPNMR) konferenciák kiad- 
ványai sok különböző, logikai programozáson alapuló nemmonoton következtető rend- 
szerről számolnak be. 
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Az igazság-karbantartó rendszerek tanulmányozása TMS (Doyle, 1979) és RUP 
rendszerekkel (McAllester, 1980) kezdődött, mindkettő alapvetően JTMS-rendszer 
volt. Az ATMS megközelítést Johan de Kleer cikkeinek sorozata írta le (De Kleer, 
1986c; 1986a; I986b). A Building Problem Solvers (Forbus és De Kleer, 1993) részle- 
tesen elmagyarázza, hogyan használhatók a TMS-ek MI-alkalmazásokban. Nayak és 
Williams megmutatják, hogy egy hatékony TMS hogyan teszi lehetővé, hogy a NASA- 
űrhajók műveleteit valós időben megtervezhessük (Nayak és Williams, 1997). 

Nyilvánvaló okoknál fogva a jelen fejezet a tudásreprezentáció minden területével 
elmélyülten nem foglalkozik. A három fő kihagyott témakör az alábbi: 


s Kvalitatív fizika (gualitative physics): A tudásreprezentáció egy olyan részterüle- 
te, amely speciálisan a fizikai objektumok és folyamatok logikai nemnumerikus 
elméletének megkonstruálásával foglalkozik. A kvalitatív fizika elnevezést Johan de 
Kleer alkotta meg (de Kleer, 1975), bár állítható, hogy a kutatás Fahlman BUnD 
rendszerével indult meg (Fahlman, 1974). A Bunp egy komplex tervkészítő rend- 
szer volt, bonyolult kockatornyok építéséhez. Fejlesztése során Fahlman észrevette, 
hogy az erőfeszítések zöme (becslése szerint 8096-a) nem magára a tervkészítésre 
fordítódott, hanem a különböző kocka részstruktúrák stabilitásának eldöntésére. 
Fahiman egy hipotetikus naiv fizikai jellegű folyamatot vázol, hogy megmagyaráz- 
za, miért képesek a kisgyerekek BurLD-szerű problémákat megoldani a BUILD-del 
végzett fizikai modellezésnél használt, nagy sebességű lebegőpontos aritmetika nél- 
kül. Hayes a , történetek" — a tér-idő 4-dimenziójú, Davidson eseményeire hasonlító 
szeletei — felhasználásával megalkotja a folyadékok igen bonyolult naiv fizikáját 
(Hayes, 1985a). Hayes volt az első, aki bebizonyította, hogy ha egy csapból folya- 
matosan folyik a víz, miközben a lefolyót bedugaszoljuk, a kád végül túlcsordul, és 
azt is, hogy aki beleesik a tóba, az teljesen elázik. De Kleer és Brown, valamint Ken 
Forbus megkísérelték a világ egyfajta, a fizikai egyenletek kvalitatív absztrakcióján 
alapuló általános rendeltetésű elméletének a felállítását (De Kleer és Brown, 1985; 
Forbus, 1985). Az utóbbi időben a kvalitatív fizika eljutott addig a pontig, ahol már 
lehetséges a komplex fizikai rendszerek széles választékának az elemzése (Sacks es 
Joskowicz, 1993; Yip, 1991). Kvalitatív technikákat használtak teljesen új tervezé- 
sű órák, szélvédőtörlők és hatlábú sétálórobotok megkonstruálásához ís (Sub- 
ramanian, 1993; Subramanian és Wang, 1994). A területhez jó bevezető olvasmány 
a Readings in Oualitative Reasoning about Physical Systems c. gyűjtemény (Weld 
és De Kleer, 1990). 

" Térbeli következtetés (spatial reasoning): A wumpus és a bevásárló világban 
a navigáláshoz szükséges következtetés triviális a valódi világ gazdag térbeli struk- 
túrájához képest. A térről történő józan ész következtetés legteljesebb kísérlete Ernest 
Davis (Davis, 1986; 1990) munkájában található. Cohn régiókapcsolódási kalkulusa 
(Cohn és társai, 1997) az alapja az egyfajta kvalitatív térbeli következtetésnek, ami el- 
vezetett a földrajzi információs rendszerek új fajtáihoz. A kvalitatív fizikához hason- 
lóan, úgy tűnik, hogy egy ágens sokáig elboldogul egy teljes metrikus reprezentáció 
használata nélkül. Ha egy ilyen reprezentációra van szükség, használhatók a roboti- 
kában kifejlesztett megoldások (lásd 25. fejezet). 

" Pszichológiai következtetés (psychological reasoning): A pszichológiai következ- 
tetés magában foglalja egy működőképes pszichológia kifejlesztését a mesterséges 


10.9. ÖSSZEFOGLALÁS 441 


ágensek számára, hogy az ágensek képesek legyenek saját magukra és más ágensekre 
vonatkozó következtetéseket meghozni. Ennek gyakran az ún. , népi pszichológia" 
( folk psychology") az alapja, amely egy olyan elmélet, amiről azt gondoljuk, hogy az 
emberek saját maguk és mások megítélésében használják. Amikor az MI-kutatók mes- 
terséges ágenseiket más ágensekre vonatkozó következtetést támogató pszichológiai 
elméletekkel látják el, ezen elméletek alapja gyakran a logikai ágens rendszertervének 
a kutató által megfogalmazott leírása. A pszichológiai következtetés Pillanatnyilag a 
természetes nyelv megértésének kontextusán belül a leghasznosabb, ahol elsődleges 
fontosságú a beszélő intencióját megjósolni. 


Az ezen a területen folyó munkák legfrissebb forrását a Principles of Knowledge 
Representation and Reasoning nemzetközi konferenciák kiadványai jelentik. A Readings 
in Knowledge Representation (Brachman és Levesgue, 1985) és a Formal Theories ofthe 
Commonsense World (Hobbs és Moore, 1985) a tudásreprezentáció kiváló antológiái. 
Az előbbi a reprezentációs nyelvek és formalizmusok történelmileg fontos publikációira 
összpontosít, az utóbbi pedig magának a tudásnak az akkumulálására helyezi a hang- 
súlyt. Davis, Stefik és Sowa könyvei jó bevezető munkák a tudásreprezentációkhoz 
(Davis, 1990; Stefik, 1995; Sowa, 1999). 


Feladatok 


I0.1. Írja fel a wumpusvilág-beli Lőj cselekvés hatását leíró állításokat. Írja le a wum- 
Pusra kifejtett hatását, és ne felejtse, hogy a lövéshez az ágensnek nyílra van 
szüksége. 


10.2. A szituációkalkuluson belül fogalmazzon meg egy olyan axiómát, amelyben a 
0. időpillanatot az $g szituációval kapcsolja össze, valamint egy olyan másik 
axiómát, ahol a r időpillanatot az §g-ból a ( számú cselekvés szekvenciájával elő- 
állított szituációval kapcsolja össze. 


10.3. Ebben a feladatban egy út megtervezésével foglalkozunk egy robot számára, két 
város között. A robot alapcselekvése a Megy(x, y), mely révén az x városból az y 
városba kerül át, ha a két város között létezik közvetlen út. A KözvetlenÚtx, y) 
akkor és csak akkor igaz, ha az x és az y között létezik egy közvetlen útszakasz. Fel- 
tételezhetjük, hogy az ilyen tények a rendszer tudásbázisába már bekerültek (lásd 
a 102. oldalon lévő térképet). A robot Aradnál kezd, és Bukarestet kel! elérnie. 
(a) Adja meg robot kezdő állapotának egy alkalmas logikai leírását. 

(b) Írjon fel egy alkalmas logikai kérdést, amelynek megoldásai megadják a 
célhoz vezető lehetséges utakat. 

(0) Írja fel a Megy cselekvést leíró logikai állítást. 

(d) Tegyük most fel, hogy két város között a közvetlen út követése a közvetlen út 
hosszával arányos üzemanyag-fogyasztást jelent. A robot teli tankkal indul. 
Bővítse reprezentációját, hogy ezek a szempontok helyet kapjanak benne. 
A cselekvés leírásának olyannak kell lennie, hogy az előbb megfogalmazott 
kérdés megválaszolásának továbbra is a lehetséges terveket kell megadnia. 
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(e) Írja le a kezdeti szituációt, és adja meg a Megy cselekvést leíró új szabályt, 
illetve szabályokat. 

(0) Tegyük most fel, hogy a csomópontok némelyike benzinkút is egyben, ahol 
a robot az üzemanyagtankját teletöltheti. Bővítse ennek megfelelően a rep- 
rezentációját, és írja fel a benzinkutak leírásához szükséges új szabályokat, 
a TeleTölt cselekvést is beleértve. 


Vizsgálja meg annak a lehetőségét, hogy az eseménykalkulust az egyidejű ese- 
mények kezelésével bővíthesse. Elkerülhető-e az axiómák kombinatorikus rob- 
banása? 


A fejezetben kifejlesztett reprezentációt felhasználva és kiterjesztve adja meg az 
alábbi hat állítás reprezentációját. 

(a) 0"C és 100 "€ között cseppfolyós a víz. 

(b) A víz 100 "C-nál forr fel. 

(c) János palackjában megfagyott a víz. 

(d) Az ásványvíz egyfajta víz. 

(e) János palackjában ásványvíz van. 

(?) Minden folyadéknak van fagyási pontja. 

(g) Egy liter víz súlya több, mint egy liter alkohol súlya. 

Ismételje meg a feladatot mereológiai megközelítésen alapuló reprezentációt 
felhasználva, amelyben például a Víz egy objektum, amely a világ minden vizét. 
mint az objektum részét tartalmazza. 


Írja fel a: 

(a)  KimerítőRészFelosztás 

(b) RészPartíció 

(c)  PáronkéntKölcsönösenKizáró 

definícióját a KimerítőF elosztás, a Partíció és a KölcsönösenKizáró definíciójával 
analóg módon. Igaz-e, hogy RészPartíció(s, Kötege(s))? Ha igen, bizonyítsa be, ha 
nem, adjon meg egy ellenpéldát, és definiáljon elégséges feltételeket, amelyek 
mellett igaz lesz. 


Írjon fel egy olyan állításhalmazt, amely lehetővé teszi a különálló paradicsomok 
(vagy más objektumok) ármegállapítását, ha adott a kilónkénti ár. Az elmélet kiter- 
jesztésével tegye lehetővé egy zacskó paradicsom árának a kiszámítását. 


Mértékeket reprezentáló alternatív sémában az egységfüggvényeket egy abszt- 
rakt hosszúság objektumra alkalmazzuk. Az ilyen sémában azt lehetne írni, 
hogy: Centiméterek(HossztL)) z 15. Hogyan viszonyul ez a séma a fejezetbeli- 
hez? A szempontok többek között az átváltási axiómák, az absztrakt mennyisé- 
gek elnevezései (mint például ..ezer forint") és az eltérő egységekben kifejezett 
absztrakt mérések összehasonlítása (50 hüvelyk több, mint 50 cm). 


Konstruáljon a valuták átváltási árfolyamára egy olyan reprezentációt, amely lehető- 
vé teszi a napi fluktuációk figyelembevételét. 
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10.11. 
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Ebben a feladatban az eseménykategóriák és azon időintervallumok közötti relá- 

ciókkal foglalkozunk, amelyekben az események megtörténnek. 

(a) Definiálja a 7(c, i) predikátumot a Közben és a € segítségével. 

(b) Adja meg a precíz magyarázatát annak, hogy a konjunktív eseménykategó- 
ria leírásánál miért nincs szükség a kétféle jelölésmódra. 

(c) Adja meg a KEgyik(p, a), i) és a T(VagyVagy(p, a), i) formális definícióját. 

(d) Magyarázza meg, miért értelmes a kétfajta diszjunkcióval analóg módon az 
események kétfajta negálásával rendelkezni. Nem-nek és Sohasem-nek ne- 
vezze el őket, és adja meg a formális definíciójukat. 


Definiálja a Rögzített predikátumot, ahol a Rögzíter(Helyetx)) azt jelenti, hogy 
az x objektum helye az időben rögzített. 


Definiálja az Előtte, az Utána, a Közben és az Átlapolódik predikátumokat 
a Találkozik predikátum és a Kezdet és a Vég függvények segítségével, de az Idő 
függvény és a c predikátum nélkül. 


A 10.5. alfejezetben a Link és a LinkSzöveg predikátumokat használjuk webla- 
pok közötti kapcsolat leírására. Többek közt a Címkében és a VeddElőLapot 
predikátumok felhasználásával írja fel a Link és a LinkSzöveg definícióit. 


A vásárlási folyamat egyik része, amivel e fejezetben nem foglalkoztunk, az 
egyes tételek közötti kompatibilitás ellenőrzése. Ha a kliens például egy számí- 
tógépet rendel, illeszkedik-e az a megfelelő perifériákhoz? Ha digitális kamerát 
rendel, megvan-e a hozzá való memóriakártya és szárazelem? Írjon fel egy olyan 
tudásbázist, amely eldönti, hogy a tételek adott halmaza kompatibilis-e. És ezt a 
tudásbázist fel lehessen használni cserékre, illetve további tételek vásárlására 
vonatkozó javaslatok generálására, ha mégsem lennének kompatibilisek. Bizo- 
nyosodjon meg arról, hogy a tudásbázis legalább a termékek egy körével jól mű- 
ködik, és könnyen terjeszthető ki másokra is. 


Adjon szabályokat a Név(s, c) predikátum definíciójának olyan esetekre történő 
kiterjesztéséhez, hogy az olyan füzérek, mint például a ,.laptop számítógép" 
több bolthoz tartozó idevágó kategórianévre illeszkedjen. Kíséreljen meg álta- 
lános érvényű definíciót alkotni. A definíciót tesztelje tíz online boltra és az 
általuk három kategóriára használt elnevezésekre. A laptop kategória esetén pél- 
dául a , Notebooks", , Laptops", Notebook számítógépek", , Notebook", , Note- 
books és Laptops" és . Notebook PC" neveket találtuk. Az egyes elnevezéseket 
explicit Név tényekkel, mások a többes számot, a konjunkciót stb. kezelő szabá- 
lyokkal lefedhetők. 


A vásárló vásárlásleírására vonatkozó pontatlan illeszkedés teljes megoldása na- 
gyon nehéz, és szükségessé teszi a természetes nyelvfeldolgozási és információ- 
kinyerési technikák egész sorát (iásd 22. és 23. fejezet). Egy kis lépés megengedni 
a felhasználónak, hogy a különböző attribútumok minimális és maximális értékeit 
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határozhassa meg. Megköveteljük, hogy a vásárló a termékek leírásához az alábbi 
nyelvtant vegye igénybe: 


Leírás — Kategória [Kapcsolat Módosítój" 
Kapcsolat a warteést 
Módosító — Attribútumláttrribútum Op Érték 
Op aho 


Itt a Kategória a termék kategóriája, az Artribútum a termék valamilyen tulajdon- 
sága, mint például , CPU" vagy ,ár", és az Érték egy konkrét termék attribútu- 
mának az értéke. A , számítógép. min 2.5 GHz CPU, 250 000 Ft alatt" lekérdezést 
tehát úgy kell kifejezni, hogy , számítógép, CPU 5 2.5 GHz és ár c 250 000 FC. 
Implementálja az ilyen nyelven megfogalmazott termékleírásokat elfogadó bevá- 
sárló ágenst. 


Az internetes bevásárlásról szóló leírásunk nélkülözte az alapvető fontosságú 
lépést — a termék tényleges megvásárlását. Adja meg a vásárlás formális logi- 
kai leírását eseménykalkulusra támaszkodva. Azaz definiálja az események 
olyan sorozatát, amelyek megtörténnek. ha a vásárló hitelkártyával fizet, és 
végül sor kerül a számlázásra és az áru leszállítására. 


Írja le a valamit valamiért kereskedés eseményét. A vásárlást egyfajta kereske- 
désként írja le, ahol a kereskedésben az egyik részt vevő termék a pénz. 


A két megelőző feladatban a tulajdonviszony igen egyszerű fogalmát használtuk. 
A vásárló például úgy indul, hogy a forint bankjegyek már a tulajdonában vannak. 
A modell kezd szétesni, ha például a pénze bankban van, hiszen ilyenkor sem- 
milyen konkrét bankjegymennyiség nincs, amiről ki lehetne jelenteni, hogy a 
tulajdonában van. A helyzetet a kölcsön, a bérlés, a haszonbérlés és a letétbe 
helyezés még tovább bonyolítja. Vizsgálja meg a tulajdonviszony józan ész és 
jogi koncepcióit, és javasoljon egy olyan sémát, amelyben ezek formálisan kife- 
jezhetők. 


A feladata egy tanácsadó rendszer kifejlesztése, amely az informatika szak hall- 
gatóinak ajánlaná, hogy milyen tárgyakat válasszanak a képzés feltételeinek tel- 
jesítéséhez (az intézményére jellemző feltételekkel dolgozzon). Először döntse 
el, hogy az összes információ reprezentálásához milyen szókészletet fog hasz- 
nálni, majd végezze el a reprezentáció építését. Megfelelő kérdésekkel érje el, 
hogy a rendszer egy legális képzési programot adjon vissza. A rendszernek az 
egyes hallgatók igényeihez kell illeszkednie, például a fakultatív tárgyak javas- 
latánál. 

Javasoljon módszereket a rendszer tökéletesítésére, felhasználva például a 
hallgatói preferenciákra, a terhelésre, a jófrossz előadókra vonatkozó informá- 
ciókat. Minden egyes tudásfajta esetén magyarázza meg, hogy hogyan lehetne azt 
logikailag kifejezni. Könnyen be tudná-e a rendszere fogadni ezt az információt 
úgy, hogy egy hallgató részére a fegjobb képzési programot ajánlja fel? 
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A 10.I. ábra a dolgok hierarchiájának felső szintjeit mutatja. Terjessze ki az áb- 
rát úgy, hogy a lehető legtöbb valódi kategóriát tartalmazzon. Erre jó módszer, 
ha a mindennapi életével kapcsolatos minden dolgot leír. Ez objektumokat és 
eseményeket fog magában foglalni. Kezdje a reggeli felkeléssel, rendszeresen 
haladjon tovább, megfigyelve, hogy mit érint, mit csinál, mire gondol. Egy vélet- 
len mintavétel eredménye lehetne például a következő: zene, hírek, tej, séta, 
kocsivezetés, benzin, Skála, szőnyeg. beszélgetés, Kovács tanár úr, csirkepör- 
költ, nyelv, 150 Ft, napi újságok stb. 

EI kellene készíteni egy egységes hierarchiafát (egy nagy papírlapon) és egy 
listát az objektumokról és a kategóriákról, az egyes kategóriaegyedek által 
kielégített egy vagy több relációval együtt. Mindegyik objektumnak egy kategó- 
riához kell tartoznia, és minden kategóriának a hierarchia részének kell lennie. 


(Doug Lenat egy példájának adaptációja.) A feladat az, hogy elegendő, logikai 
formában kifejezett kapcsolódó tudást gyűjtsön össze, hogy az alábbi egyszerű 
mondatra vonatkozó kérdéssort meg tudja válaszolni: 


"Tegnap János a Skálába ment, és vett két kiló paradicsomot és fél kiló darált húst. 


Kezdje azzal, hogy a mondat tartalmát egy sor kijelentéssel reprezentálja. Át- 
tekinthető logikai struktúrájú állításokat kell írnia (például állítások arról, hogy 
az objektumoknak bizonyos tulajdonságai vannak, hogy az objektumok bizonyos 
relációban vannak egymással, és hogy egy adott tulajdonságot teljesítő minden 
objektum egy másik tulajdonsággal is rendelkezik). Az alábbiak feltehetően se- 
gítségére lesznek: 


s Milyen osztályokra, egyedekre, relációkra stb. lesz szüksége? Mik ezeknek a 
szuper- és alosztályai? (Többek közt eseményekre és időrendi rendezésre is 
szüksége lesz.) 

" — Milyen módon lehetnének ezek a részei egy általánosabb hierarchiának? 

, — Milyenek a közöttük lévő kényszerek és relációk? 

s — Mennyire részletesen kell leírni az egyes fogalmakat? 


A megkonstruálandó tudásbázisnak képesnek kell lennie a továbbiakban közölt 
kérdéslistát megválaszolni. A kérdések közül néhány közvetlenül magával a tör- 
ténettel foglalkozik, de a többségük a háttértudást — a sorok közötti olvasást — 
igényli. Foglalkozni kell azzal, hogy milyen dolgokat lehet egy bevásárlóköz- 
pontban vásárolni, hogy a kiválasztott tételek vásárlásánál mi történik, hogy mi 
a vásárolt tételek rendeltetése stb. Kísérelje meg a reprezentációját a lehető a 
legáltalánosabbra kialakítani. Egy triviális példával szemlélve, ne azt állítsa, 
hogy , Az emberek a Skálában ennivalót vásárolnak", mert ez nem segít azok 
kezelésében, akik máshol szoktak vásárolni. Ne azt állítsa. hogy , János darált 
hússal és paradicsommal spagettit készített", mert ez semmilyen más dolog ke- 
zelésében nem segít. Ne rejtsen válaszokat a kérdésekbe, a (c) kérdés például 
azt kérdezi, hogy , Vásárolt János húst?", és nem azt, hogy , Vásárolt-e János 
fél kiló darált húst?". 

Adja meg a kérdéseket megválaszoló következtetés sémáját. Ennek során 
minden bizonnyal új fogalmakat is kell kreálnia és új állításokat kell megfogal- 
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maznia stb. Ha lehetséges, használjon egy logikai következtető rendszert, hogy 

kimutassa a tudásbázis elégségességét. Sok dolog, amit leír, a valóságban csak 

közelítőleg lesz igaz. Ne törődjön ezzel túl sokat, a cél azt a józan ész tudást ki- 

nyerni, ami a kérdések megválaszolását egyáltalán lehetségessé teszi. E kérdés- 

kör igazán teljes megválaszolása rendkívül nehéz, valószínűleg meg is haladja a 

mai tudásreprezentációk lehetőségeit. 

(a) János gyerek vagy felnőtt? [Felnőtt] 

(b) Van Jánosnak most legalább 2 db paradicsoma? [Igen] 

(c) Vásárolt János húst? (Igen] 

(d) Látta-e János Marit, ha Mari ugyanabban az időben vásárolt paradicsomot? 
[Igen] 

(e) A paradicsomot a bevásárlóközpontban készítik-e? [Nem] 

(f) Mit fog csinálni János a paradicsommal? [Megeszi] 

(g) Kapható-e a Skálában dezodor? [Igen] 

(h)  Hozott-e János magával elég pénzt a bevásárlóközpontba? (Igen] 

(i) A vásárlást követően kevesebb pénze van-e Jánosnak? (Igen] 


Az előbbi példa tudásbázisához készítsen szükséges bővítéseket/módosításokat 

úgy, hogy megválaszolhatók legyenek az alábbi kérdések. Mutassa ki, hogy a 

tudásbázis tényleg képes ezeket megválaszolni, és a jelentésében számoljon be 

a javításokról, miért volt a javításokra szükség, és arról is, hogy a javítások lé- 

nyegtelenek, illetve lényegesek voltak. 

(a) Vannak-e a Skálában más emberek, amikor János ott vásárol? (Igen — a sze- 
mélyzet!] 

(b) Vegetáriánus-e János? [Nem] 

(c) A Skálában ki a dezodor tulajdonosa? ISkála Rt.] 

(d) Kapott-e János 1 kg darált húst? [Igen] 

(e) A szomszédos MOL benzinkútnál van-e benzin? [Igen] 

(£) Belefér-e a paradicsom János kocsijába? [Igen] 


Emlékezzen arra, hogy a szemantikus háló öröklődési információját logikailag 
alkalmas implikációs állításokkal ki lehet fejezni. Ebben a feladatban megfon- 
toljuk az ilyen állításokra éj röklődési következtetés hatékonyságát. 

(a) Vegyük egy használtautó-katalógus információtartalmát — hogy az 1999-es 
Mitsubishi Carisma értéke 3 millió Ft. Tegyük fel, hogy az összes informá- 
ció (a több tízezer modell részére) a fejezetben ajánlott logikai szabályok 
formájában van megfogalmazva. Írjon fel három ilyen szabályt, az egyik az 
1999-es Carismáról szóljon. Hogyan használná a szabályokat, hogy egy 
konkrét gépkocsi értékét megtalálhassa (például XY, ami egy 1999-es 
Carisma), ha adott egy hátrafelé láncolt tételbizonyító, mint amilyen példá- 
ul a Prolog? 

(b) Hasonlítsa össze az ennek a problémának a megoldására alkalmazott hátra- 
felé láncolt következtetési módszer és a szemantikus hálóban használt 
öröklődési séma hatékonyságát. 

(c) Magyarázza meg, hogy az előrefelé láncolt következtetés hogyan teszi le- 
hetővé egy logikai rendszer számára ugyanannak a problémának egy haté- 
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kony megoldását, feltéve, hogy a tudásbázis csak 10 000 szabályt tartalmaz 
az árakról. 

(d) Írjon le egy olyan helyzetet, ahol sem az előrefelé, sem a hátrafelé láncolt 
következtetés nem teszi lehetővé a konkrét gépkocsira vonatkozó árlekér- 
dezés hatékony megvalósítását. 

(e) "Tud olyan megoldást ajánlani, ami lehetővé teszi, hogy ezt a fajta lekérde- 
zést a logikai rendszerek mindegyikében hatékonyan tudjuk kezelni? (Se- 
gítség: emlékezzen arra, hogy az ugyanahhoz a kategóriához tartozó két 
gépkocsinak ugyanaz az ára.) 


10.25. Feltételezhető, hogy egy szemantikus hálóban a sima és az egy vonallal bekere- 
tezett kapcsolat közötti szintaktikai különbségtétel felesleges, mert az utóbbi 
kapcsolatok csak a kategóriákhoz tartoznak. Az öröklődési algoritmusnak elég 
lenne feltételeznie, hogy a kategóriához csatolt sima kapcsolat szándékoltan 
a kategória minden tagjára vonatkozik. Mutassa meg a lehetséges hibák meg- 
adásával, hogy az érv hamis. 


IV. RÉSZ 
TERVKÉSZÍTÉS 





11. TERVKÉSZÍTÉS 


Ebben a fejezetben láthatjuk, hogy hogyan használhatja ki egy ágens a probléma szer- 


kezetét egy összetett cselekvési terv kialakításához. 


Egy cél elérésére irányuló cselekvéssorozat kialakítását tervkészítésnek (planning) 
nevezzük. Tervkészítő ágensekre eddig két példát láttunk: a 3. fejezet keresésalapú 
problémamegoldó ágensét és a 10. fejezetben bemutatott logikai tervkészítő ágenst. Ez a 
fejezet elsősorban az olyan nagyobb bonyolultságú tervezési feladatokra való felskálázás- 
sal foglalkozik, melyek meghaladják az eddig ismertetett megközelítések képességeit. 

A II.I. fejezet egy kifejező, de mégis megfelelően korlátozott nyelvet mutat be az 
állapotokat és cselekvéseket tartalmazó tervkészítési feladatok leírására. Ez a nyelv 
szoros kapcsolatban áll a 7. és 10. fejezetben szereplő ítéletlogikai, illetve elsőrendű 
leírásokkal. A 11.2. fejezet megmutatja, hogy az előre- és a hátrafelé kereső algoritmu- 
sok hogyan tudják előnyösen kihasználni ezt a reprezentációt, elsősorban a leírás szer- 
kezetéből automatikusan levezethető heurisztikák segítségével. (Ez analóg az 5. feje- 
zetben bemutatott, a kényszerkielégítési problémához kialakított heurisztika elkészíté- 
sével.) A 11.3-11.5. alfejezetben olyan tervkészítő algoritmusok kerülnek bemutatásra, 
amelyek felhasználva a probléma reprezentációját, képességeikben túlmutatnak az elő- 
re-, illetve hátrafelé keresésen. Nevezetesen olyan eljárásokat vizsgálunk meg, amelyek 
nem csak teljesen rendezett cselekvések sorozatát képesek figyelembe venni. 

Ebben a fejezetben csak olyan környezetekre szorítkozunk, melyek teljesen meg- 
figyelhetők, determinisztikusak. végesek, statikusak (azaz ahol változások csak akkor 
történnek, amikor az ágens cselekszik), diszkrétek (időben, cselekvésekben, objektu- 
mokban és hatásokban). Ezeket klasszikus tervkészítési (ciassical planning) környeze- 
teknek nevezzük. Ezzel ellentétben a nem klasszikus tervkészítés a részben megfigyel- 
hető vagy a sztochasztikus környezetek kezelésére szolgál, és itt megjelennek eltérő, 
a 12. és 17. fejezetben bemutatott, algoritmusok és ágenstervek. 


11.1. A TERVKÉSZÍTÉSI PROBLÉMA 


Fontoljuk meg, hogy mi történne, ha egy közönséges, a standard keresési algoritmu- 
sokat — mélységi keresés, A" stb.— használó problémamegoldó ágens valós nagymére- 
tű problémákkal kerülne szembe. Ez segíthet abban, hogy jobb tervkészítő ágenseket 
tervezzünk. 

A legkézenfekvőbb nehézség, hogy a problémamegoldó ágenst lebéníthatnák a szük- 
ségtelen cselekvések. Vegyük például a Mesterséges intelligencia modern megközelí- 
tésben c. könyv internetes megvásárlásának a feladatát. Tegyük fel, hogy minden egyes 
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10 jegyű ISBN szám megvásárlása egy-egy cselekvés, ez összesen 10 milliárd cse- 
lekvést jelent. A keresési algoritmusnak mind a 10 milliárd cselekvés végállapotát meg 
kellene vizsgálnia, hogy megtalálja a célnak megfelelőt, nevezetesen, hogy birtokoljuk 
a 9635454112 ISBN számú könyvet. Másrészről egy értelmes tervkészítő ágensnek 
képesnek kell lenni arra, hogy a pontos cél BirtokoKISBN9635454112) leírásából visz- 
szafelé dolgozva közvetlenül eljusson a Vásárot(ISBN9635454112) cselekvéshez. 
Hogy ezt megtehesse, az ágensnek arra az általános tudásra van szüksége, hogy a Vásá- 
rol(x) következménye a Birtokoltx). Ha adott ez a tudás, a tervező egy egyszerűsítési 
lépésben el tudja dönteni, hogy a Vásárolt ISBN9635454112) a helyes cselekvés. 

A következő nehézség, egy jó heurisztika (heuristic function) meghatározása. Te- 
gyük fel, hogy az ágens feladata négy ki ző könyv megvásárlása. Ebből 1010 
négylépéses terv adódik, azaz nem kérdéses. hogy egy megfelelő heurisztika nélküli 
keresés értelmetlen. Az ember számára egy állapot költségének becslésére kézenfekvő 
heurisztika a továbbiakban még megvásárolandó könyvek száma. Sajnos ez nem nyil- 
vánvaló egy problémamegoldó ágens számára, hisz az a céltesztet egy fekete dobozként 
látja, mely minden állapotra mindössze egy igaz-hamis értéket ad vissza. Ennek követ- 
kezményeképp a problémamegoldó ágens nem autonóm; azaz emberi beavatkozást igé- 
nyel minden új problémánál az alkalmazható heurisztika megadására. Másrészről, ha az 
ágensnek rendelkezésére áll a cél leírása, mint részcélok konjunkciója, akkor használ- 
hat egy egyszerű feladatfüggetlen heurisztikát: a még nem teljesített részcélok számát. 
A könyvvásárlási feladat esetén a cél Birtoko(A) A Birtokol(B) A Birtokol( C) A Birto- 
kok(D) lenne, és a Birtokol(A) A Birtokok(C) állapot költsége 2. Így az ágens számára 
automatikusan elérhető a helyes heurisztika erre és más problémákra is. A fejezet ké- 
sőbbi részében látni fogjuk, hogy hogyan lehet létrehozni olyan kifinomultabb heurisz- 
tikákat, ami a célstruktúráján túl számba veszi a végrehajtható cselekvéseket is. 

Végül a problémamegoldó ágens nem hatékony, mert nem tudja kihasználni a prob- 
lémadekompozíció (problem decomposition) lehetőségét. Vegyük például a követke- 
ző feladatot: több csomagot kell kiszállítanunk a megfelelő címekre, melyek Ausztrália 
különböző pontjain találhatók. Jó megközelítés, ha megkeressük a célpontokhoz legkö- 
zelebb eső reptereket, és felosztjuk a teljes problémát több részfeladatra; repterenként 
egyre. Az egy reptéren keresztül irányított csomagok esetén a további dekompozíció 
lehetősége a célvárostól függ. Az 5. fejezetben láttuk, hogy egy ilyen felbontás képessé- 
ge hozzájárul a kényszerkielégítési feladatmegoldók hatékonyságához. A tervkészítőkre 
ugyanez igaz: a legrosszabb esetben n csomag legjobb kiszállítási tervének elkészítése 
0(n!), míg ha a feladat k egyenlő részre bontható ez mindössze 0((n/k)! x k) komplexi- 
tású feladat. 

Ahogy az 5. fejezetben megjegyeztük, a teljesen dekomponálható problémák jók, de 
ritkák." A legtöbb tervkészítő rendszer felépítése — különösen a 11.3. fejezetben bemu- 
tatásra kerülő részben rendezett tervkészítő felépítése — azon a feltételezésen alapul, 
mely szerint a legtöbb valós, életszerű probléma majdnem dekomponálható (nearly 
decomposable). Ez annyit jelent, hogy a tervkészítő dolgozhat független részcélokon, 








1 Vegyük észre, hogy még a csomagkiszállítási feladat sem tetjesen dekomponálható. Vannak esetek. ami- 
kor jobb a csomagokat mégis egy távolabbi reptérre irányítani. ha ezzet megspórolhatunk egy külön repülő- 
járatot a közelire. Mindemellett a legtöbb szállítócég inkább a már bejáratott dekomponált megoldásokhoz 
ragaszkodik, hogy csökkentse a számítási és szervezési nehézségeket. 
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de a résztervek összekombinálása további feladatokat eredményezhet. Néhány feladat 
esetén ez a feltételezés nem helytálló, mert az egyik részcél kidolgozása gyakran meg- 
bontja a másik részcélt. Ezek a részcélok közötti kölcsönhatások azok, amelyek a fej- 
törőket (mint a nyolcas kirakó) valójában fejtörővé teszik. 


A tervkészítési problémák nyelve 





A fent leírtak alapján a tervkészítési problémák reprezenti jának — ami az állapoto- 
kat, cselekvéseket és célokat jelenti — lehetőséget kellene biztosítania a tervkészítő 
algoritmus számára, hogy a feladat logikai struktúráját kihasználhassa. Ennek kulcsa, 
hogy olyan nyelvet találjunk, ami kellően kifejező ahhoz, hogy a problémák egy széles 
körét leírja, ugyanakkor kellően szigorú ahhoz, hogy a leírásokon hatékony algoritmu- 
sok működhessenek. Ebben a fejezetben először körvonalazzuk a klasszikus tervkészí- 
tők által használt alapnyelvet, ami STRIPS néven ismert.? Később rámutatunk a számos 
módosítási lehetőségből néhányra a STRIPS-szerű nyelvekben. 

Az állapotok leírása. A tervkészítők a világot logikai feltételekre dekomponálják, és 
az állapotokat a pozitív literálok konjunkciójaként írják le. Tekintsük az ítéletlogikai 
literálokat; például a Szegény A Ismeretlen reprezentálhatja egy szerencsétlen ágens ál- 
lapotát. Elsőrendű literálokat is felhasználunk; például Ot(Repülőj, Melbourne) A 
OrRepülőa, Sydney) a csomagszállítási feladat egy állapotát írhatja le. Az elsőrendű 
logikai állapotleírások literáljainak alap- és függvénymentes literálnak (ground and 
function-free) kell lenniük. Az olyan literálok, mint az Ott(x, y) vagy az Ott(Apja(Fe- 
renc), Sydney) nem megengedettek. A zárt világ feltételezést (ciosed-world assump- 
tion) használjuk, ami annyit tesz, hogy a nem felsorolt állításokat hamisnak vesszük. 

A célok leírása. A cél egy részlegesen definiált állapot, melyet pozitív alapliterálok 
konjunkciója reprezentál, mint Gazdag A Híres vagy OP), Tahiti). Az s ítéletlogikai 
állapot kielégíti a c célt (goal satisfiction), ha s tartalmazza a c-ben szereplő összes 
atomot (és esetleg még továbbiakat). Például a Gazdag A Híres A Szomorú állapot ki- 
elégíti a Gazdag A Híres célt. 

A cselekvések leírása. A cselekvést a következő két állapot határozza meg: az elő- 
feltétel, aminek teljesülni kell az akció végrehajtásához, és a következmény, ami a vég- 
rehajtás eredményeként lép fel. Például két állomás közötti repülés leírása az alábbi: 


Cselekvés(Repülk(p. honnan, hova), 
ELŐFELTÉTEL: Ott(p, honnan) A Repülőíp) A Repülőtérl(honnan) A Repülőtér(hova) 
KÖVETKEZMÉNY: —0Ott(p, honnan) A Or(p, hova)) 


Ezt pontosabban cselekvési sémának (action schema) nevezzük, ami azt takarja, hogy 
ez számos különböző cselekvést reprezentál, ami a p. honnan és a hova változók külön- 
böző behelyettesítéseivel származtatható. Általánosságban a cselekvési séma három fő 
részből áll: 


, A cselekvés megnevezése és paraméterlistája — például a Repül(p, honnan, hova) — 
a cselekvés azonosítására szolgál. 


a A STRIPS a STandford Research Institute Problem Solver rövidítése. 
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s Az előfeltétel (precondition), függvényektől mentes pozitív literálok konjunkciója, 
azt mutatva, hogy milyen feltételeknek kell előzetesen teljesülni a cselekvés végre- 
hajtásához. 

s A következmény (effect), függvényektől mentes literálok konjunkciója, ami leírja, 
hogy az állapot hogyan változik, amikor a cselekvés végrehajtásra kerül. A cselek- 
mény eredményeképp adódó következményrészben szereplő P pozitív líterál igaz 
értéket kap, míg a -P hamis értéket vesz fel. A következményrészben szereplő vál- 
tozóknak a cselekvés előfeltételei között is szerepelni kell. 


Az olvashatóság javítása érdekében néhány tervkészítő következményrészt szétválaszt- 
ja egy hozzáadás listára (add list) a pozitív és egy törlés listára (delete list) a negatív 
literáloknak. 

Most hogy a tervkészítők reprezentációjának szintaxisát definiáltuk, adjuk meg a sze- 
mantikát is. Ennek legegyszerűbb módja, ha leírjuk, hogy a cselekvések hogyan módo- 
sítják az állapotot. (Egy másik lehetséges módszer, hogy egy direkt fordítást specifi- 
kálunk a következő állapot axiómákra, melyek szemantikája az elsőrendű logikából 
származik. Lásd L1.3. feladat.) Először is azt mondjuk, hogy egy cselekvés alkalmazha- 
tó (applicable) minden állapotban, ami kielégíti az előfeltételeket; egyébként a cselekvés 
hatástalan. Egy elsőrendű séma esetében az alkalmazhatóság elérése az előfeltételek egy 
8 behelyettesítését vonja maga után. Tegyük fel például, hogy a jelen állapot leírása: 


OP, JFK) N OMPo, SFO) A Repülő(P)) A RepülőtPa) 
A RepülőtéríIFK) A Repülőtér SFO) 


Ez teljesíti az 
Op, honnan) A Repülő(p) A Repülőtérlhonnan) A Repülőtér(hova) 


előfeltételt a (p/P1, honnan/JFK, hova/SFO) behelyettesítésekkel (és másokkal is — 
lásd 11.2. feladat). Így a konkrét RepüKPj, JFK, SFO) cselekvés alkalmazható. 

Az s állapotból kiindulva az alkalmazható a cselekvés végrehajtásának eredménye az 
57 állapot, ami azonos s-sel, kivéve, hogy az a cselekvés következményrészében szerep- 
lő pozitív P literálokat az 57-höz adjuk, míg bármilyen -P negatív literált eltávolítjuk 
5-ből. Így a Repül(P,, JFK, SFO) cselekvés után az állapot a következő: 


OP, SFO) N OP, SFO) A RepülőtP)) A Repülő(Po) 
A Repülőtér FK) A Repülőtér SFO) 


Vegyük észre, hogy a már szereplő pozitív következményeket nem szúrjuk be még egy- 
szer, illetve ha egy negatív literál nem szerepel az állapotleírásban, akkor a következ- 
mény ezen része figyelmen kívül hagyható. Ez a definíció testesíti meg az úgynevezett 
STRIPS feltételezést (assumption): minden a következményben nem szereplő literál 
változatlan marad. Így a STR1ps elkerüli a 10. fejezetben bemutatott reprezentációs 
keret problémát (representional frame problem). 

Végezetül definiálhatjuk a tervkészítési probléma megoldását (solution). Legegy- 
szerűbb formájában ez csak egy cselekvéssorozat. melyet a kiindulási állapotból 
végrehajtva a célállapotot eredményezi. A fejezet további részeiben a megoldások cse- 
lekvések részben rendezett sorozatai is lehetnek, amennyiben minden cselekvéssorozat, 
ami megfelel ennek a részben rendezésnek, megoldás. 
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Kifejezőképesség és kiterjesztések 


A sokféle megkötés. korlátozás amít a STRIPS nyelv tartalmaz, abban a reményben ke- 
rült beépítésre, hogy a tervkészítő algoritmusok egyszerűbbek és hatékonyabbak 
lehessenek, anélkül hogy a valós problémák leírását megnehezítenék. Egyike a legfon- 
tosabb megkötéseknek, hogy a literáloknak függvénymenteseknek kell lenniük. Ezzel a 
megkötéssel biztosíthatjuk, hogy egy adott problémához tartozó bármely akció séma 
ítéletkalkulus formára, azaz változómentes ítéletlogikai cselekvés reprezentációk vé- 
ges halmazára hozható. (A téma bővebb leírását lásd a 9. fejezetben.) Például a légi 
szállítási problémakörben 10 repülő és 5 repülőtér esetén a Repükp, honnan, hova) 
séma 10 x 5 x 5 — 250 ítéletlogikai cselekvésre fordítható. A 11.4. és 11.5. alfejezet 
tervkészítői közvetlenül az ítéletkalkulusra hozott leírással dolgoznak. Ha függvényszim- 
bólumokat is megengedünk, akkor végtelen sok állapot és cselekvés határozható meg. 











STRIPS nyelv ADL nyelv 
Csak pozitív literálok az állapotokban: Pozitív és negatív literálok az állapotokban: 
Szegény N Ismeretlen "Gazdag N Híres 

Zárt világ feltételezés: Nyílt világ feltételezés: 

A nem szereplő literálok hamisak, A nem szereplő literálok meghatározatlanok, 





A P N--g jelentése: hozzáadjuk P-t, és töröljük 0-t. ! A P A -g jelentése: hozzáadjuk P-t és -0-t, 
valamint töröljük -P-t és 0-t. 














A célokban csak alapliterálok szerepelnek: Kvantifikált változók a célokban: 

Gazdag A Híres 3x OM(Pj, x) A OtP2, x) cél azt adja meg, 
hogy P) és P; azonos helyen van. 

A célok konjunkciók: A célok konjunkciókat és diszjunkciókat is 

Gazdag A Híres tartalmazhatnak: -Szegény A (Híres V Okos) 

T zössázzasaatssztkántottstzántt ll 

A következmények konjunkciók. Feltételes következmények is megengedettek: 
amikor E: E jelentése, hogy E akkor érvényes, 
ha P teljesül. 

Nincs támogatás az egyenlőségvizsgálathoz. Beépített egyenlőség (x — y) predikátum. 

Nincs támogatás típusokhoz. A változóknak lehet típusa, mint (p : Repülő). 














11.1. ábra. A Srrips és az ADL nyelv összehasonlítása a tervkészítési feladatok reprezentációjának szem- 
pontjából. Mindkét esetben a célok úgy viselkednek, mint egy paraméterek nélküli cselekvés előfeltételei 


Napjainkra, nyilvánvalóvá vált, hogy a STRIPS nem eléggé kifejező néhány valós prob- 
lémakörhöz. Ennek eredményeképpen számos nyelvváltozatot dolgoztak ki. A 11.1. 
ábra röviden összefoglalja az egyik legfontosabbat, a cselekvésleíró nyelvet (Action 
Description Language — ADL) úgy, hogy összehasonlítja azt a STRIPS alapverziójával. 
ADL nyelven a Repülés leírása az alábbi: 


Cselekvés(Repül(p : Repülő, honnan : Repülőtér, hova : Repülőtér), 
ELŐFELTÉTEL: Ottp, honnan) A (honnan zt hova) 
KÖVETKEZMÉNY: -Ottíp, honnan) A Ott(p, hova)) 
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A p : Repülő írásmód az előfeltételek a paraméterlistájában a Repülő(p) egy rövidítése, 
ami nem növeli a kifejezőképességet, de javítja az olvashatóságot. (Mindemellett redu- 
kálja a létrehozható ítéletlogikai cselekvések számát.) A (honnan z hova) előfeltétel 
azt a tényt fejezi ki, hogy egy repülőút kiindulási és célállomása nem lehet azonos. Ezt 
a STRIPS nyelvben nem lehetne tömören kifejezni. 

A mesterséges intelligenciában használt változatos tervkészítő formalizmusokat egy 
szabványos szintaxisba rendszerezik, amit tervkészítési terület definíciós nyelvnek 
(Planning Domain Definition Language — PDDL) neveznek. Ez a nyelv lehetővé 
teszi a kutatók számára, hogy benchmark problémákat cseréljenek ki egymás között, és 
összevessék az eredményeket. A PDDL résznyelveket tartalmaz az ADL és a 12. feje- 
zetben bemutatásra kerülő hierarchikus feladathálózatok számára. 

A STRWPS és az ADL jelölésrendszere számos valós problémakörre megfelelő. A kö- 
vetkező alfejezetek néhány egyszerű példát mutatnak be. Néhány számottevő megkötés 
azért még megmaradt. A legnyilvánvalóbb, hogy közvetlenül nem tartalmazzák a cse- 
lekvések véghatásait (ramifications). Például ha vannak emberek, csomagok vagy 
porcicák egy repülőn, akkor mindannyian helyet változtatnak egy repülés során. Ezeket 
a változásokat leírhatjuk, mint a repülés egyenes következményeit, így természetesebb- 
nek tűnik a repülőgép tartalmának helyét, mint a gép helyének logikai következményét 
ábrázolni. Az ilyen állapotmegkötésekre (state constraints) a 11.5. alfejezet tartalmaz 
példákat. A hagyományos tervkészítő rendszerek meg sem próbálják megoldani a kva- 
lifikációs problémát (gualification problem), azaz a nem reprezentált körülmények 
problémáját, melyek a cselekvés meghiúsulását okozhatják. A 12. fejezetben látni fog- 
juk, hogy a kvalifikációs probléma hogyan közelíthető meg. 


Példa: Légi teherszállítás 


A 11.2. ábra egy teherszállítási problémát mutat be, ami a teher be-, illetve kirakodását 
És állomások közötti légi szállítását tartalmazza. A probléma három cselekvéssel írható 
le: Berakodás, Kirakodás és Repülés. A cselekvések két predikátumot érintenek: a 
Benne(c, p) jelentése, hogy a c teher a p repülőgépben van, és az Ott(x, a) jelentése, 





Kiindulá(OtCj, SFO) A OM Ca, JFK A OPi, SFO) h OtkPa, JFK) 
A Teher(Cp) A TehertC2) A RepülőtPp) A RepülőtP:) 
A Repülőtér JFK) A Repülőtéri SFOD) 
CÉKOMCI, JFK) A OMC2. SFODJ 
Cselekvés(Berakodásíe, p, a), 
ELŐFELTÉTEL: Ott(c, a) A Or(p, a) A Tehertc) A Repülőtp) A Repülőtérta) 
KÖVETKEZMÉNY: -Ott(c, a) A Bennetc, p)) 
Cselekvés(Kirakodástc, p, a), 
ELŐFELTÉTEL: Benne(c, p) A Ort(p, a) A Tehertc) A Repülőtp) A Repülőtérta) 
KÖVETKEZMÉNY: Ottíc, a) A —Bennetc, p)) 
Cselekvés(Repülésíp, honnan, hova), 
ELŐFELTÉTEL: Ott(p. honnan) A Repülőtp) A Repültőtéríhonnan) A Repülőtéríhova) 
KÖVETKEZMÉNY: -Or(p, honnan) A O1kp, hova)) 











11.2. ábra. A STRIPS-probléma repülőterek közötti légi teherszállítási feladathoz 
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hogy az x objektum (teher vagy repülőgép) az a repülőtéren található. Vegyük észre, 
hogy a teher nincs Ott sehol, ha Benne van egy repülőgépben, azaz az Ott valójában azt 
jelenti. hogy az objektum , elérhető a megadott helyen". Tapasztalattal kell rendelkezni 
a cselekvésdefiníciók területén, ahhoz hogy az ilyen részleteket konzisztensen ábrázol- 
juk. A következő terv megoldása a feladatnak: 


IBerakodás(C,. Py, SFO), Repülés(Pa, SFO, IFK, Kirakodás(C), Pa, JFK) 
Berakodás(C2, Pa, JFK), Repülés(P2, JFK, SFO. Kirakodás(C,, Pa, SFON 


A mi reprezentációnk tisztán STRIPS nyelvű. Nevezetesen ez engedélyezi, hogy egy repü- 
lő kiinduló és célállomása azonos repülőtér legyen. Az ADL egyenlőtlenség operátorai 
ezt kizárhatnák. 


Példa: A pótkerék probléma 


Vegyük a kerékcsere problémáját. Pontosabban a célunk az, hogy egy jó pótkerék le- 
gyen felszerelve az autó tengelyére, ahol a kiinduló állapotban egy lapos kerék van fel- 
szerelve, míg a jó pótkerék a csomagtartóban található. Az egyszerűség kedvéért a mi 
feladatunk elég absztrakt, azaz nincsenek beragadt csavarok vagy egyéb más nehézsé- 
gek. Csak négy cselekvés van: a pótkerék kivétele a csomagtartóból, a lapos kerék eltá- 
volítása a tengelyről, a pótkerék felszerelése és az autó magára hagyása reggelig. Fel- 
tételezzük, hogy az autó egy igen rossz környéken áll, ahol az autó magára hagyása azt 
eredményezi, hogy reggelre eltűnnek a kerekek. 

A 11.3. ábra a feladat ADL leírását tartalmazza. Vegyük észre, hogy ez a megadás 
pusztán ítéletlogikai. A STRIPS nyelven túlmutat, hogy a TeddFeKPótkerék, Tengely) 
cselekvéshez a -Ott(Pótkerék, Tengely) negált előfeltétel tartozik. Ezt elkerülhetnénk 
egy SzabaddáTeszíTengely) használatával, amint azt a következő példában látni fogjuk. 





Kiindulás( Ot(LaposKerék, Tengely) A Or(Pótkerék, Csomagtartó) 
CéKOtPótkerék, Tengely) 
Cselekvés(EltávolítíPótkerék, Csomagtartó), 

ELŐFELTÉTEL: Or(Pótkerék, Csomagtartó) 

KÖVETKEZMÉNY: -Ort(Pótkerék, Csomagtartó) A On(Pótkerék. Föld) 
Cselekvés( Eltávolít LaposKerék, Tengely), 

ELŐFELTÉTEL: Ott(LaposKerék, Tengely) 

KÖVETKEZMÉNY: -Or(LaposKerék, Tengely) A Ot(LaposKerék, Föld) 
Cselekvés(Felszerel(Pótkerék, Tengely), 

ELŐFELTÉTEL: Ott(Pótkerék, Föld) A -Ort(LaposKerék, Tengely) 

KÖVETKEZMÉNY: -Ort(Pótkerék, Föld) A Or(Pótkerék, Tengely) 
CselekvéstOtthagyÉjszakára, 

ELŐFELTÉTEL: 

KÖVETKEZMÉNY: -Or(Pótkerék, Föld) A -Ow(Pőtkerék, Tengely) A -OnPótkerék, Csomagtaró) 

A -Om(Laposkerék, Föld) A -Ott(Laposkerék, Tengely) 








11.3. ábra. Az egyszerű pótkerék probléma 
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Példa: A kockavilág 


Az egyik legbíresebb tervkészítési terület a kockavilág (blocks world) probléma. A te- 
rület asztallapon elhelyezett kockákból áll? A kockákat egymásra rakhatjuk, de egy 
kockán közvetlenül mindig csak egyetlen másik helyezhető el. A kockákat egy robot- 
karral mozgathatjuk, amely fel tud venni egy kockát, majd azt vagy az asztalra, vagy 
egy másik kocka tetejére le tudja tenni. A robotkar egyszerre csak egy kockát tud fel- 
emelni, vagyis olyat nem, amelynek a tetején egy másik kocka van. A cél mindig egy 
vagy több kockaoszlop építése, amelyekben a kockák egymáshoz képesti elhelyezkedé- 
se meghatározott. A cél lehet például két oszlop építése, amelyek közül az egyikben az 
A kocka a B tetején van, a másikban pedig a C kocka van a D tetején. 

A Rajtatb, x) jelölést használjuk annak leírására, hogy a b kocka az x-en van, ahol 
az x egy másik kockát vagy az asztallapot jelenti. A Mozgat(b, x, y) cselekvés a b koc- 
kát a x tetejéről az y tetejére mozgatja. A b kocka mozgatásának előfeltétele, hogy raj- 
ta semmi ne legyen. Ennek leírása az elsőrendű logikában a —3x Rajta(x, b) vagy Wx 
-Rajta(x, b). Az ADL nyelvben ezek előfeltételek lehetnének. A STRIPS nyelv kere- 
tei között maradhatunk az Üres(x) predikátum bevezetésével, ami akkor igaz, ha sem- 
mi nincs x-en. 

A Mozgat cselekvés a b kockát az x-ről az y-ra mozgatja, ha mind a b, mind pedig az 
y üres. A mozgatás után az x üres, de az y már nem. A Mozgat formális leírása STRIPS- 
ben a következő: 


Cselekvés(Mozgattb, x, y), 
ELŐFELTÉTEL: Rajtatb, x) A Üres(b) A Üresty) 
KÖVETKEZMÉNY: Rajta(b, y) A Üres(x) A -Rajta(b, x) A -Üres(y)) 


Sajnos ez a cselekvés nem kezeli jól az Üres predikátumot, ha az x vagy az y az aszta- 
lon van. 

Ha x — Asztal, a cselekvés következményei között szerepel az Üres(Asztal) is, de az 
asztalnak nem kell kiürülnie a mozgatás után, ha pedig y — Asztal, megjelenik az 
Üres(Asztal) előfeltétel, holott az asztalnak nem kell üresnek lenni ahhoz, hogy bármit 
is tehessünk rá. Ennek kiküszöbölésére két dolgot tehetünk. Először is bevezetünk egy 
új cselekvést, amellyel egy b kockát az asztalra tehetünk: 


Cselekvés(AsztalraTeszíb, x, y), 
ELŐFELTÉTEL: Rajra(b, x) A Ürestb) 
KÖVETKEZMÉNY: Rajtatb, Asztal) A Üres(x) A -Rajtatb, x)) 


Másodszor az Üres(b) predikátumot úgy értelmezhetjük, hogy ,,b tetején van elég sza- 
bad hely, ahová a kockát letehetjük". Ezek szerint az Üres(Asztal) mindig igaz. 
Az egyetlen probléma, hogy semmi nem gátolja a tervkészítőt abban, hogy a Mozgat(b, 
x, Asztal) cselekvést alkalmazza az AsztalraTesz(b, x) helyett. Vagy együtt élünk ezzel 
a problémával (amely egyébként a szükségesnél nagyobb keresési teret eredményez, de 
nem vezet hibás válaszokhoz), vagy bevezethetjük a Kocka predikátumot, és a Mozgat 
cselekvés előfeltételeihez hozzátehetjük a Kocka(x) A Kocka(b) részt. 


3 A tervkészítés kutatásában használt kockavilág sokkal egyszerűbb, mint az SHRDLU verzió, amit az 52. 
oldalon mutattunk be. 
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KiindulástRajtatA, Asztal) A Rajta(B, Asztal) A Rajta(C, Asztal) 
A Kocka(A) A Kocka (B) A Kockat(C) 
A Üres(A) A Üres(B) A Üres(C)) 
Cél(Rajta(A. B) A RajtalB, €)) 
CselekvéstMozgat(b, x, v), 
ELŐFELTÉTEL: Rajtatb, x) A Öres(b) A Üresty) A Kocka(b) A 
BbeDdAtbzyát ey 
KÖVETKEZMÉNY: Rajta(b, y) A Üres(x) A —Rajtatb, x) A -Ürestv)) 
CselekvéstAsztalraT x) 
ELŐFELTÉTEL: Rajta(b. x) A Üres(b) A Kockatb) A (b 5 x) 
KÖVETKEZMÉNY: Rajta(b, Asztal) A Üres(x) A —Rajtatb, x)) 















11.4. ábra. A kockavilág tervkészítési problémája: egy három kockából álló torony építése. A [Moz- 
gukB. Asztal. €1. Mozgat(A, Asztal, By] cselekvéssor egy lehetséges megoldás. 


Végül itt van még az olyan hibás műveletek esete, mint a Mozgat(B, C, C), amely 
hatástalan kellene legyen, ehelyett azonban ellentmondó következményekhez vezet. 
Általában nem foglalkozunk az ilyen jellegű problémákkal, mert nemigen vannak ha- 
tással az előállított tervekre. A helyes megközelítés, hogy egyenlőtlenségi előfeltétele- 
ket vezetünk be, amint azt a 11.4. ábra mutatja. 
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Most fordítsuk figyelmünket a tervkészítő algoritmusok felé. A legkézenfekvőbb meg- 
közelítés az állapottér-keresés. Mivel a tervkészítési problémák cselekvéseinek leírása 
tartalmazza az előfeltételeket és a következményeket, a keresés mindkét irányban vég- 
rehajtható: vagy előrefelé egy kiindulási állapotból, vagy visszafelé a céltól, amint azt 
a II.5. ábra is mutatja. Mindezeken túl felhasználhatjuk az explicit cselekvés- és cél- 
reprezentációkat, hogy automatikusan hatékony heurisztikákat származtassunk. 


Előrefelé keresés az állapottérben 


Ez előrefelé kereséssel történő tervkészítés hasonlít a 3. fejezetben bemutatott probléma- 
megoldó megközelítéshez. Ezt progresszív tervkészítésnek nevezzük, mert előrefelé 
haladva dolgozik. 

A feladat kiinduló állapotából indulva végignézzük a lehetséges cselekvéssorozato- 
kat, amíg olyat nem találunk, ami a célállapothoz vezet. A tervkészítési probléma álla- 
pottér-keresési problémaként formalizálva a következő: 


s A keresés kiindulási állapota (initial state) megegyezik a tervkészítési probléma 
kiindulási állapotával. Általánosságban minden állapot pozitív alapliterálok egy hal- 
maza; az itt nem szereplő literálok hamisak. 

e Egy állapotban minden olyan cselekvés (action) alkalmazható, aminek az előfelté- 
telei teljesülnek. A cselekvés végrehajtása után következő állapotot úgy állítjuk elő, 
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(a) 


OP, A) 


(b) 





11.5. ábra. A tervkészítés két megközelítése. (a) Előrefelé (progresszív) állapottér-keresés, a kiinduló 
állapotból indulva és a probléma cselekvéseit használva halad a cél felé. (b) Visszafelé (regressziós) 
állapottér-keresés: valószínűségi állapot keresés (lásd 124. oldal) a célállapottokjból indulva a cselek- 
vések inverzét alkalmazva keresi visszafelé a kezdeti állapotot. 


hogy a következményrész pozitív literáljait hozzáadjuk, negatív literáljait pedig 
töröljük. (Elsőrendű logika esetén az előfettételekből az egyesítőt alkalmazni kell a 
következményliterálokra.) Megjegyezzük, hogy annak következményeként, hogy 
egy explicit cselekvés reprezentációt használunk, egyetlen állapotátmenet-függvény 
működik az összes tervkészítő problémára. 

. A célteszt (goal test) ettenőrzi, hogy az adott állapot kielégíti-e a tervkészítési prob- 
léma célját. 

a A lépésköltség (step cost) minden cselekvésre tipikusan 1. Habár könnyű lenne a 
különböző cselekvésekhez különböző költségeket hozzárendelni, ezt a STRIPS terv- 
készítőkben nagyon ritkán alkalmazzák. 


Emlékezzünk vissza, hogy a függvényszimbólumok hiányában a tervkészítési probléma 
állapottere véges, ezért teljes gráf keresési algoritmusok, mint például az A" keresés, 
egyben teljes tervkészítő algoritmusok is. 

A tervkészítők kutatásának korai napjaitól (kb. 1961-től) egészen mostanáig (kb. 
1998-ig) az a feltételezés élt, hogy az előrefelé kereső algoritmusok nem eléggé haté- 
konyak a gyakorlati alkalmazásra. Ma már, tekintsünk csak vissza a 11.1. alfejezetre, 
ezt nem nehéz megindokolni. Először is az előrefelé keresés nem foglalkozik a lé- 
nyegtelen cselekvések problémájával, mivel minden állapotban minden alkalmazha- 
tó cselekvést figyelembe vesz. Másodszor pedig ez a megközelítés gyorsan elakad 
egy jó heurisztika nélkül. Vegyük például a légi csomagszállítási problémát 10 repü- 
lőtérrel, egyenként 5-5 repülővel és 20 darab csomaggal. A cél, hogy az A repülőtér 
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összes terhét a B repülőtérre szállítsuk. Van egy egyszerű megoldása a feladatnak: 
tegyük be mind a 20 csomagot az egyik A-beli repülőgépbe, ezzel repüljünk B-be, és 
ott rakodjunk ki. A megoldás megkeresése ellenben nagyon nehéz lehet, hiszen az át- 
lagos elágazási faktor óriási: mind az 50 repülő 9 másik reptérre tud repülni. míg 
mind a 200 csomag kirakható (ha be volt rakva), vagy berakható a reptér bármelyik 
repülőjébe. Átlagosan mondjuk 1000 lehetséges cselekvés hajtható végre, így a kere- 
sési fában a kézenfekvő megoldás mélységéig közel 10001 csomópont van. Ebből 
nyilvánvaló, hogy egy megfelelő heurisztikára lesz szükség, hogy ezt a keresést ha- 
tékonnyá tegyük. A hátrafelé keresés áttekintése után néhány lehetséges heurisztikát 
mutatunk be. 


Hátrafelé keresés az állapottérben 


Az állapottérben történő hátrafelé keresést a kétirányú keresés egy részeként a 3. feje- 
zetben röviden már bemutattuk. Ott megjegyeztük, hogy a hátrafelé keresés megvaló- 
sítása nagyon nehéz lehet, ha a célállapotokat az explicit megadás helyett megkötések- 
kel határozzuk meg. Nevezetesen nem mindig nyilvánvaló, hogy hogyan generáljuk le 
a célállapotok halmazának a lehetséges elődállapotait (predecessors). Látjuk majd, 
hogy a STRIPS reprezentáció esetén ez meglehetősen egyszerű, mert az állapothalmazo- 
kat azokkal a literálokkal írhatjuk le, amelyeknek igaz értékűeknek kell lenni az adott 
állapotokban. 

A hátrafelé keresés fő előnye az, hogy lehetővé teszi számunkra, hogy csak a rele- 
váns (relevant) cselekvéseket vegyük figyelembe. Egy cselekvés releváns egy kon- 
junktív cél szempontjából, ha eléri a cél egy konjunktját. Például a 10-repülőteres légi 
csomagszállítási problémánk esetében a cél az, hogy a 20 csomag a B repülőtéren 
legyen, vagy pontosabban 


OMCI, B) A OMC2, B) A... A OC. B) 


Vegyük az OW(C), B) literált. Hátrafelé dolgozva, olyan cselekvéseket kereshetünk, 
melyeknek ez a következménye. Ilyen csak egy van: Kirakodás(Cj, p, B), ahol a p re- 
pülőgép meghatározatlan. 

Vegyük észre, hogy számos irreleváns cselekvés is van, ami szintén a célállapotra 
vezet. Például elrepíthetünk egy üres gépet a JFK repülőtérről (John Fitzgerald Ken- 
nedy repülőtér New Yorkban) az SFO-ra (San Francisco repülőtere), ami a célállapot- 
hoz vezet egy olyan elődállapotból, melyben a repülőgép a JFK-n van, és minden cél- 
feltétel teljesül. Egy hátrafelé keresés, ami megengedi a hatástalan cselekvéseket még 
teljes, de sokkal kevésbé hatékony. Ha létezik megoldás, akkor azt egy olyan hátrafelé 
keresés is megtalálja, amely csak releváns cselekvéseket enged meg. A hátrafelé kere- 
sés szűkítése a releváns cselekvésekre, gyakran jóval alacsonyabb elágazási tényezőt 
eredményez, mint az előrefelé keresés. Például a légi szállítási problémánk esetén a 
kiindulási állapotból előrefelé közel 1000 cselekvés hajtható végre, míg a célból vissza- 
felé indulva mindössze 20. 

A visszafelé keresést regressziós (regression) tervkészítésnek is nevezik. A regresz- 
sziós keresés meghatározó kérdése a következő: melyek azok az állapotok, amelyekből 
egy adott cselekvés a célhoz vezet? Ezen állapotok leírásának számítását a cél adott 
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állapoton keresztüli regresszálásának (regressing) nevezzük. Hogy lássuk ennek me- 
netét, vegyük a légi szállítási feladatot. Adott a cél az 


OM(CI, B) A OMC2, B) A... A OM(Cag, B) 
és a releváns cselekvés a KirakodásíCi, p, B), ami az első literált adja. A cselekvés csak 
akkor működik, ha az előfeltételei teljesülnek. Ebből kifolyólag az elődállapotnak tartal- 
maznia kell a Benne(Ci, p) A Ott(p, B) előfeltételeket. Mindezeken túl az OC, B) 
részcél nem lehet igaz a megelőző állapotban.! Így a megelőző állapot leírása az alábbi: 


BennetCh, p) A Orp, B) A OC, B) N ... A OCog, B) 


Ennek tetejébe, ha elvárjuk, hogy egy cselekvés kielégítsen egy literált, azt is biztosíta- 
nunk kell, hogy nem ront el egy másikat. Az olyan cselekvést, ami megfelel ennek az 
elvárásnak konzisztensnek (consistent) nevezzük. Például a Berakodás(C2. p) cselek- 
vés nem lenne konzisztens az aktuális céllal, mert negálja az Or(Co, B) literált. 

Most, hogy a relevanciát és a konzisztenciát definiáltuk, megadhatunk egy általános 
módszert a hátrafelé keresés elődállapotának kereséséhez. Adott egy G cél leírása. 
Legyen az A cselekvés releváns és konzisztens. A megfelelő elődállapot a következő: 


s Az A minden pozitív következményét, ami szerepel G-ben, töröljük. 
s Az A minden, még nem szereplő előfeltételét hozzáadjuk. 


A standard keresési algoritmusok bármelyike felhasználható a keresésre. A leállási fel- 
tétel, hogy a generált elődállapot leírását a keresés kiindulási állapota kielégítse. 
Az elsőrendű esetben, ehhez néhány változó behelyettesítésére is szükség lehet az előd- 
állapotának leírásában. Például az előző bekezdés elődállapotának leírását a 


Benne(Ci, Pa) A Ott(Pi2, B) A OMC2, B) A... A OM(Cog, B) 


kiindulási állapot a (p/Pj2) behelyettesítéssel teljesíti. A behelyettesítéseket arra a cse- 
lekvésre kell végrehajtani, ami az állapottól a célhoz vezet, így eredményezve a [Kira- 
kodás(Ci, Pi2, By] megoldást. 


Állapottér-keresési heurisztikák 


Sem az előre-, sem pedig a hátrafelé keresés nem hatékony egy jó heurisztika nélkül. 
Emlékezzünk vissza a 4. fejezetből, hogy egy heurisztikus függvény egy állapot cél- 
állapottól való távolságát becsli; a STRIPS esetén minden cselekvés költsége I. így a 
távolság az alkalmazandó cselekvések száma. Az alapötlet, hogy nézzük a cselekvés 
következményeit és a célokat, és becsüljük meg. hogy hány lépésre van szükség a célok 
elérésére. A pontos szám meghatározása NP-teljes probléma, de a legtöbb esetben talál- 
hatók kellően pontos becslők, melyek nem nagyon számításigényesek. Szintén ké- 
Pesek lehetünk egy elfogadható (admissable) heurisztika származtatására, azaz 
olyanra, ami nem becsül túl. Ez az At kereséssel együtt használható optimális meg- 
oldások megkeresésére. 


9 Ha a részcél igaz lenne az elődállapotban, akkor a cselekvés még mindíg a célállapothoz vezetne. Ellen- 
ben az ilyen cselekvések hatástalanok (irrelevánsak). mivel nem zeszík igazzá a célt. 
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Két megközelítést lehet kipróbálni. Az egyik, hogy a megadott feladatleírásból egy 
relaxált problémát í(relaxed problem) származtatunk, ahogy azt a 4. fejezetben bemu- 
tattuk. A relaxált problémára (ami várhatóan könnyen megoldható) adott optimális 
megoldás költsége elfogadható heurisztikát ad az eredeti problémára. A második meg- 
közelítés során feltételezzük, hogy a tiszta , oszd meg és uralkodj" algoritmus működ- 
ni fog. Ezt nevezzük a részcélfüggetlenség (subgoal independence) feltételezésnek: a 
részcélok konjunkciójának megoldási költségét, az egymástól függetlenül megoldott 
részcélok költségeinek összegével becsüljük. A részcélfüggetlenség feltételezés lehet 
optimista vagy pesszimista. Akkor optimista, hogyha vannak negatív kölcsönhatások a 
részcélokhoz készített résztervek között (például amikor az egyik részterv egy cse- 
lekvése töröl egy célt, melyet egy másik részterv ért el). Akkor pesszimista és egyben 
elfogadhatatlan is, ha a résztervek redundáns cselekvéseket tartalmaznak (például két 
cselekvés eggyel helyettesíthető az összefésült tervben). 

Vizsgáljuk meg, hogyan származtathatunk relaxált tervkészítési problémákat. Mivel 
az előfeltételek és a következmények explicit megadásai rendelkezésre állnak, az eljárás 
ezeket a reprezentációkat módosítja. (Vessük össze ezt a megközelítést a keresési felada- 
tokkal, ahol az állapotátmenet-függvény egy fekete doboz.) A legegyszerűbb ötlet, hogy 
lazítsuk a problémát úgy, hogy eltávolítjuk az összes előfeltételt a cselekvésekből. Ekkor 
minden cselekvés mindig alkalmazhatóvá válik, és minden literál elérhető egy lépésben 
(ha van alkalmazható cselekvés, egyébként a cél elérése lehetetlen). Úgy tűnhet, ez azt 
jelenti, hogy a célok konjunkciójához vezető lépésszám azonos a kielégítetlen céllite- 
rálok számával, de nem egészen; (1) lehet két cselekvés, melyek kölcsönösen törlik a má- 
sik által teljesített célliterált, (2) néhány cselekvés több célt is elérhet. Ha kombináljuk 
a relaxált problémát és a részcél függetlenségi feltételezést, mindkét problémát kikü- 
szöböltnek vehetjük, és az előálló heurisztika pontosan a még kielégítetlen célok száma. 

Sokszor pontosabb heurisztika nyerhető, ha legalább a több célt kielégítő cselekvé- 
sek pozitív kölcsönhatásait figyelembe vesszük. Először tovább relaxáljuk a problémát 
azáltal, hogy eltávolítjuk a negatív következményeket (lásd 11.6. feladat). Ezután kiszá- 
mítjuk, hogy mennyi az a minimális cselekvésszám, melyek pozitív következményei- 
nek uniója kielégíti a célt. Vegyük például a 


CéÉKANBA C) 

Cselekvés(X, KÖVETKEZMÉNY: A A P) 
Cselekvés(Y, KÖVETKEZMÉNY: BA CA 0) 
Cselekvés(Z, KÖVETKEZMÉNY: BA PA 0) 


A minimális halmaz az (X, Y) cselekvés, ami az (A, B, C) célt kielégíti, így a fedőhal- 
maz-heurisztika szerinti költség 2. Ez javít a részcél függetlenség feltételezésen, ami 3- 
as költséget adna. Egyetlen apró probléma van: a fedőhalmaz probléma NP-teljes. 
Az egyszerű fedőhalmaz-keresési algoritmus garantáltan visszaad egy értéket, ami egy 
log n-es faktor pontossággal az igazi minimumérték, ahol n a cél literáljainak száma, és 
a gyakorlatban rendszerint ennél sokkal pontosabb. Sajnos a mohó algoritmus elveszí- 
ti a heurisztika elfogadhatóságának garanciáját. 

Az is lehetséges, hogy a relaxált problémát a negatív következmények eltávolításával 
állítjuk elő anélkül, hogy az előfeltételeket elhagynánk. Ez annyit tesz, hogy ha egy 
cselekvés következménye A A —8 az eredeti problémában, akkor A a relaxált problé- 
mában. Ez annyit tesz, hogy nem kell foglalkoznunk a résztervek közötti negatív köl- 
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csönhatásokkal, mert egyetlen cselekvés sem törölhet egy másik által előállított literált. 
Az így előálló relaxált feladat megoldásának költsége az üres-törlési-lista (empty- 
delete-list) heurisztikát adja. A heurisztika meglehetősen pontos, de kiszámítása egy 
(egyszerű) tervkészítő algoritmus futtatását igényli. A gyakorlatban a relaxált probléma 
megoldása elég gyors ahhoz, hogy megérje alkalmazni. 

Az itt bemutatott heurisztika mind a progresszív (előrefelé), mind pedig a regresszív 
(hátrafelé) irányba használható. A könyv írásának pillanatában az üres-törlési-lista heu- 
risztikát használó előrefelé keresők a listavezetők. Ez valószínűleg változik, ahogy 
újabb heurisztikák és keresési technikák jelennek meg. Mivel a tervkészítés exponenciá- 
lis komplexitású,? nincs olyan algoritmus, amely minden problémára hatékony lesz, de 
számos gyakorlati feladat oldható meg ezen fejezet heurisztikáival — sokkal több, mint 
ami néhány éve megoldható volt. 


11.3. RÉSZBEN RENDEZETT TERVKÉSZÍTÉS 


Az előre- és hátrafelé keresés a teljesen rendezett terv keresés speciális fajtái. Ezek a 
cselekvéseknek csak szigorúan lineáris sorozatait tárják fel, melyek közvetlenül kap- 
csolódnak a kiinduláshoz vagy a célhoz. Ez annyit tesz, hogy nem használhatják ki a 
problémadekompozíció lehetőségeit. Ahelyett hogy a részproblémákon külön dolgozná- 
nak, mindig arról kell dönteniük, hogy hogyan sorrendezzék a részproblémák cselekvé- 
seinek összességét. Előnyösebb lenne egy olyan megközelítés, ami több részcélon dol- 
gozik függetlenül, ezeket több résztervvel megoldja, majd összerakja a részterveket. 

Egy ilyen megközelítésnek megvan az az előnye is, hogy rugalmas a terv összeállításának 
sorrendjében. A tervkészítő így nem kényszerül arra, hogy a lépéseken időrendi sorrendben 
dolgozzon, hanem először inkább a , nyilvánvaló" vagy , fontos" döntéseken dolgozhat. Pél- 
dául egy Berkeleyben lévő tervkészítő ágens, amely Monte Carlóba igyekszik, először egy 
San Francisco-Párizs járatot vizsgál meg, majd amikor ismeri a pontos indulási és érkezési 
dátumokat, foglalkozhat a reptérre kijutás, illetve az onnan továbbjutás problémájával. 

Azt az általános stratégiát, mely szerint egy választást késleltetünk egy keresés s0- 
rán, legkisebb megkötés (least commitment) stratégiának nevezzük. A legkisebb 
megkötésnek nincs formális definíciója, és nyilvánvaló, hogy valamennyi megkötés 
szükséges, különben a keresés nem haladna. Az informális definíció ellenére a legkisebb 
megkötés nagyon hasznos megközelítés annak meghatározására, hogy a döntéseket mi- 
kor kell meghozni egy keresési problémában. Az első példánk jóval egyszerűbb, mint 
egy nyaralás megtervezése. Vegyük a cipőfelvétel egyszerű esetét. Ezt formálisan a kö- 
vetkező tervkészítési problémával írhatjuk le: 


Cél(JobbCipőFenn A BalCipőFenn) 

KiindulásO 

CselekvésíJobbCipő, ELŐFELTÉTEL: JobbZokniFenn, KÖVETKEZMÉNY: JobbCipőFenn) 
Cselekvést(JobbZokni, KÖVETKEZMÉNY: JobbZokniFenn) 

Cselekvés(BalCipő, ELŐFELTÉTEL: BalZokniFenn, KÖVETKEZMÉNY: BalCipőFenn) 
Cselekvés(BalZokni, KÖVETKEZMÉNY: BalZokniFenn) 


; "Technikailag a STRIPS-alapú tervkészítés PSPACE-teljes. kivéve, ha a cselekvéseknek csak pozítív előfel- 
tételei vannak egy következmény literáilal (Bylander, 1994). 
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A tervkészítőnek két cselekvéssorozattal kell előállnia, a JobbZokni-t a JobbCipő kö- 
veti, hogy a cél első konjunktját elérjük és a BalZokni-t a BalCipő követi a második 
konjunkthoz. A két cselekvéssorozat kombinálható, hogy teljes tervet nyerjünk. Így a 
tervkészítő a két részsorozatot egymástól függetlenül kezelheti anélkül, hogy felállíta- 
na bármi megkötést arra, hogy az egyik sorozat egy cselekvése a másikéhoz képest 
előbb vagy később következik. Bármely olyan tervkészítő algoritmust, ami két cselek- 
vést be tud illeszteni egy tervbe anélkül, hogy meghatározná azok sorrendjét, részben 
rendezett tervkészítőnek nevezünk (partial-order planner). A 11.6. ábra a cipő és 
zokni felvételére készített részben rendezett tervet szemlélteti. Vegyük észre, hogy a 
megoldást a cselekvések gráfja ábrázolja, nem egy szekvencia. Érdemes megfigyelni az 
Indít és a Befejez ,technikai" cselekvéseket, melyek a terv kezdetét, illetve végét jelölik. 
Ezeket cselekvésnek nevezni egyszerűsíti a dolgokat, mert így a terv minden lépése egy 
cselekvés. A részben rendezett megoldás hat teljesen rendezett megoldásnak felel meg, 
melyek mindegyike a részben rendezett megoldásnak egy sorba rendezése (linearization). 


Részben rendezett terv: Teljesen rendezett tervi 


























11.6. ábra. Egy részben rendezett terv a zokni és a cipő felvételéhez, és a hat lehetséges sorba rendezés 
a teljesen rendezett tervhez 


A részben rendezett tervkészítés megvalósítható, mint egy keresés a részben rende- 
zett tervek terében. (Ezentúl ezeket egyszerűen csak ,.terv"-nek nevezzük.) Egy üres 
tervvel indulunk. Ezután a terv finomításának módjait keressük egészen addig. míg elő 
nem állunk a teljes tervvel, ami megoldása a problémának. A cselekvések ebben a kere- 
sésben nem a való világ cselekvései, hanem terveken végrehajtott műveletek: egy lépés 
hozzáadása a tervhez, a cselekvésekhez egy sorrend rendelése, ami egy cselekvést egy 
másik elé helyez és így tovább. 

A továbbiakban definiálni fogjuk az RRT algoritmust a részben rendezett tervkészí- 
téshez. Hagyományosan az RRT-t mint egy önálló programot szokás bemutatni, ehelyett 
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mi a részben rendezett tervkészítést, mint a keresési probléma egy példányát fogjuk 
megfogalmazni. Ez lehetővé teszi, hogy az alkalmazható tervfinomító lépésekre kon- 
centráljunk ahelyett, hogy azt vizsgálnánk, hogyan térképezi fel a keresési teret az algo- 
ritmus. Valójában, ha a keresési feladatot megfogalmaztuk a nem informált vagy heu- 
risztikus keresési módszerek széles választéka áll rendelkezésre. 

Emlékezzünk vissza, hogy a keresésünk állapotai (többnyire még befejezetlen) tervek 
lesznek. Hogy elkerüljük a valós cselekvésekkel való keveredést, itt tervekről és nem 
állapotokról fogunk beszélni. Minden terv a következő négy komponensből áll, ahol az 
első kettő a terv lépéseit definiálja, míg az utolsó kettő naplózásra szolgál, hogy abból 
meghatározzuk, hogyan bővíthetők a tervek: 


s Cselekvések (actions) halmaza, amelyek a terv lépéseit adják. Ezeket a tervkészíté- 
si probléma cselekvéshalmazából vesszük. Egy , üres" terv csak az Indít és a Befe- 
jez cselekvéseket tartalmazza. Az Indít-nak nincsenek előfeltételei, míg a következ- 
ményrésze a tervkészítési feladat kiindulási állapotának literáljait tartalmazza. A Be- 
fejez cselekvésnek nincsen következmény része, míg előfeltételei megegyeznek a 
célállapot literáljaival. 

s. Rendezési kényszerek (ordering constraints). Minden rendezési kényszer A - B ala- 
kú, amit ,,B előtt A7-nak olvasunk, és azt jelenti, hogy az A-t valamikor a 8 előtt kell 
végrehajtani, de nem feltétlenül közvetlen előtte. A rendezési kényszerek egy meg- 
felelő részben rendezést kell leírjanak. Bármilyen ciklus (mint az A - 8 ésa B-x A) 
ellentmondást jelent, ezért olyan rendezési kényszer nem adható a tervhez, amely 
ciklust hozna létre. 

s Okozati kapcsolatok (causal links). Az A és B cselekvések közötti okozati kapcso- 
latott4—5 B-vel jelöljük és úgy olvassuk, hogy ,,A teljesíti p-t B-hez". Például a 
JobbZokni szélen, JobbCipő okozati kapcsolat jelentése, hogy a JobbZok- 
niFenn egy következménye a JobbZokni cselekvésnek és előfeltétele a JobbCipő- 
nek. Tartalmazza azt a megkötést is, hogy a JobbZokniFenn-nek igaznak kell marad- 
tia a JobbZokni cselekvéstől a JobbCipő cselekvésig. Más szavakkal, a terv nem min- 
dig bővíthető egy új C cselekvéssel, ami ütközik egy okozati kapcsolattal. Egy C 
cselekvés ütközik az 4—£5 B-vel, ha C következménye a —p, és ha C az A után és 
B előtt jöhet (a rendezési kényszereknek megfelelően). Néhány szerző az okozati 
kapcsolatokat védett tartományoknak (protection intervals) nevezi, mert az 
4A—tEO B megvédi p-t a negálástól az A-B intervallumban. 

" Nyitott előfeltételek (open preconditions). Egy előfeltétel nyitott, ha nem teljesül 
a terv egy akciójának batására. A tervkészítők feladata, hogy a nyitott előfeltételek 
halmazát üres halmazra csökkentse, ellentmondások bevezetése nélkül. 


Például a 11.6. ábrán bemutatott teljes terv a következő komponenseket tartalmazza 
(nem tüntettük fel a rendezési kényszereket, amelyek minden cselekvést az indít után 
és a Befejez elé helyeznek): 


Cselekvések:[ JobbZokni, JobbCipő, BalZokni, BalCipő, Indít, Befejez) 

Rendezések: (JobbZokni - JobbCipő , BalZokni - BalCipő) 

Kapcsolatok: ( JobbZokni —szdífen  , JobbCipő , BalZokni — eezesirem . , BalCipő , 
dJobbCipő ——erres , Befejez, BalCipő —eSerem , Befejez) 

Nyitott előfeltételek: () 
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Konzisztens tervnek (consistent plan) nevezzük azt a tervet, amelyben nincsenek 
ciklusok a rendezési megkötésekben és nincsenek ellentmondások az okozati kapcsola- 
tokkal. Egy konzisztens terv, mely nyitott előfeltételektől mentes, a megoldás (solution). 
Rövid gondolkodással belátható: egy részben rendezett megoldás minden sorba rendezése 
egy teljesen rendezett megoldás, melynek végrehajtása az induló állapotból egy célálla- 
petra vezet. Ez annyit tesz, hogy a , terv végrehajtását" a teljesen rendezett tervekről 
kiterjeszthetjük a részben rendezett tervekre. Egy részben rendezett terv végrehajtása 
során ismétlődően mindig választunk egy következő cselekvést, a lehetséges követke- 
ző cselekvések bármelyikét. A 12. fejezetben látni fogjuk, hogy az ágens számára a terv 
végrehajtásának rugalmassága nagyon hasznos lehet, ha a környezet nem az elvártaknak 
megfelelően működik. A rugalmas sorrendezés egyszerűsíti a kisebb tervek összekom- 
binálását nagyobbakká, mert minden részterv átrendezheti a cselekvéseinek sorrendjét, 
hogy elkerülje a más tervekkel való ütközést. 

Most már készen állunk arra, hogy formalizáljuk azt a keresési problémát, amit az RRT 
megold. Egy olyan formalizálássai kezdünk, ami az ítéletlogikai tervkészítési problémák- 
ra alkalmas, az elsőrendű logikai megoldással járó komplikációkat későbbre hagyjuk. Mint 
rendszerint, a definíció tartalmazza a kiinduló állapotot. a cselekvéseket és a céltesztet. 


s. A kiindulási terv egy Indít és egy Befejez cselekvést, egy indít - Befejez rendezést 
tartalmaz, és nincsenek okozati kapcsolatok. A Befejez minden előfeltétele nyitott. 
". Az állapotátmenet-függvény önkényesen kiválasztja B egy p nyitott előfeltételét és 
legenerál egy következő tervet egy A cselekvés minden olyan lehetséges konzisztens 
megválasztásához, mely teljesíti p-t. A konzisztenciát a következőképp biztosítjuk: 
1. Az A—?) B okozati kapcsolatot és az A - B rendezési megkötést hozzáadjuk a 
tervhez. Az A cselekvés lehet a terv egy már létező vagy egy új cselekvése, Ameny- 
nyiben új, hozzáadjuk a tervhez az Indít A A és az A - Befejez megkötésekkel. 
2. Feloldunk minden konfliktust, az új okozati kapcsolat és az összes létező cselek- 
vés, valamint az A cselekvés (ha új) és minden létező okozati kapcsolat között. 
Egy az A —5 B és C között fennálló konfliktust azáltal oldunk fel, hogy C-t vala- 
mikor kívül helyezzük a védett intervallumon aB - C vagy aC - A hozzáadásával. 
Amennyiben konzisztens tervet adnak, beszúrjuk a követő állapotokat, valamelyik- 
hez vagy akár mindkettőhöz. 
s A célteszt ellenőrzi, hogy a terv megoldása-e az eredeti tervkészítési problémának. 
Mivel csak konzisztens terveket állítunk elő, a céltesztnek csak azt kell ellenőrizni. 
hogy vannak-e nem nyitott előfeltételek. 


Emlékezzünk, hogy keresési algoritmus által vizsgált cselekvések ebben a felírásban 
sokkal inkább tervfinomító lépések, mint valós cselekvések a feladattérből. Az út költ- 
sége ezért szigorú értelembe véve irreleváns, hiszen az egyetlen ami fontos, az azon terv 
valós cselekvéseinek költsége, amire ez az út vezetett. Mindazonáltal lehetséges egy út- 
vonalköltség-függvény specifikálása, ami a valós terv költségeit tükrözi: minden valós 
cselekvésnek a tervhez való hozzáadását egységnyi költséggel, míg a finomító lépéseket 
0 költséggel vesszük figyelembe. Így g(n), ahol n a terv, egyenlő lesz a tervben találha- 
tó valós cselekvések számával. Egy heurisztikus A(r)) becslés szintén alkalmazható. 
Első ránézésre azt gondolhatjuk, hogy az állapotátmenet-függvénynek minden nyitott 
P-hez tartalmaznia kellene egy következő állapotot, nem csak egyhez. Ez azonban, 
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redundáns lenne és nem lenne hatékony, ugyanazon okból, amiért a kényszerkielégítési 
algoritmusok nem szúrnak be minden lehetséges változóhoz utódot: a nyitott előfeltételek 
kezelési sorrendje (csakúgy. mint a kényszetkielégítési probléma változóinak kezelési sor- 
rendje) kommutatív. (Lásd 187. oldal.) Így tetszőleges sorrendet választhatunk, és az algo- 
ritmusaink még mindig teljesek. A helyes rendezés megválasztása gyorsabb kereséshez 
vezethet, de minden sorrendezés ugyanazokra a megoldásjelöltekre vezet. 





Példa a részben rendezett tervkészítésre 


Most nézzük meg, hogy az RRT hogyan oldja meg a 11.1. alfejezetben szereplő pótke- 
rék problémát. A probléma a leírását a 1 1.7. ábrán megismételjük. 





Kiindulás(Ot(LaposKerék, Tengely) A Or(Pótkerék, Csomagtartó) 
CéKOmMPőtkerék, Tengely)) 
Cselekvés( Eltávolíx Pótkerék, Csomagtartó), 

ELŐFELTÉTEL: Ott(Pótkerék, Csomagtartó) 

KÖVETKEZMÉNY: -On(Pőtkerék, Csomagtartó) N OmPótkerék, Föld) 
Cselekvés( Eltávolít LaposKerék, Tengely), 

ELŐFELTÉTEL: Ott(LaposKerék, Tengely) 

KÖVETKEZMÉNY: -Ot(LaposKerék, Tengely) A Ort(LaposKerék, Föld)) 
Cselekvés( Felszerel(Pótkerék, Tengely), 

FELŐFELTÉTEL; Or(Pótkerék, Föld) A -Ot(LaposKerék, Tengely) 

KÖVETKEZMÉNY: -Orr(Pótkerék, Föld) A Om(Pótkerék, Tengely) 
Cselekvés(OtthagyÉjszakára, 

FELŐFELTÉTEL: 

KÖVETKEZMÉNY: -Ott(Pótkerék, Föld) A -OrmPótkerék, Tengely) N -Ott(Pótkerék, Csomagtartó) 

N -OrLaposkerék, Föld) N -Orr(Laposkerék, Tengely)) 











11.7. ábra. Az egyszerű kerékcsere probléma 


A megoldás keresése egy kezdeti tervből indul, ami egy /ndít cselekvést tartalmaz az 
Or Pótkerék, Csomagtartó) A Ot(LaposKerék, Tengely) következménnyel és egy Be- 
fejez cselekvést az Ot(Pótkerék, Tengely) előfeltétellel. Ezután követő állapotokat állí- 
tunk elő úgy, hogy egy nyitott előfeltételt választunk a munkához (visszavonhatatlanul), 
majd választunk az ehhez vezető lehetséges cselekvések közül. Most nem foglalkozunk 
a heurisztikákkal, amik segíthetik ezt a döntést; látszólag véletlenszerű döntést hozunk. 
Az események sorrendje a következő: 


1. Vegyük az egyetlen nyitott előfeltételt, a Befejez cselekvés Orr(Pórkerék, Tengely) 
feltételét. Válasszuk ki az egyetlen alkalmazható cselekvést, a FelszerekPótkerék, 
Tengely)-t. 

2. Vegyük a FelszerekPótkerék, Tengety) cselekvés Or(Pótkerék, Föld) előfeltételét. 
Válasszuk az EltávolítíPótkerék, Csomagtartó) cselekvést, ami az egyetlen alkal- 
mazható cselekvés az előfeltéte! biztosításához. A végső terv a 11.8. ábrán látható. 
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OtPótkerék, Csomagtartá  Eltávolít(Pótkerék, 








Csomagtartó) 
jOmPótkerék, Csomagtartó) -OniPótkerék, Főbd Tr 
indít OnPórkerék, [/Befejez ) 
OttlLaposkerék, Tengely) "Ok(Laposkarék, Tengely Te Te gy) 


11.8. ábra. A nem teljes részben rendezett terv a kerékcsere problémához, miután megválasztottuk a cse- 
lekvéseket az első két nyitott előfeltételhez. A dobozok cselekvéseket testesítenek meg, a bal oldalon az 
előfeltételekkel, a jobb oldalon pedig a következményekkel. (Az Indír cselekvést kivéve a következ- 
ményeket elhagytuk.) A fekete nyilak az okozati kapcsolatokat mutatják, melyek a nyíl fejénél szereplő 
állítást védik. 


3. Vegyük a FelszerelPótkerék, Tengely) cselekvés -Ot(LaposKerék, Tengely) elő- 
feltételét. Hogy ellenkezzünk egy kicsit, válasszuk az OtthagyÉjszakára cselekvést, 
a kézenfekvő Eltávolí(LaposKerék, Tengely) helyett. Vegyük észre, hogy az 
OtthagyÉjszakára cselekvésnek szintén következménye a -Ott(Pótkerék, Föld), 
ami ütközik az 


Eltávolít( Pótkerék, Csomagtartó) —rfőlerk Hb. , Felszerel( Pótkerék, Tengely) 


okozati kapcsolattal. Hogy feloldjuk ezt az ütközést, egy rendezési megkötést illesz- 
tünk be, ami az OrrhagyÉjszakára cselekvést az Eltávolír(Pótkerék, Csomagtartó) 
elé rendeli. Az így előálló terv a 11.9. ábrán látható. (Miért oldja ez fel az ütközést 
és miért nincs erre más lehetőség?) 

4. Most az egyetlen fennmaradó nyitott előfeltétel az Ort(Pótkerék, Csomagtartó), ami 
az Eltávolít Pótkerék, Csomagtartó) cselekvés előfeltétele. Az egyetlen cselekvés, 
ami ezt elérheti, a meglévő Indít cselekvés, de az indít és az Eltávolí(Pótkerék, 
Csomagtartó) közötti okozati kapcsolat ütközik az OtthagyÉjszakára cselekvés 
-OmPótkerék, Csomagtartó) következményével. Most nincs mód arra, hogy fel- 
oldjuk az ütközést az OrthagyÉjszakára cselekvéssel: nem sorolhatjuk az Indít elé 
(mert semmi nem kerülhet az Indít elé), és nem rendelhető az Eltávolít(Pótkerék. 
Csomagtartó) után (mert már van egy rendezés, ami elé helyezi). Ezért muszáj 
visszalépnünk, törölnünk az Eltávolít Pótkerék, Csomagtartó) cselekvést és a két 
utolsó okozati kapcsolatot, és visszalépnünk a 11.8. ábrán bemutatott állapothoz. 


OtiPótkerák, Tengely) [ EltávolítíPótkerék, 














Csomagtartó) 
JOMPőtkerék. Csomagtartój  f OMmPötkerék, FOK — 
Len] orzaposkerék Tenget / 70 ék. Ti ászzzégygzzlái fugősstsetgi Befejez 


ő (Laposkarók. Te 
Esés ESZÉT, 
"Csornagtartó 


11.9. ábra. A terv alakulása, az OrhagyÉjszakára választása után, amit a -Ot(LaposKerék, Tengely) 
eléréséhez választottunk. Hogy elkerüljük az ütközést az Or(Pótkerék, Csomagtartó)-t védő. az Eltávo- 
lí(Pótkerék, Csomagtartó)-ból induló okozati kapcsolattal, az OrthagyÉjszakára cselekvést egy rende- 
zési megkötéssel az Eltávolít(Pótkerék, Csomagtartó) elé helyeztük, amit a szaggatott nyíllal jelöltünk. 
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Összefoglalva, a tervkészítő bebizonyította, hogy az OrthagyÉjszakára nem hasz- 
nálható fel kerékcserére. 

5. Vegyük újra a Felszerel(Pótkerék, Tengely) cselekvés -Or(LaposKerék, Tengely) 
előfeltételét. Ez alkalommal válasszuk az Eltávolítt LaposKerék, Tengely) cselekvést. 

6. Vegyük újra az Eltávolít Pótkerék, Csomagtartó) cselekvés Ort(Pótkerék, Csomag- 
tartó) előfeltételét, és válasszuk az indít cselekvést, hogy ezt elérjük. Ez alkalommal 
nincsenek ütközések. 

7. Vegyük az Eltávolít( LaposKerék, Tengely cselekvés Ot(LaposKerék, Tengely) elő- 
feltételét, valamint ennek eléréséhez az indít cselekvést. Ez egy teljes és konzisztens 
tervet ad, vagy más szavakkal egy megoldást, amint azt a 11.10. ábra mutatja. 


OttPótkerék, Csornagtartó) [ Eltávolít(Pótkerék, 
S fCsomagtartó) 





























OtíLaposkerék,[ Ej 
Tengely Tengely) 





11.10. ábra. A kerékcsere probléma végső megoldása, Vegyük észre, hogy az EltávolítPótkerék, 
Csomagtartó) és az Eltávolí(LaposKerék, Tengely) tetszőleges sorrendben végrehajtható a Felsze- 
reltPótkerék, Tengely) előtt. 


Bár ez a példa nagyon egyszerű, jól szemlélteti a részben rendezett tervkészítés erős- 
ségét. Először is az okozati kapcsolatok a keresési tér (fa) egy korai szűkítéséhez met- 
széséhez vezettek, mert kizártak olyan területeket, amelyek a feloldhatatlan ütközések 
miatt nem tartalmaznak megoldásokat. Másodszor a 11.10. ábra megoldása egy részben 
rendezett terv. Ebben az esetben ennek előnye nem nagy, mert csak két lehetséges sorba 
rendezés létezik, mégis egy ágens számára előnyös lehet ez a rugalmasság, például ha 
a kereket sűrű forgalomban kellene lecserélni. 

A példa szintén rámutat néhány javítási lehetőségre. Például egy próbálkozás duplán tör- 
tént: az Indít az Eltávolít(Pótkerék, Csomagtartó) cselekvéshez kapcsolódik még mielőtt 
az ütközés visszalépést váltana ki, és a visszalépés hatására a kapcsolat felbomlik, bár nem 
vesz részt az ütközésben. A keresés folytatásakor a kapcsolat újra létrejön. Ez tipikus az 
időrendi visszalépés esetén és elkerülhető, ha függőségvezérelt visszalépést használunk. 


Részben rendezett tervkészítés kötetlen változókkal 


Ebben a fejezetben a változókat tartalmazó elsőrendű cselekvés reprezentációra alkal- 
mazott részben rendezett tervkészítés során felmerülő komplikációkkal foglalkozunk. 
Tegyük fel. hogy a kockavilág (lásd 11.4. ábra) problémát kell megoldani a Rajta(A, B) 
nyított előfeltételtel és a 


Cselekvés(Mozgattb, x, y), 
ELŐFELTÉTEL: Rajta(b, x) A Üres(x) A Üres(y) 
KÖVETKEZMÉNY: Rajtatb, y) A Üres(x) A —RRajtatb, x) A -Üresty)) 
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cselekvéssel. Ez a cselekvés teljesíti a Rajta(A, B) Kterált, mert a Rajta(b, u) következ- 
mény egyesíthető a Rajta(A, B)-vel a (b/A, y/B) behelyettesítéssel. Alkalmazzuk tehát 
ezt a behelyettesítést a cselekvésre, aminek az eredménye a 


Cselekvés(Mozgak(A, x, B), 
ELŐFELTÉTEL: Rajta(A, x) A Üres(x) A Üres(B) 
KÖVETKEZMÉNY: Rajta(A, B) A Üres(x) A -Rajtatb, x) A -Üres(B)) 


Ez az x változót kötetlenül hagyja. Ez annyit tesz, hogy a cselekvés annyit mond, hogy 
mozgasd A-t valahonnan, de azt nem, hogy honnét. Ez egy másik példa a legkisebb 
megkötés elvre: elhalaszthatjuk a döntéseket egészen addig, amíg a terv egy másik 
lépése ezt meghozza nekünk. Tegyük fel például, hogy a Rajta(A, D) a kiinduló állapo- 
tunk. Az x-et D-vel behelyettesítve az indít cselekvés használható fel, hogy elérjük a 
Rajta(A, x)-et. A módszer, hogy több információt kivárunk, mielőtt megválasztjuk x-et, 
gyakran sokkal hatékonyabb, mint az x minden értékének kipróbálása és a visszalépés. 
ha ez sikertelen. 

A változók jelenléte az előfeltételekben és a cselekvésekben nehezíti az ütközések 
detektálását és feloldását. Például amikor a MozgattA, x, B) a terv része lesz, a 


Mozgat( A, x,By—IA Ba, Befejez 


okozati kapcsolatra ís szükség van. Ha van egy M2 cselekvés -Rajta(A, 2) következ- 
ménnyel, akkor ez csak akkor okoz ütközést, ha a z értéke B. Hogy kezeljük ezt a lehe- 
tőséget, kiterjesztjük a tervek reprezentációját, hogy tartalmazzanak z :- X alakú egyen- 
lőtlenségi kényszereket (ineguality constraints), ahol z egy változó és X egy változó 
vagy egy konstansszimbólum. Ebben az esetben az ütközést a z z B hozzáadásával 
oldhatjuk fel. ami azt jelenti hogy a terv később 8 kivételével bármire behelyettesítheti 
2-t. Bármikor amikor egy behelyettesítést hajtunk végre a tervben, ellenőriznünk kell, 
hogy az nem ellenkezik-e az egyenlőtlenségi korlátokkal. Például egy x/y behelyettesí- 
tés ütközik az x z y kényszerrel. Az ilyen ellentétek nem oldhatók fel, ezért a terv- 
készítő visszalépésre kényszerül. 

A 12.6. alfejezetben egy bővebb példát adunk a részben rendezett tervkészítésre, ami 
a változókat tartalmazó kockavilág probléma. 


Heurisztikák a részben rendezett tervkészítésre 


A teljesen rendezett tervkészítéssel összehasonlítva a részben rendezett tervkészítés 
egyértelmű előnye, hogy a probléma részfeladatokra bontható. A hátránya, hogy nem 
reprezentálja megfelelően az állapotokat, így nehezebb megbecsülni, hogy a részben 
rendezett terv milyen messze van a céltól. Jelenleg jóval kevesebb az ismeretanyag 
arról, hogy hogyan adható pontos heurisztika a részben rendezett tervkészítéshez, mint 
a teljesen rendezett tervkészítések esetén. 

A legkézenfekvőbb heurisztika, hogy megszámoljuk az eltérő nyitott előfeltételeket. 
Ez javítható azáltal, ha kivonjuk azon nyitott előfeltételek számát, melyek illeszked- 
nek az /ndír állapot egy literáljaival. Hasonlóan a teljesen rendezett esethez ez túl- 
becsüli a költséget, ha vannak cselekvések, melyek több célt érnek el. és alulbecsül, ha 
negatív kölcsönhatások vannak a terv lépései között. A következő alfejezet egy olyan 
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megközelítést mutat be, ami lehetővé teszi, hogy sokkai pontosabb heurisztikákat kap- 
junk egy retaxált problémából. 

A beurisztikus függvényt arra használjuk, hogy kíválasszuk a tovább finomítandó 
tervet. Ezzel a választással az algoritmus követő állapotokat generál egyetlen kiválasz- 
tott nyitott előfeltételből kiindulva. Mint a változókiválasztás a kényszerkielégítési 
algoritmusban, ez a választás nagy hatással van a hatékonyságra. A kényszerkielégítési 
probléma legjobban-korlátozott-változó (most-constrained-variable) heurisztikája 
alkalmazható a tervkészítő algoritmusokra, és látszólag jól működik. Az alapötlet, hogy 
válasszuk azt a nyitott feltételt, mely a lehető legkevesebb módon elégíthető ki. Ennek 
a heurisztikának két speciális esete van. Először, ha egy nyitott feltétel nem érhető el 
egyetlen cselekvéssel sem, akkor a heurisztika kiválasztja. Ez jó ötlet, hiszen a teljesít- 
hetetlenség korai érzékelése sok munkát megspórolhat. Másodszor, ha egy nyitott felté- 
tel csak egyféleképp teljesíthető, akkor célszerű kiválasztani, hiszen ez egy elkerülhe- 
tetlen döntés, ami további megkötéseket eredményezhet a későbbi választásokhoz. Habár 
minden nyitott feltételhez meglehetősen költséges kiszámolni, hogy azok hányféleképpen 
teljesíthetők, és ez nem is mindig éri meg, a kísérletek azt mutatják, hogy a két speciális 
eset kezelése jelentős gyorsulást eredményezhet. 


11.4. TERVKÉSZÍTÉSI GRÁFOK 


Az összes javasolt heurisztika a teljesen rendezett és a részben rendezett tervkészítésre 
pontatlanságokkal terhelt. Ez a fejezet bemutatja, hogy egy speciális adatszerkezet a 
tervkészítési gráf (planning graph) felhasználható, hogy jobb heurisztikus becsléseket 
nyerjünk. Ezek a heurisztikák bármely eddig tárgyalt keresési technikával használhatók. 
Egy másik lehetőség, hogy a megoldást közvetlenül a tervkészítési gráfból nyerjük ki 
egy erre kiélezett algoritmussal, mint amilyen például a GRAPHPLAN. 

A tervkészítési gráf a terv időrendi lépéseinek megfelelő szintekből áll, ahol a 0-dik szint 
a kiinduló állapot. Minden szin egy literálhalmazt és egy cselekvéshalmazt tartalmaz. A li- 
terálok durván azok, melyek igazak lehetnek az adott lépésnél, az addig végrehajtott cse- 
lekvések függvényében. Ismét durván fogalmazva, a cselekvések azok, melyeknek az elő- 
feltételei teljesülhetnek az adott időlépésben attól függően, hogy aktuálisan mely literálok 
teljesülnek. Azért mondjuk, hogy , durván", mert a tervkészítési gráf csak a cselekvések 
közötti lehetséges negatív kölcsönhatások egy korlátozott részhalmazát tartalmazza, ezért 
a tervkészítési gráf optimista lehet a literál teljesítéséhez szükséges minimális lépések szá- 
mával kapcsolatban. Mindazonáltal a tervkészítési gráfban ez a lépésszám egy jó becslés 
arra, hogy milyen nehéz egy literált teljesíteni a kiindulási állapotból. Még fontosabb, hogy 
a tervkészítési gráfot úgy definiáltuk, hogy könnyen elkészíthető legyen. 

A tervkészítési gráf csak ítéletlogikai tervkészítési problémákra alkalmazható — olya- 
nokra, melyek nem tartalmaznak változókat. Ahogy a II.1. alfejezetben említettük, 
mind a STRIPS, mind az ADL reprezentáció ítéletlogikára alakítható. A nagyszámú 
entitást tartalmazó problémákat ez jelentősen felduzzaszthatja a cselekvéssémák szá- 
mában. Ennek ellenére a tervkészítési gráfok hatékony eszköznek bizonyultak a nehéz 
tervkészítési problémák megoldásában. 

A tervkészítési gráfokat egy egyszerű példán mutatjuk be. (Az összetettebb feladatok 
olyan gráfhoz vezetnek, amelyek nem férnének ki egy oldalra.) A 11.11. ábra a feladatot, 
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míg a 11.12. ábra az ehhez tartozó gráfot mutatja. Az $p állapotszintről indulunk, ami a 
probléma kiinduló állapotának felel meg. Ezt az Ag cselekvésszinttel folytatjuk, amibe 
azokat a cselekvéseket helyezzük, melyek előfeltételei az előző szinten teljesülnek. 
Minden cselekvés össze van kötve az 59-ban található előfeltételeivel, illetve az 51-ben 
található következményeivel, ami ebben az esetben az Sp-ban nem szereplő literálok 
bevezetését jelenti S-ben. 








Kiindulás(Van(Süti)) 
CélrVan(Süti) A Megever(Süti)) 
CselekvéstEszik( Süti) 

ELŐFELTÉTEL: Van(Süti) 

KÖVETKEZMÉNY: oVan( Süti) A MegevettiSüti)) 
Cselekvés(Sür Süti) 

ELŐFELTÉTEL; oVar(Süti) 

KÖVETKEZMÉNY: Var(Sütí)) 











11.11. ábra, A legyen süti és együnk is" probléma 


A tervkészítési gráfnak a nem cselekvést ugyanúgy kell reprezentálni, mint a csetek- 
véseket. Ez annyit tesz, hogy a szituációkalkulus keretaxiómáinak megfelelő műkö- 
désre van szükség, ami alapján egy literál két állapon keresztül igaz maradhat, ha nincs 
ezt módosító cselekvés. Egy tervkészítési gráfban ezt megőrző cselekvésekkel 
(persistence actions) oldjuk meg. Minden pozitív és negatív C literálhoz egy megőrző 
cselekvést szúrunk be C előfeltétellel és C következménnyel. A 11.12. ábra az Ag szin- 
ten egyetlen , valós" cselekvést az Eszik(Süti)-t tartalmazza, két megőrző cselekvéssel, 
amit kicsi négyzetek jelölnek. 

Az Ag tartalmazza az összes cselekvést, ami az §g állapotban előfordulhat, de ugyan- 
ilyen fontos, hogy rögzíti a cselekvések közötti ütközéseket is, amelyek megakadályoz- 
zák, hogy egyszerre történjenek. A 11.12. ábra szürke vonalai ezeket a kölcsönös kízá- 
rási (mutual exclusions vagy mutex) kapcsolatokat jelölik. Például az Enni(Süti) köl- 
csönös kizárásban van a Van(Süti) vagy a -Megevett(Süti) megőrzésével. Hamarosan 
látjuk, hogy a mutex kapcsolatokat hogyan számíthatjuk. 

Az §) az összes olyan literált tartalmazza, ami az Ag szint akcióinak bármely rész- 
halmazát választva elérhető. Szintén tartalmaz mutex kapcsolatokat (szürke vonalakat) 





§ Ag S Az Sz 
Van sat) a Van sú Va St) 
e £. "vanisag -vansan 
[ES] NN 
"MegevetSút) - Megevett Süt) 


— Megevett Süt) 7 Megevetk Süt) ——t megevett Süt) 


11.12. ábra. A ,Jegyen süti és együnk is" probléma tervkészítési gráfja az 52 szintig. A téglalapok az ak- 
ciókat jelentik (a kicsi négyzetek a megőrző cselekvések), az egyenesek az előfeltételeket és a következ- 
ményeket jelölik. A kölcsönös kizárásokat ívelt szürke vonalak jelölik. 
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jelölve az olyan literálokat, melyek nem teljesülhetnek egyszerre, a választott cselek- 
vésektől függetlenül. Például a Van(Süti) és a MegevettíSüti) kölcsönösen kizárják 
egymást. Az Ag kiválasztott cselekvéseitől függően az eredmény vagy az egyik vagy a 
másik lehet, de a kettő egyszerre nem. Más szavakkal az S4, csakúgy, mint a regresszi- 
ós állapottér-keresés, több állapotot reprezentál, a kizárási kapcsolatok pedig kénysze- 
rek, melyek a lehetséges állapotok halmazát definiálják. 

És ez így megy tovább. Az S; állapot- és az A; cselekvésszintek között mozgunk, 
egészen addig, míg elérünk egy szintet, ahol két egymást követő szint azonos. Ekkor 
azt mondjuk, hogy a gráf kiegyenlítődött (leveled off). Minden egymást követő szint 
azonos, így további kiterjesztésre nincsen szükség. 

Egy olyan struktúrát kaptunk, ahol az A; szint tartalmaz minden 5/-ben alkalmazható 
cselekvést, a kényszerekkel együtt, melyek megmondják, hogy melyik cselekvéspár 
nem hajtható végre egyidejűleg. Minden S; szint tartalmazza az összes literált, ami az 
A; 1 összes lehetséges cselekvéshalmazának hatására teljesül, a kényszerekkel együtt, 
amelyek a nem lehetséges literálpárokat jelölik ki. Fontos megjegyezni, hogy a terv- 
készítési gráf elkészítési folyamatához mem kell választanunk a cselekvések között, ami 
kombinatorikus keresést eredményezne. Ezzel szemben, a tervkészítési gráf konstruk- 
ciója csak a lehetetlen választásokat rögzíti, mutex kapcsolatok felhasználásával. Egy 
ilyen tervkészítési gráf elkészítésének bonyolultsága egy alacsonyrendű polinomiális 
komplexitás a cselekvések számát tekintve, ahol az állapottér exponenciális a líterálok 
számában. 

Most mutex kapcsolatokat definiálunk, mind a cselekvések, mind a literálok számá- 
ra. Egy adott szinten, a mutex kapcsolat akkor érvényes két cselekvés között, ha a kö- 
vetkező három feltétel valamelyike fennáll: 


e Inkonzisztens hatások: egy cselekvés negálja egy másik következményét. Például az 
EsziktSüti) és a Van(Süti) megőrzése inkonzisztens hatású, mert a Van(Süti) követ- 
kezmény tekintetében ellentétesek. 

s Interferencia: egy cselekvés egyik következménye a negálása egy másik cselekvés 
előfeltételének. Például az Eszik(Sűti) interferál a Var( Süti) megőrzésével, mert ne- 
gálja az előfeltételét. 

s Versenyhelyzet: egy cselekvés előfeltétele kölcsönösen kizáró egy másik előfeltéte- 
lével. Például a Süt(Süti) és az Eszik(Sütí) mutexek, mert versenyeznek a Van(Süti) 
előfeltétel tekintetében. 


Két azonos szineten lévő fiterál között mutex kapcsolat áll fenn, ha az egyik a másik ne- 
gáltja, vagy bármely lehetséges cselekvéspár, amely a két literált elérheti, egymást köl- 
csönösen kizáró. Ezt az állapotot inkonzisztens háttérnek nevezzük. Például a Van(Süti) 
és a Megevettt Süti) kizárják egymást S1-ben, mert az egyetlen mód a Van(Süti) teljesíté- 
sére egy megőrző cselekvés, ami mutex a Megevett( Süti) egyetlen elérési lehetőségével, 
nevezetesen az Eszik(Süti) cselekvéssel. Az 52 szinten a két literál már nem mutex, mert 
új elérési lehetőségek vannak hozzájuk, mint a Siit(Süti) és a Megevet(Süti) megőrző 
cselekvése, melyek nem zárják ki egymást. 
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Tervkészítési gráfok heurisztikus becslésekre 


A tervkészítési gráf, ha egyszer már létrehoztuk, nagyon gazdag információforrás a 
problémáról. Például egy fiterál, ami nem található meg az utolsó szinten, egyetlen 
tervvel sem érhető el. Ez a megfigyelés a visszafelé keresésben használható a követke- 
zőképp: bármely elérhetetlen literált tartalmazó állapot költsége (ni) — co. Hasonlóan 
a részben rendezett tervkészítésnél bármely tervnek a költsége egy elérhetetlen nyitott 
előfeltétellel, An) — oo. 

Ez az ötlet tovább általánosítható. Minden cél literál elérési költségét becsülhetjük 
azzal a szinttel, ahol először megjelenik a tervkészítési gráfban. Ezt a cél szint költsé- 
gének (level cost) nevezzük. A 11.12. ábrán a Van(Süti) szint költsége 0, a Meg- 
evett(Süti) szint költsége 1. Könnyű megmutatni (lásd 11.9. feladat), hogy ezek a köze- 
lítések elfogadhatók az egyedülálló célokra. A becslés azonban lehet, hogy nem túl jó. 
mert a tervkészítési gráfok több cselekvést megengednek szintenként, míg a heuriszti- 
ka csak a szintek számát tartalmazza, és nem a cselekvések számát. Ebből kifolyólag a 
heurisztikák számításában, gyakori a soros tervkészítési gráf (serial planning graph) 
használata. A soros gráf szerint egy adott időpillanatban csak egyetlen cselekvés hajt- 
ható végre, ami mutexekkel érhető el úgy, hogy a megőrző cselekvések kivételével, 
minden cselekvés közé mutex kapcsolatot teszünk. A soros tervkészítő gráfból kinyert 
szintköltségek gyakran egész elfogadható közelítését adják a valós költségeknek. 

Három egyszerű megközelítés létezik, hogy célliterálok konjunkcióihoz költséget 
becsüljünk. A maximális szint (max-level) heurisztika egyszerűen a célok közüli maxi- 
mális szintköltségét veszi, ami elfogadható, de nem feltétlen nagyon pontos. A szint- 
összeg (level sum) heurisztika a részcél függetlenségi feltételezésből a célok szintkölt- 
ségeinek összegét adja. Ez nem elfogadható, de nagyon jól működik olyan gyakorlati 
problémákra, amelyek nagymértékben részekre bonthatók. Ez sokkal pontosabb, mint 
a 11.2. alfejezetben bemutatott nem-kielégített-célok-heurisztika. A mi feladatunkban a 
Van(Süti) A Megevett(Süti) konjunktív célhoz rendelhető heurisztikus becslés 0 -t 1 — 1, 
míg a helyes válasz 2. Mindezeken túl, ha eltávolítjuk a Sür(Stiti) cselekvést, a becslés 
még mindig I. de a konjunktív cél ekkor már elérhetetlen. Végezetül, a halmazszint 
(set-level) heurisztika azt a szintet keresi meg, ahol a konjunktív cél összes líterálja 
megjelenik a tervkészítési gráfban, és nincsenek közöttük kölcsönösen kizáró párok. 
A heurisztika a korrekt 2 értéket adja az eredeti feladatra és végtelent a Sür(Süti) nélkü- 
li feladatra. Ez előnyben van a maximális szint heurisztikával szemben, és kimagaslóan 
jól működik azon feladatokban, ahol sok kölcsönhatás van a résztervek között. 

Lévén egy pontos heurisztika készítésére szolgáló eszköz, a tervkészítési gráf tekint- 
hető úgy, mint egy relaxált probléma, ami hatékonyan megoldható. Hogy a relaxált 
probléma természetét megértsük, pontosan meg kell értenünk, hogy mit jelent, ha egy 
8 literál megjelenik a tervkészítési gráf S; szintjén. Ideális esetben garanciát szeretnénk 
arra, hogy létezik egy terv i cselekvés szinttel, ami eléri g-t, illetve ha g nem jelenik 
meg, akkor nincs is ilyen terv. Sajnos ezt garantálni majdnem ugyanolyan nehéz, mint 
megoldani az eredeti tervkészítési problémát. A tervkészítési gráf a garancia második 
részéről gondoskodik (ha g nem jelenik meg, akkor nincs terv), de ha g megjelenik, 
akkor a tervkészítési gráf csak annyit ígér, hogy van egy terv, ami várhatóan eléri g-t, 
nincsenek , nyilvánvaló" hibák. Egy nyilvánvaló definíció szerint egy olyan hiba, 
ami úgy detektálható, hogy két cselekvést vagy két literált tekintünk egyszerre, vagy más 
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szavakkal a mutex relációkat vizsgáljuk. Lehetnek összetettebb hibák, melyek három, 
négy vagy több cselekvést tartalmaznak, de a tapasztalatok azt mutatják, hogy nem éri 
meg ezekkel foglalkozni. Ez hasonló a kényszerkielégítési problémáknál tanultakkal, 
hogy a megoldás megkeresése előtt gyakan megéri a 2-konzisztencia számítás, de a 
3- vagy a magasabb konzisztencia kiszámítása ritkábban kifizetődő (lásd 5.2. alfejezet). 


A GRAPHPLAN algoritmus 


Ez a fejezet bemutatja, hogy hogyan nyerhető ki közvetlenül a terv a tervkészítési gráf- 
ból, ahelyett hogy azt csak a heurisztikákhoz használjuk. A GRAPHPLAN algoritmusnak 
(11.13. ábra) két fő lépése van, melyek ciklikusan váltakoznak. Először ellenőrzi, hogy 
minden célliterát jelen van-e az adott szinten anélkül, hogy mutex kapcsolatok lennének 
közöttük. Ebben az esetben, az aktuális gráfban lérezhet megoldás, így az algoritmus 
megpróbálja azt kinyerni. Ellenkező esetben bővíti a gráfot úgy, hogy az aktuális szint- 
hez a cselekvéseket, a következőhöz az állapotlíterálokat adja: ez a folyamat folytatódik 
addig, amíg megtaláljuk a megoldást, vagy bebizonyosodik, hogy nem létezik megoldás. 





function GRAPHPLAN(probléma) returns megoldás vagy kudarc 


gráf — KIINDULÓ-TERVKÉSZÍTÉSI-GRÁF(probléma) 
célok — CÉLokÍprobléma] 
loop do 
if célok mind nem nuitex az utolsó szintjén a gráf-nak then do 
megoldás §— MEGOLDÁS-KINYERÉS(gráf, célok, Hosszígráf)) 
if megoldás a kudarc then return megoldás 
else If Nnvcs-LEHETSÉGES-MEGOLDÁSÍgráf) then return kudarc 
gráf — GRÁF-BővíTÉSIgráf, probléma) 








11.13. ábra. A GRAPHPLAN algoritmus. A GRAPHPLAN algoritmus egy megoldás kinyerő és egy gráf- 
bővítő lépés között alternál. A MEGOLDÁS-KINYERÉS a befejezéstől visszafelé keresve ellenőrzi, hogy 
található-e megoldás. A GRÁF-Bővírés adja a cselekvéseket az adott szinthez és az állapotliterálokat a 
következőhöz. 


Kövessük végig a GRAPHPLAN működését a 11.1. alfejezet kerékcsere problémáján! 
A teljes gráf a 11.14. ábrán látható. A GRAPHPLAN első lépésben inicializálja a terv- 
készítési gráfot egy egyszintű (So szint) gráfra, ami a kiindulási állapot öt literálját tar- 
talmazza. Az Or(Pótkerék, Tengely) célliterál nincs jelen az $g-ban, ezért nem kell 
meghívnunk a MEGOLDÁS-KINYERÉST, hiszen biztosak vagyunk benne, hogy még nincs 
megoldás. Ehelyett a GRÁF-BővírÉs hozzáad három cselekvést, melyeknek az előfelté- 
tele már teljesül az Sg szinten (például az összes cselekvés, kivéve a FelszerekPótkerék, 
Tengely) - cselekvést). Hozzáadja továbbá a megőrző-cselekvéseket Sp összes literáljá- 
hoz. A cselekvések következményeit az 5 szinthez adjuk hozzá. A GRÁF-BŐVÍTÉS ezek 
után mutex kapcsolatokat keres, és hozzáadja ezeket a gráfhoz. 

Az Ow(Pótkerék, Tengely) cselekvés még mindig nincs jelen az S, állapotban, ezért 
most sem hívjuk meg a MEGOLDÁS-KINYERÉS lépést. A GRÁF-BŐVÍTÉS hívással a 11.14. 
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11.14. ábra. A kerékcsere probléma tervkészítési gráfja az S2 szintre bővítés után, A mutex kapcsolaáto- 
kat szürke vonalak jelölik. Csak néhány fontos mutexet mutatunk, mert az ábra olvashatatlanná válna, ha 
az összeset jelölnénk. A megoldást megvastagított vonalak és kiemelések jelölik. 


ábrán látható tervkészítési gráfot kapjuk. Most, hogy a cselekvések teljes skálája ren- 
delkezésre áll, ideje néhány példát nézni a mutex kapcsolatokra és a hatásaikra: 


s Nem konzisztens hatások: az Eltávolít Pótkerék, Csomagtartó) mutex kapcsolatban 
van az OtthagyÉjszakára cselekvéssel, mert az egyik következménye az Ort(Pótkerék, 
Föld), míg a másiké ennek negáltja. 

s Interferencia: az EltávolíkPótkerék, Tengely) mutex az OuhagyÉjszakára cselek- 
véssel, mert az egyiknek előfeltétele az Or((LLaposkerék, Tengely), míg a másiknak 
ennek negáltja a következménye. 

9  Versenyhelyzet: a Felszerek Pótkerék, Tengely) mutex az Eltávolít( aposkerék, Ten- 
gely) cselekvéssel, mert az egyiknek előfeltétele az Or(LLaposkerék, Tengely), míg 
a másiké ennek negáltja. 

a  Inkonzisztens tartó: az Ott(Pótkerék, Tengely) és az Ort(Laposkerék, Tengely) köl- 
csönösen kizáróak az S2-ben, mert az Ort(Pótkerék, Tengely) csak a FelszerePót- 
kerék, Tengely) cselekvéssel érhető el, ami mutex a megőrző cselekvéssel, mely az 
OrkLaposkerék, Tengely) egyetlen elérése. A mutex kapcsolatok így azonnal érzé- 
kelik a konfliktust, ami abból adódik, hogy két objektumot ugyanazon időpontban 
azonos helyre próbálunk tenni. 


Ez alkalommal visszamegyünk a ciklus kezdetére. A cél minden literálja jelen van §2- 
ben, és egyik sem áll kölcsönös kizárásban egyetlen másikkal sem. Ez azt jelenti, hogy 
egy megoldás létezhet, és a MEGOLDÁS-KINYERÉS megtalálhatja. Lényegében a MEGOL- 
DÁS-KINYERÉS egy kétértékű kényszerkielégítési problémát old meg, melynek változói a 
szintek cselekvései, és az értékeik pedig azt jelzik, hogy benne vannak-e vagy nincsenek 
benne a tervben. Ehhez egy egyszerű kényszerkietégítési algoritmust használhatunk, 
vagy definiálhatjuk a MEGOLDÁS-KINYERÉS-t mint egy keresési problémát. Itt a keresés 
minden állapota a kielégítetlen célok egy halmazát tartalmazza, valamint egy mutatót 
a tervkészítési gráf egy szintjére. Ezt a keresési problémát a következőképpen definiáljuk: 


s A kiindulási állapot a tervkészítési gráf utolsó szintje (S,) a tervkészítési probléma 
céljaival egyetemben. 
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s Az S; szint állapotában rendelkezésre álló cselekvések összessége, az A; , cselekvése- 
inek azon konfliktusmentes részhalmaza, melyek következményei elérik az állapotban 
lévő célokat. Az eredményként előálló állapot szintje S; ,, céljai pedig a kiválasztott 
cselekvések előfeltételei. A , konfliktusmentességen" olyan cselekvések halmazát 
értjük, amelyek között nincs kettő, amelyek kölcsönösen kizárnák egymást, és az elő- 
feltételeik között sem szerepelnek kölcsönösen kizáró párok. 

s A cél, hogy elérjünk az So szinten egy állapotot úgy, hogy minden cél teljesüljön. 

s Minden cselekvés költsége 1. 


Ehhez a problémához az 52 szintről indulunk, az Or(Pótkerék, Tengely) céllal. 
Az egyetlen választásunk, hogy elérjük ezt a célt, a Felszerel(Pótkerék, Tengely) cse- 
lekvés. Ez az S keresési állapothoz visz minket, melynek céljai az Or Pótkerék, Föld) 
és az -Or(Laposkerék, Tengely). Az előbbit az Eltávolít Pótkerék, Csomagtartó) cse- 
lekvéssel érhetjük el. míg a későbbit az Eltávolít(Laposkerék. Tengely) vagy az Ott- 
hagyÉjszakára cselekvések egyikével. Az OtthagyÉjszakára kölcsönösen kizáró kap- 
csolatban van a Eltávolít( Pótkerék, Csomagtartó)-val, ezért az egyetlen megoldás, hogy 
az EltávolíkPótkerék, Csomagtartó) és az Eltávolít(Laposkerék, Tengely) cselekvése- 
ket választjuk. Ez az Sp keresési állapotra vezet, az Otr(Pótkerék, Csomagtartó) és az 
OrLaposkerék, Tengely) célokkal. Mindkettő jelen van az állapotban, így megvan a 
megoldásunk: az Eltávolít Pótkerék, Csomagtartó) cselekvés és az EltávolíLapos- 
kerék, Tengely) az Ag szinten, melyet az Aj-ben a Felszeret(Pótkerék, Tengely) követ. 

Tudjuk, hogy a tervkészítés polinomiális helyigényű, és hogy a tervkészítési gráf 
elkészítése polinomiális idejű, ezért tudjuk, hogy a megoldás kinyerése legrosszabb 
esetben kezelhetetlen. Ebből kifolyólag valamifajta heurisztika segítségére lesz szüksé- 
günk, hogy a cselekvések közül válasszunk a visszafelé keresés során. A gyakorlatban 
jól működik egy mohó algoritmus, mely a literálok között a szintköltség alapján választ. 
Bármely célhalmazra a következő sorrendben járunk el: 


1. Elsőként a legmagasabb szintköltségű literált választjuk. 

2. Hogy teljesítsük ezt a literált, válasszuk először a legegyszerűbb előfeltételekkel 
rendelkező cselekvést, azaz válasszuk azt az akciót, melynek előfeltételeire a szint- 
költségek összege (vagy maximuma) a legkisebb! 


A GRAPHPLAN algoritmus leállása 


Eddig átsiklottunk a leállás kérdése fölött. Lehetünk-e biztosak abban, hogy amennyi- 
ben egy problémának nincs megoldása, a GRAPHPLAN algoritmus nem kerül végtelen 


ciklusba, iterációnként bővítve a tervkészítési gráfot? A válasz igen, de ennek bizon? 
tása túlmutat ennek a könyvnek a keretein. Itt csak a fő ötleteket körvonalazzuk, ki 
nösen azokat, melyek a tervkészítési gráfok általános tulajdonságaira világítanak rá. 

Az első lépés, hogy észrevegyük, hogy a tervkészítési gráfok bizonyos tulajdonságai 
monoton növekvők vagy csökkenők. ,.X monoton növekvő" azt jelenti, hogy az X-ek 
halmaza az í-edik szinten az i -- 1-edik szint halmazának (nem feltétlenül valódi) rész- 
halmaza. A tulajdonságok a következők: 
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a Monoton növekvő literálok. Ha egy literál megjelenik egy adott szinten, akkor az ezt 
követő összes szinten megjelenik. Ez a megőrző cselekvések miatt van. azaz. ha egy 
literál megjelenik, a megőrző cselekvések hatására örökké megmarad. 

s Monoton növekvő cselekvések. Ha egy cselekvés megjelenik egy adott szinten, akkor 
az ezt követő összes szinten megjelenik. Ez a literálok növekedésének a következ- 
ménye, azaz, ha egy cselekvés előfeltételei megjelennek egy szinten, akkor az ösz- 
szes ezt követő szinten rendelkezésre állnak, így a cselekvés is. 

a A kölcsönös kizárások monoton csökkenése. Ha két cselekvés kölcsönösen kizárja 
egymást az A; szinten, akkor az összes ezt megelőző szinten, ahol mindketten meg- 
jelennek, szintén kölcsönösen kizárják egymást. Ugyanez igaz a literálok közötti 
kölcsönös kizárásokra. Ez az ábrákon nem mindig látható, mert ezek a következő 
egyszerűsítést használják: nem ábrázolják sem azokat a literálokat, melyek egy adott 
S; szinten nem teljesülnek, sem azokat a cselekvéseket, amelyek egy adott A; szinten 
nem végrehajthatók. Láthatjuk, hogy a kölcsönös kizárások monoton csökkenése 
igaz, ha figyelembe vesszük, hogy a nem látható literálok és cselekvések minden 
mással kölcsönösen kizárják egymást. 

A bizonyítás egy kicsit összetett, de a következő esetekkel kezelhető: ha az A és 
B cselekvések kölcsönösen kizárják egymást az A; szinten, akkor ezt csak a három- 
féle kizárás egyike okozhatja. Az első kettő — az inkonzisztens hatások, illetve a kö- 
vetkeztetések — a cselekvések tulajdonságai, így, ha a cselekvések kölcsönösen 
kizárják egymást az A; szinten, akkor minden szinten kizárók lesznek. A harmadik 
eset a versenyhelyzet, az S; szint feltételeitől függ: ennek a szintnek tartalmaznia kell 
az Ay olyan előfeltételét, amely kölcsönösen kizáró a B) előfeltétellel. Ez a két elő- 
feltétel akkor lehet kölcsönösen kizáró, ha egymás negáltjai (amely esetben minden 
szinten kölcsönösen kizárók), vagy ha minden cselekvés, amely teljesíti az egyiket, 
kölcsönösen kizáró az összes cselekvéssel, mely a másikat érheti el. Mi már tudjuk, 
hogy a rendelkezésre álló cselekvések monoton növekednek, így indukcióval bizo- 
nyítható, hogy a kölcsönös kizárások csökkenők. 


Mivel a cselekvések és a literálok növekednek, a kölcsönös kizárások csökkennek, és 
mivel csak véges számú cselekvés és literál van, minden tervkészítési gráf szükség- 
szerűen kiegyenlítődik — azaz minden egymást követő szint azonos lesz. Ha hiányzik 
a probléma egy célja, vagy a célok között vannak kölcsönösen kizárók, miután a gráf 
kiegyenlítődött, akkor a probléma soha nem oldható meg, így leállíthatjuk a GRAPHPLAN 
algoritmust, és hibával térhetünk vissza. Ha a gráf kiegyenlítődik, és minden cél jelen 
van kizárások nélkül, de a MEGOLDÁS-KINYERÉS sikertelen a megokdás megtalálásában, 
akkor lehet, hogy véges lépésszámban bővítenünk kell a gráfot, de végezetül megállha- 
tunk. A megállás problémaköre ennél összetettebb. amit itt nem tárgyalunk. 
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A 10. fejezetben láthattuk, hogy a tervkészítés elvégezhető a szituációkalkulus egy 
tételének bizonyításával. A tétel azt mondja, hogy adott kiinduló állapotra és követő- 
állapot-axiómákra. amelyek a cselekvések következményeit írják le, a cél egy adott 
cselekvéssorból adódó helyzetben igaz lesz. Ezt a megközelítést már 1969-ben sem 
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találták eléggé hatékonynak érdekes tervek megtalálására. Napjaink fejtesztései az íté- 
letlogikához készített hatékony magyarázatadó algoritmusokra (lásd 7. fejezet) ismét 
felkeltették az érdeklődést a tervkészítés logikai magyarázatkészítési megközelítésére. 

Az ebben a fejezetben tárgyalt megközelítés a tételbizonyítás helyett egy cselekvés- 
sor kielégíthetőségének (satisfiability) vizsgálatán alapul. Ítéletlogikai mondatok mo- 
delljét fogjuk megtalálni, melyek a következőképpen néznek ki: 


kiinduló állapot N minden lehetséges cselekvésleírás N cél 


A mondat ítéletlogikai szimbólumokat fog tartalmazni, melyek a lehetséges cselekvés- 
előfordulások megfelelői. A modelt, ami kielégíti a mondatot, igaz értéket rendel azok- 
hoz a cselekvésekhez, amelyek részei a helyes tervnek, és hamis értéket a többihez. Egy 
olyan célkitűzés, mely egy nem helyes terv megfelelője, nem lesz modell, mivel nem 
lesz konzisztens azzal a feltételezéssel, hogy a cél igaz. Ha a tervkészítési probléma 
megoldhatatlan, akkor a mondat sem kielégíthető. 


Tervkészítési problémák ítéletlogikai leírása 


A STRIPS problémák ítéletlogikai leírásra való fordítását a tudásreprezentációs ciklus 
egy iskolapéldáján mutatjuk be: egy megfelelő axiómakészlettel indulunk, és úgy talál- 
juk, hogy ezek az axiómák hamis, nem várt modelleket tesznek lehetővé, ezért további 
axiómákat adunk hozzájuk. 

Kezdjük a nagyon egyszerű légi szállítási problémával. A kiinduló állapotban (0. idő- 
Pont) a P, repülő az SFO repülőtéren van, míg a Pa repülő a JFK-n. A cél, hogy a Pi 
legyen a JFK, a P, pedig az SFO reptéren, azaz a repülőgépeknek helyet kell cserél- 
niük. Először egymástól eltérő ítéletlogikai szimbólumokra van szükségünk az egyes 
időlépések kijelentéseihez. Az időpillanatok jelöléséhez felső indexeket használunk, 
mint a 7. fejezetben. Így a kiinduló állapot felírása az 


OPi, SFOJ? A OM(P2, JFKP 


(Emlékezzünk arra, hogy az OP, SFOP egy atomi szimbólum!) Mivel az ítélet- 
logika nem használja a zárt világ feltételezést, ezért a kiinduló állapotban definiálnunk 
kell a nem igaz ítéletlogikai állításokat is. Ha néhány állítás nem ismert a kiinduló álla- 
potban, akkor ezek maradhatnak meghatározatlanok (nyílt világ feltételezés). Ebben 
a példában az 


-OM(P, JFK) A -OMP2, SFOP 


kiinduló állapotot specifikáljuk. A célt magát egy megadott időlépéshez kell kapcsolni. 
Mivel nem tudjuk a priori, hogy hány lépésre van szükség a cél eléréséhez, megpróbál- 
hatjuk feltételezni, hogy a cél igaz a kiinduló állapotban, 7 — 0 időpontban. Azaz 
a következőt állítjuk: Or(Pa, JFKP A Om(P,, SFOY. Ha ez sikertelen, újra próbál- 
kozunk 7 — 1-gyel, és így tovább, amíg a legkisebb megfelelő tervhosszt el nem érjük. 
T minden értékére a tudásbázis a 0. időponttól a 7-ig tartó lépéseket fedő mondatokat 
fogja tartalmazni. Hogy biztosítsuk a leállást, egy önkényes Tax felső korlátot kell állí- 
tanunk. Ezt az algoritmust mutatja a 11.15. ábra. Egy másik lehetséges megközelítést, 
mely elkerüli a többszörös megoldási kísérleteket, a 11.17. feladatban tárgyalunk. 
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function SATELAN(probléma, Tmax) returns megoldás vagy kudarc 
inputs: probléma, egy tervkészítési probléma 
Tnaxs a terv maximális hossza 


forT—0 to Tex do 
enf, leképezés — SATRA-Fogpírásíprobléma, T) 
feladat — SAT-MEGOLDÓ(enf) 
if feladat nem üres then 
return MEGOLDÁS-KINYERÉS( feladat, leképezés) 
return kudarc 











11.15. ábra. A SATPLAN algoritmus. A tervkészítési feladatot egy konjunktív normál formájú mondatra for- 
dítjuk le, amelyben minden cél egy megadott T időpillanatban teljesül, és 7-ig minden lépésre tartalmazza az 
axiómákat. (A fordítás részleteit a szövegben írjuk le.) Ha a kielégíthetőségi algoritmus talál modellt, akkor 
a tervet a modellben az igaz értéket kapott ítéletlogikai szimbólumokhoz tartozó cselekvések kinyerésével 
kapjuk meg. Ha nem létezik modell, akkor a folyamatot ismételjük, a célt egy lépéssel későbbre mozgatva. 


A következő kérdés, hogy hogyan kódoljuk a cselekvés leírásokat az ítéletlogikában. 
A legegyszerűbb megközelítés, hogy minden cselekvés megjelenésére egy ítéletlogi- 
kai szimbólumot vezetünk be. Például a Repül(P,, SFO. JFK)" igaz, ha a P) repülőgép 
az SFO-ról a JFK-ra repül a 0. időpillanatban. Csakúgy, mint a 7. fejezetben, felírjuk 
az ítéletlogikai változatait a következő állapotaxiómáknak, melyeket a 10. fejezetben a 
szituációkalkulushoz fejlesztettünk ki. Adott például az 


OPi, JFK)! 2 (OPi, JFK) A —(RepükP), JFK, SFOP A OPi, IFKP) 
v (RepükP), SFO, JFK)? A Ot(P, SFOVV) (11.1 


axióma. Ennek jelentése, hogy a Pj repülő a JFK-n lesz az 1-es időpillanatban, ha 
a JFK-n volt a 0. időpillanatban, és onnan nem repült el, vagy ha az SFO-n volt a 0. idő- 
pillanatban, és elrepült a JFK-ra. Egy ilyen axiómára minden egyes repülőgéphez, repü- 
lőtérhez és időpillanathoz szükségünk van. Mindezeken túl minden egyes hozzáadott 
repülőtér egy új kiinduló, illetve ott végződő útvonalat ad az összes repülőtérhez, ezért 
további diszjunkciókat ad az összes axióma jobb oldalához. 

Ha ezek az axiómák megvannak, akkor egy kielégíthetőségi algoritmust futtathatunk 
a terv megtalálására. Kell, hogy legyen olyan terv, ami a célt a T — 1 időpillanatban 
eléri, nevezetesen az a terv, melyben a két repülőgép helyet cserél. Tegyük fel, hogy a 
tudásbázis a következő: 


kiinduló állapot A követő állapot axiómák A cél! (11.27 
mely szerint a cél a T — 1 időpillanatban igaz. Ellenőrizhető, hogy az eljárás, melyben a 
RepükPi, SFO, JFK) és a RepükP2, JFK, SFOY 


igaz, és minden más cselekvésszimbólum hamis, modellje a tudásbázisnak. Eddig itt 
minden rendben. Vannak más lehetséges modellek, melyeket a kielégíthetőségi algorit- 
mus visszaadhat? Valójában igen. Ezen modellek mindegyike kielégítő terv? Sajnos 
nem. Vegyük például a 


Repül(P,, SFO, JFK), a RepükP, JFK, SFO)? és a Repül(Po, JFK, SFO)? 
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cselekvésszimbólumok által specifikált meglehetősen butácska tervet. Ez a terv buta, 
mert a P) repülő az SFO-ról indul, ezért a Repül(P,, JIFK, SFO) cselekvés végrehajt- 
hatatlan. Mindazonáltal a terv modellje a (1 1.2) egyenlet mondatának! Ez annyit jelent, 
hogy megfelel mindennek, amit eddig a problémáról állítottunk. Hogy megértsük miért, 
egy kicsit közelebbről meg kell vizsgálnunk, hogy a következő állapot axiómák mit 
mondanak el a cselekvésekről, melyeknek az előfeltételei nem teljesülnek (mint a (11.1) 
egyenletben). Az axiómák helyesen írják le, hogy semmi sem történik, ha egy ilyen 
cselekvést végrehajtunk (lásd 11.15. feladat), de nem állítják. hogy egy ilyen cselekvés 
nem hajtható végre! Hogy elkerüljük az illegális cselekvéseket tartalmazó tervek készí- 
tését, további előfeltétel axiómákat (precondition axioms) kell felvennünk, melyek 
biztosítják, hogy egy cselekvés megjelenéséhez az előfeltételeknek teljesülni kell.é 
Például szükségünk van az 


RepüKP), JFK, SFOY — OP), JFKP 


axiómára, mert az OP, JFK) hamis a kiinduló állapotban, így ez az axióma bizto- 
sítja, hogy a Repül(Py, JFK, SFO)? minden modellben szintén hamis legyen. Az előfel- 
tétel axiómák hozzáadásával már csak pontosan egy modell van, ami teljesíti az összes 
axiómát, amikor a célt az 1-es időpillanatban érjük el, nevezetesen az a modell, mely- 
ben a P) repülőgép a JFK-ra, a P2 repülőgép pedig az SFO-ra repül. Vegyük észre, 
hogy ez a megoldás két párhuzamos cselekvést tartalmaz! Csakúgy, mint a GRAPHPLAN 
vagy a részben rendezett tervkészítés esetén. 

További meglepetésekre számíthatunk, amikor egy új repülőteret illesztünk be, a 
LAX-ot (Los Angeles repülőtere). Most minden repülőgéphez minden állapotban két 
megengedett cselekvés is tartozik. Amikor egy kielégíthetőségi algoritmust futtatunk, 
úgy találjuk, hogy a RepüKP) SFO, JFK)", a Repül(P2, JFK, SFO) és a Repül P2, JFK, 
LAX)-ből álló modell kielégíti az axiómákat. Azaz a követő állapot axiómák és az elő- 
feltétel axiómák megengedik, hogy egy repülőgép egyszerre két célállomásra is repül- 
hessen! A kiinduló állapot a Pa mindkét repülőútjának előfeltételeit teljesíti, így a köve- 
tő állapot axiómák szerint a Pa, az SFO-n és a LAX-on található az 1-es időpillanatban, 
azaz a cél teljesül. Nyilvánvaló, hogy további axiómákat kell felvennünk, hogy kizárjuk 
ezeket a hibás megoldásokat. Az egyik megközelítés, bogy cselekvéskizáró axiómákat 
(action exclusion axioms) veszünk fel, melyek meggátolják az egyidejű cselekvéseket. 
Pédául teljes kizárást érhetünk el, ha az összes 


-(RepüKPa, JFK. SFOV A Repül(P;, JFK, LAX) 


alakú axiómát felvesszük. Ezek az axiómák biztosítják, hogy semelyik két cselekvés ne 
eshessen azonos időpontra. Ezek kizárják a hibás terveket, hatásukra minden terv telje- 
sen rendezett lesz. Ez elveszíti a részben rendezett tervek rugalmasságát, és azáltal, 
hogy megnöveli a terv lépésszámát. a számítási idő is meghosszabbodhat. 

A teljes kizárás helyett alkalmazhatunk csupán részleges kizárást. amikor az egyide- 
jű cselekvéseket csak akkor zárjuk ki, ha kölcsönhatásba kerülnek. A feltételek a mutex 
cselekvések megfelelői: két cselekvés nem hajtható végre egyidejűleg, ha az egyik 
negálja a másik egy előfeltételét vagy következményét. Például a Repük Po, JEK, LAXY 





5 Figyeljük meg. hogy az előfeltétel axiómák felvétele azt jelenti, hogy nem kell a követő állapot axiómáknál 
a cselekvésekhez előfeltételeket felvennünk. 
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és a Repük Po, IFK, SFt 0)" együtt nem következhet be, mert mindkettő negálja a másik 
előfeltételét. Másrészről azonban a Repük(P2. JEK, SFO) és a Repül(Pa, JFK, SFOY 
együtt is bekövetkezhet, hiszen a járatok nem zavarják egymást. A részleges kizárás a 
teljes rendezés kényszere nélkül kiküszöböli a hibás terveket. 

A kizárási axiómák néha nagyon buta eszköznek tűnnek. Ahelyett hogy kikötnénk, 
hogy egy gép nem repülhet egyszerre két reptérre. mondhatnánk egyszerűen, hogy 
egyetlen tárgy sem lehet egyszerre két helyen: 


Wp.xy.t xzyo (Omp, xy A Otttp, yy) 


Ez a tény a követő állapot axiómákkal kombinálva, azt implikálja, hogy egy repülő 
nem repülhet egyszerre két reptérre. Az ilyen tényeket állapotkorlátozásoknak (state 
constraints) nevezzük. Az ítéletlogikában természetesen meg kell adnunk minden 
egyes állapotkorlátozás összes alappéldányát. A repülés feladatra az állapotkorlátozás 
elegendő az összes hibás terv kizárásához. Az állapotmegkötések gyakran sokkal tömö- 
rebbek, mint a cselekvéskízárási axiómák, ezek azonban a probléma eredeti STRIPS rep- 
rezentációjából nem mindig vezethetők le könnyedén. 

Összefoglalva tehát a kielégíthetőségi tervkészítés, a kiinduló állapotot, a célt, a 
követő állapot axiómákat, az előfeltételeket, valamint a cselekvéskizárások vagy az ál- 
lapotaxiómák egyikét tartalmazó mondathoz tartozó modellek megtalálását jelenti. 
Megmutatható, hogy az axiómák ezen halmaza elégséges, abban az értelemben, hogy 
a továbbiakban nincsenek hibás , megoldások". Az ítéletlogikai mondatot kielégítő bár- 
mely modell megfelelő megoldása az eredeti problémának, azaz a terv minden sorba 
rendezése egy megengedett cselekvéssor, ami a célhoz vezet. 


Az ítéletlogikai leírás bonyolultsága 


Az ítéletlogikai megközelítés legnagyobb hátránya az eredeti problémából generált tu- 
dásbázis mérete. A Repül(p, ay, an) cselekvésséma például T x IRepülők] x IRepülő- 
terekl? számú különböző állításlogikai szimbólumot eredményez. Általánosságban a 
cselekvésszimbólumok számának korlátja a T x Jáct] x JOJ?, ahol az JActl a cselekvés- 
sémák száma, JO] a problémakör objektumainak száma, valamint P a cselekvés sémák 
maximális aritása (paramétereinek száma). A klózok száma még nagyobb. 10 időlépés, 
12 repülőgép és 30 repülőtér esetén a teljes cselekvéskizárási axiómában 583 millió 
klóz van. 

Mivel a cselekvésszímbólumok száma a cselekvéssémák aritásával exponenciálisan 
nő, megoldás lehet az aritás csökkentése. Ezt a szemantikus hálóktól (lásd 10. fejezet) 
kölcsönvett ötlet segítségével tehetjük meg. A szemantikus hálók csak bináris prediká- 
tumokat használnak, az ennél több argumentummal rendelkező predikátumokat egy 
bináris predikátumhalmazra képezzük le, ami külön ad meg minden predikátumot. Ezt 
az ötletet a Repül(P,, SFO, JFK) cselekvésszimbólumra alkalmazva, három új szim- 
bólumot kapunk: 


Repül (Pp: —— a P) repülő a 0. időpontban repült 
Repül (SFOJ0: . a járat kiinduló állomása az SFO 
Repülz(IFK): a járat célállomása a JFK 
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Ez a szimbólumfelosztásnak (symbol splitting) nevezett folyamat kiküszöböli az 
exponenciális számú szimbólum igényét. Így most csak T x [Act] x P x IO] szimbó- 
lumra van szükség. 

A szimbólum felosztás önmagában lecsökkenti ugyan a szimbólumok számát, de 
a tudásbázisban szereplő axiómák számát nem csökkenti automatikusan. Azaz, ha min- 
den klózban szereplő cselekvésszimbólumot egyszerűen csak három szimbólum kon- 
junkciójára cserélnénk, a tudásbázis mérete nagyjából azonos maradna. A szimbólum- 
felosztás valóban csökkenti a tudásbázis méretét, mivel néhány szétbontott szimbólum 
feleslegessé válik bizonyos axiómákban, és elhagyható. Vegyük például a (11.1) egyen- 
letben szereplő követő állapot axiómát, módosítva, hogy tartalmazza LAX-ot, és elhagy- 
va a cselekvés előfeltételeket (melyeket előfeltétel axiómákkal fedünk le): 


OP, JFK) e (OMP), JFK A -RepükP, JEK, SFO) A -RepükP), IFK, LAXY) 
v Repül(P,, SFO, JFKY V RepükP), LAX, JFKP 


Az első feltétel szerint a Pp a JFK-n lesz, ha a 0. időpontban ott volt, és nem repült el 
egyetlen másik városba sem. A második azt mondja, hogy ott lesz, ha mindegy, hogy 
honnan, de a JFK-ra repül. A felosztási szimbólumok használatával, egyszerűen el- 
hagyhatjuk azon argumentumokat, melyek értéke nem számít: 


OP, JFR)! 62 (Ot(P), JFK) A —Repül (Pp)? A Repül (IFKP) V Repül(Pp)? 
A Repülz(JFK)O 


Vegyük észre, hogy az SFO és a LAX már nem szerepel az axiómában. Általánosab- 
ban a felosztási szimbólumoknak köszönhetően a követő állapot axiómák mérete füg- 
getlenné válik a repülőterek számától. Hasonló redukció történik az előfeltétel és a 
cselekvéskizárási axiómákkal (lásd 11.16. feladat). A korábban bemutatott 10 időlépés, 
12 repülő és 30 reptér esetében a teljes cselekvéskizárási axóma mérete 583 millió 
klózról 9360 klózra csökken. 

A módszernek egyetlen hátulütője van: a felosztási szimbólum reprezentáció nem en- 
gedi meg a párhuzamos cselekvéseket. Vegyük a RepüKP), SFO, JFK) és a Repül(Pa, 
JFK, SFO) párhuzamos cselekvéseket. A felosztott megadásra alakítva a 


Repül(P? A Repül (SFO)? A Repülz(IFK)? A 
Repül (Po)? A Repül (JFK)? A Repülz(SFO)? 


kifejezést kapjuk. Innentől már nem állapítható meg mi történt! Tudjuk, hogy Pi és P2 re- 
pült, de nem tudjuk azonosítani a járatok kiinduló és célállomásait. Ez annyit tesz, hogy 
egy teljes cselekvéskizárási axiómát kell használni, annak korábban jelzett hátrányaival. 
A kielégíthetőségen alapuló tervkészítők nagyon nagy tervkészítési problémákat képesek 
kezelni — például a többtucatnyi dobozból álló kockavilág probléma 30 lépéses tervét. 
A propozíciós kódolás mérete, valamint a megoldás költsége nagymértékben problémafüg- 
gő, de a legtöbb esetben az ítéletlogikai axiómák tárolásához szükséges memóriaméret 
a szűk keresztmetszet. Ennek a kutatásnak egy érdekes eredménye, hogy a visszalépéses 
algoritmusok (mint a DPLL) gyakran hatékonyabbak voltak a tervkészítési problémák meg- 
oldásában, mint a lokális keresési algoritmusok (például a WALKSAT). Ennek oka, hogy az 
állításlogikai axiómák többsége Hom-klóz, ami egység terjesztéstechnikákkal kezelhető ha- 
tékonyan. Ez a megfigyelés hibrid algoritmusok kifejlesztéséhez vezetett, melyek a véletlen 
keresési, a hiba-visszaterjesztési és az egységterjesztési módszereket kombinálják. 
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A mesterséges intelligencia területén belül, a tervkészítés jelenleg nagy figyelemnek ör- 
vend. Ennek egyik oka, hogy egyesíti az eddig bemutatott két nagy területet, a keresést 
és a logikát. A tervkészítő tekinthető egy programnak, ami vagy egy megoldást keres, 
vagy (konstruktívan) bizonyítja egy megoldás létezését. A két terület alapötleteinek 
keresztezése az utóbbi évtizedben több nagyságrendnyi javulást hozott a hatékonyság 
tekintetében, és egyúttal megnövelte a tervkészítők ipari alkalmazásokban való felhasz- 
nálhatóságát. Sajnos még mindig nincs tiszta képünk arról, hogy mely problémákra 
mely megoldások a legalkalmasabbak. Később valószínűleg új technikák kerülnek 
majd előtérbe, melyek dominálnak majd a meglévők felett. 

A tervkészítési feladat elsősorban a kombinatorikus robbanás kézbentartásáról, kontrol- 
lálásról szól. Egy p elemi állítást tartalmazó problématérben 2? állapot lehetséges. Összetett 
problémakörökben p nagyon nagy lehet. Vegyük azt, hogy a problématér objektumainak 
tulajdonságai (Pozíció, Szín stb.) és relációi (Ott, Rajta, Közte stb.) vannak. Az állapotok 
száma, d objektummal és hármas relációkkal a problématérben 27. Végkövetkeztetésként 
— a legrosszabb esetet feltételezve — megállapíthatjuk, hogy a tervkészítés reménytelen. 

Az ilyen pesszimizmus ellen az ,oszd meg és uralkodj" elv hatásos fegyver lehet. 
A legjobb esetben — amennyiben a probléma teljesen dekomponálható — az , oszd meg 
és uralkodj" elv exponenciális gyorsulást hozhat. A dekomponálhatóságot azonban a 
cselekvések negatív kölcsönhatásai megszüntetik. A részben rendezett tervkészítő ezt 
egy erős reprezentácós megközelítéssel, az okozati kapcsolatokkal kezelte, de sajnos a 
konfliktusok mindegyike csak egy választással oldható fel (ami a konfliktusban álló 
cselekvést vagy a kapcsolat elé, vagy mögé sorolja) és ezen választások száma exponen- 
ciálisan nő. A GRAPHPLAN algoritmus a gráf felépítésekor kikerüli ezeket a döntéseket 
úgy, hogy az ütközéseket mutex kapcsolatokkal rögzíti anélkül, hogy a feloldás módjáról 
döntene. A SATPLAN algorítmus a mutex kapcsolatok hasonló területét fedi le, de ezt egy 
specifikus adatstruktúra felhasználása helyett az általános CNF alak felhasználásával 
teszi. Az, hogy ez mennyire jól működik, a felhasznált SAT megoldótól függ. 

Néha a probléma hatékonyan megoldható, ha észrevesszük, hogy a negatív kölcsön- 
hatások kizárhatók. Azt mondjuk, hogy egy feladatnak sorba rendezhető részcéljai 
(serializable subgoals) vannak, ha létezik a részcéloknak egy olyan rendezése, hogy a 
tervkészítő sorrendben elérheti őket anélkül, hogy a korábban már elért részcélokat fel- 
számolná. A kockavilágban például, ha a cél egy torony megépítése (pédául az A a 
B-n, ami pedig az asztalon elhelyezkedő C-n van), akkor a részcélok felülről lefelé 
sorrendezhetők: ha először elérjük. hogy C az asztalon van, akkor a továbbiakban — mi- 
alatt a további részcélokat teljesítjük — ennek megszüntetésére soha nem lesz szükség. 
Egy tervkészítő, ami az alulról felfelé trükköt alkalmazza, a kockavilág bármely problé- 
máját képes megoldani visszalépés nélkül (bár nem mindig a legrövidebb tervet adja). 

Egy összetettebb példaként, a NASA Deep Space I űrhajóját irányító Távirányító 
Ágens tervkészítő esetén elhatározták, hogy az űrhajót irányító állítások legyenek 
sorba rendezhetők. Ez talán nem is annyira meglepő, hiszen az űrhajót a mérnökök úgy 
tervezték, hogy minél könnyebb legyen irányítani (más megkötések figyelembevételé- 
vel). A célok sorrendezhetőségét kihasználva a Távirányító Ágens tervkészítő a keresés 
nagy részét megspórolhatta, így megfelelően gyors volt az űrhajó valós idejű irányítá- 
sára, amit korábban lehetetlennek tartottak. 
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A kombinatorikus robbanás kordában tartására több lehetőség is van. Az 5. fejezetben 
láthattuk, hogy a kényszerkielégíthetőségi problémák (CSP-k) visszalépési számának 
kontrollálásához számos megoldás létezik, mint például a függőségirányított visszalé- 
pés. Ezen technikák mindegyike alkalmazható a tervkészítéshez is. Például a megoldás 
kinyerése egy tervkészítési gráfból kezelhető egy kétértékű CSP-ként, melynek válto- 
zói azt jelzik, hogy egy adott cselekvés bekövetkezik-e egy adott időpontban, vagy sem. 
A CSP megoldható az 5. fejezet bármely algoritmusával, például a min-konfliktusok 
algoritmussal. Egy közeli rokon, a BLACKBOX rendszerben használt megoldás, a terv- 
készítési gráfot CNF kifejezésre fordítja, melyből ezután egy SAT megoldóval nyeri ki 
a tervet. Ez a megközelítés jobb, mint a SATPLAN algoritmus, feltételezhetően azért, 
mert a tervkészítési gráf már számos lehetetlen állapotot és cselekvést eltávolított a 
feladatból. A GRAPHPLAN algoritmusnál is jobban működik, valószínűleg azért, mert 
a kielégíthetőségi keresés, mint a WALKSAT, nagyobb rugalmasságú a GRAPHPLAN 
algoritmus által használt szigorú visszalépéses keresésnél. 

Nem kétséges, hogy a GRAPHPLAN-hoz, a SATPLAN-hoz és a BLACKBOX-hoz hasonló 
tervkészítők előremozdították a tervkészítés fejlődését azáltal, hogy megnövelték a terv- 
készítő rendszerek teljesítményét, és tisztázták a kapcsolódó reprezentációs és kom- 
lexitási kérdéseket. Ezek a megoldások azonban eredendően ítéletlogikai megoldások. 
így korlátozott a problémakör, amelyet képesek kifejezni, (Például néhány tucat objek- 
tumot és helyet tartalmazó logisztikai problémának megfelelő CNF kifejezésekhez 
gigabájtnyi kapacitásra van szükség.) Bár a tervkészítési gráfhoz hasonló struktúrák 
továbbra is hasznosak lesznek, mint a heurisztikák forrása, valószínűnek tűnik, hogy 
elsőrendű reprezentációkra és algoritmusokra lesz szükség a további fejlődéshez. 
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Ebben a fejezetben a tervkészítési feladatot determinisztikus és teljesen megfigyelhető 
környezetek esetén definiáltuk. Bemutattuk a tervkészítési feladatok leírására használt 
főbb reprezentációkat, valamint számos algoritmikus megközelítést a megoldásukra. 
Idézzük fel a fontosabb állításokat: 


s Atervkészítő rendszerek olyan problémamegoldó algoritmusok. melyek állapotok 
és cselekvések explicit ítéletlogikai (vagy elsőrendű) reprezentációin működnek. 
Ezek a leírások lehetővé teszik hatékony heurisztikák származtatását, valamint erős 
és rugalmas algoritmusok kifejlesztését a problémamegoldáshoz. 

9 A STRIPS nyelv az előfeltételek és következmények segítségével írja le a cselekvése- 
ket, valamint a kiindulási és célállapotokat pozitív literálok konjunkciójaként adja 
meg. Az ADL nyelv lazít ezeken a megkötéseken, megengedi a diszjunkciót, a negá- 
lást és a kvantorokat. 

s Az állapottér-keresés történhet előrefelé: progreszív (progression) vagy hátrafelé: 
regresszív (regression). Hatékony heurisztikák származtathatók a részcélok függet- 
lenségét feltételezve és a tervkészítési feladat különböző gyengítéseivel. 

s A részben rendezett tervkészítő (RRT) algoritmusok a tervek terében keresnek 
anélkül, hogy cselekvések teljesen rendezett sorozatára jutnának. A céltól visszafelé 
működnek a részcélok eléréséhez szükséges cselekvéseknek a tervhez való hozzá- 
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adásával. Ezek az algoritmusok különösen hatékonyak az , oszd meg és uralkodj" 
megközelítésse! kezelhető problémákra. 

, Egy tervkészítési gráf (planning graph) megalkotható inkrementálisan a kiinduló 
állapotból elindulva. Minden egyes réteg az adott időpillanatban végrebajtható ösz- 
szes cselekvés és literál halmazát tartalmazza, rögzíti a kölcsönös kizárásokat vagy 
mutexeket, azaz olyan literálok és cselekvések közötti relációkat, melyek egyszerre 
nem következhetnek be. A tervkészítési gráfok hasznos heurisztikákra vezetnek az 
állapottér és a részben rendezett tervkészítők esetén, és közvetlenül felhasználhatók 
a GRAPHPLAN algoritmusban. 

§ A GRAPHPLAN algoritmus a tervkészítési gráfot dolgozza fel visszafelé keresést alkal- 
mazva a terv kinyeréséhez. Lehetőséget biztosít továbbá még a cselekvések között 
bizonyos részben rendezésekre. 

s A SATPLAN algoritmus a tervkészítési problémát ítéletlogikai axiómákra fordítja, és 
egy kielégíthetőségi algoritmust használ a helyes tervnek megfelelő modell megtalá- 
lására. Számos különböző ítéletlogikai reprezentációt fejlesztettek ki különböző 
mértékű tömörséggel és hatékonysággal. 

s A tervkészítés fő megközelítései mindegyikének vannak nehézségei, és egyelőre 
nincs egyetértés abban, hogy melyik a legjobb. A versengés és a módszerek ötvözése 
komoly előrehaladást eredményezett a tervkészítő rendszerek hatékonyságában. 


Irodalmi és történeti megjegyzések 


A mesterséges intelligenciában a tervezés az állapottér-keresések vizsgálatából, tétel- 
bizonyításból, szabályozástechnikából, illetve a robotika, ütemezés és más területek 
gyakorlati szükségleteiből ered. Az első számottevő tervkészítő rendszer a STRIPS (Fikes 
and Nilsson, 1971), ezen hatások kölcsönhatását példázza. A STRIPS-et, az SRI-ben zaj- 
16 Shakey robot projekt szoftverének tervkészítő komponenseként fejlesztették ki. En- 
nek teljes szabályozási struktúráját egy eszköz-cél analízist használó állapottér-kereső 
rendszer, a GPS, azaz az általános problémamegoldó (general problem solver) (Newell 
és Simon, 1961) mintájára készítették. A STRIPS a 0A3 tételbizonyító rendszer egy 
verzióját (Green, 1969b) használta fel a cselekvések előfeltételeinek teljesítésére. Lif- 
schítz a STRIPS precíz definícióit és elemzéseit adja meg (Lifschitz, 1986). Bylander 
bizonyította, hogy az egyszerű STRIPS tervkészítés PSPACE-teljes (Bylander, 1992). 
Fikes és Nilsson történelmi áttekintést adnak a STRIPS projektről. és feltárják ennek kap- 
csolatait az újabb tervkészítési törekvésekkel (Fikes és Nilsson, 1993). 

A STRIPS-ben használt cselekvésreprezentációnak sokkal nagyobb hatása volt, mint 
algoritmikus megközelítésének. Ezt követően majdnem minden tervkészítő rendszer 
használta a STRIPS nyelv ilyen vagy olyan módosításait. Sajnos a különböző változatok 
elburjánzása szükségtelenül megnehezítette az összehasonlításokat. Az idő múlásával 
jobban megértettük az egyes formalizmusok korlátait és hátrányait. A cselekvésleíró 
nyelv (Action Description Language — ADL) (Pednault, 1986) lazította a STRIPS nyelv 
néhány megkötését, és lehetővé tette a valósághoz közelibb problémák leírását. Nebel 
az ADL leírást STRIPs leírásra fordító sémákat vizsgálja (Nebel, 2000). A problématér 
leíró nyelvet (Problem Domain Description Language — PDDL) (Ghallab és társai, 
1998) egy számítógép által érthető szabványos szintaxisként vezették be a STRIPS, az 
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ADL és egyéb nyelvek leírására. A PDDL-t 1998-tól az AIPS konferencián zajló terv- 
készítési versenyek szabványos nyelveként használták. 

Az 1970-es évek elejének tervkészítői általában teljesen rendezett cselekvéssorokkal 
dolgoztak. A problémadekompozíciót úgy érték el, hogy minden részcélhoz egy rész- 
tervet készítettek, majd ezeket valamilyen sorrendben összefűzték. Hamarosan felfe- 
dezték, hogy ez a megközelítést, melyet Sacerdoti lineáris tervkészítésnek (linear 
planning) nevezett (Sacerdoti, 1975), nem teljes. Nem képes megoldani néhány nagyon 
egyszerű problémát, mint pédául a Sussman-anomáliát (lásd 11.11. feladat), amit Allen 
Brown a HACKER rendszerrel végzett kutatásai során fedezett fel (Sussman, 1975). Egy 
teljes tervkészítőnek meg kell engedni egy mondatban a különböző résztervekből szár- 
mazó cselekvések összefésülését (interleaving). A sorrendezhető részcélok alapötlete 
(Korf, 1987) pontosan megfeleltethető azon problémák halmazának, melyekre az ösz- 
szefésülésre nem alkalmas tervkészítők teljesek. 

Az összefésülési probléma egyik megoldása a célregressziós tervkészítés volt, ami 
egy olyan technika, melyben egy teljesen rendezett terv lépéseit a részcélok közötti 
konfliktusok elkerülése érdekében újrarendezzük. Ezt Waldinger vezette be (Waldinger, 
1975), és Warren WARPLAN rendszerében (Warren, 1974) szintén felhasználták. A WAR- 
PLAN-nel kapcsolatban szintén kiemelendő, hogy ez volt az első tervkészítő, melyet logi- 
kai programozási nyelven (Prolog) írtak, valamint az egyik legjobb példa arra a kiemel- 
kedő gazdaságosságra, ami a logikai programozással nyerhető: a WARPLAN összesen 
száz kódsor, azaz csak töredéke az abban az időben ismert hasonló tervkészítők mére- 
tének. Az INTERPLAN (Tate, 1975a; 1975b) a Sussman-anomália és hasonló problémák 
elkerülése érdekében, szintén megengedte a tervlépések tetszőleges összefésülését. 

A részben rendezett tervkészítés alapötletei tartalmazzák az ütközések érzékelését 
(Tate, 1975a) és az elért feltételek kölcsönhatásoktól való védelmét (Sussman, 1975). 
A részben rendezett tervek (melyeket akkor feladathálóknak — task network — nevez- 
tek) készítését a NOAH tervkészítő (Sacerdoti, 1975: 1977) és Tate NONLIN rendszere ve- 
zette be (Tate, 1975b; 1977).? 

A következő húsz év kutatásaiban a részben rendezett tervkészítés dominált, mialatt 
azonban a problémakört széles körben nem értették. A TWEAK (Chapman, 1987) ezen 
időszak tervkészítési munkájának logikai reprezentációja és egyszerfísítése volt. Chap- 
man felírása eléggé tiszta volt ahhoz, hogy bizonyítható legyen a tervkészítési problé- 
mák különböző megfogalmazásainak teljessége és követhetetlensége (NP-nehézsége és 
-eldönthetetlensége). Chapman munkája egy teljes részben rendezett tervkészítő első 
egyszerű és olvasható leírására vezetett (McAllester és Rosenblitt, 1991). A McAllester 
és Rosenblitt SNLP-nek (Soderland és Weld, 1991) nevezett algoritmusának imple- 
mentációja széles körben elterjedt, és elsőként tette számos kutató számára lehetővé 
a részben rendezett tervkészítők megértését és kutatását. Az ebben fejezetben korábban 
bemutatott RRT algoritmus az SNLP-n alapul. 

"Weld csoportja fejlesztette ki az UCPOP-ot is (Penberthy és Weld, 1992), az első 
tervkészítőt ADL-ben kifejezett problémákra. Az UCPOP a kielégítetlen-célok-száma 
heurisztikát alkalmazta. Valamivel gyorsabban futott, mint az SNLP, de nagyon ritkán 
volt képes néhány tucat lépésnél többet tartalmazó tervek megtalálására. Bár javított 


T A terminológia kissé zavaros. Sok szerző a nemlineáris (nonlinear) jelzőt a , részben rendezett" értelem- 
ben használja. Ez kissé különbözik Sacerdotti eredeti szóhasználatától, aki ezt az összefésült tervekre használta. 
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heurisztikákat is kifejlesztettek az UCPOP módszerhez (Joslin és Pollack, 1994); (Gere- 
vini és Schubert, 1996) az 1990-es években, a gyorsabb módszerek megjelenésével a 
részben rendezett tervkészítők háttérbe szorultak. Nguyen és Kambhampati a módszer 
visszatérését javasolták (Nguyen és Kambhampati, 2001): a tervkészítési gráfból meg- 
felelő heurisztikák származtatásával a REPOP tervkészítőjük jobban skálázható, mint a 
GRAPHPLAN, továbbá ez vetélytársa lett a leggyorsabb állapottér-tervkészítőknek is. 

Avrim Blum és Merrick Furst felpezsdítette a tervkészítés területét GRAPHPLAN rend- 
szerével (Blum és Furst, 1995; 1997), ami több nagyságrenddel gyorsabb volt az akkori 
részben rendezett tervkészítőknél. Más gráftervező rendszerek, mint az IPP (Koehler és 
társai, 1997), a STAN (Fox és Long, 1998) és az SGP (Weld és társai, 1998) hamarosan 
követték. Egy kicsivel korábban Ghallab és Laurelle a tervkészítő gráfhoz nagyon 
hasonló adatstruktúrát fejlesztettek ki (Ghallab és Laurelle, 1994). Az IXTET részben 
rendező tervkészítőjük az adatstruktúrát a keresés irányítására szolgáló heurisztikák 
kinyerésére alkalmazta. Nguyen és társai a tervkészítő gráfokból származtatott heurisz- 
tikák nagyon alapos áttekintését adták (Nguyyen és társai, 2001). A mi tervkészítő grá- 
fokról szóló leírásunk részben ezen, részben pedig Subbarao Kambhampati jegyzetein 
alapul. Ahogyan már a fejezetben említettük, többféle módon használható a tervezési 
gráf a megoldás keresésének irányítására. A 2002-es AIPS tervkészítő győztese, az LPG 
(Gerevini és Serina, 2002), a WALKSAT által ösztönözve lokális keresési technikát hasz- 
nált a tervkészítési gráf keresésére. 

A tervkészítés mint kielégíthetőség és a SATPLAN algoritmus Kautz és Selman javas- 
lata, akiket a kielégíthetőségi problémákra alkalmazott mohó lokális keresés meglepő si- 
kere inspirált (Kautz és Selman, 1992) (lásd 7. fejezet). Kautz és társai szintén kutatták 
a STRIPS axiómák ítéletlogikai reprezentációjának különböző módjait, és azt találták, 
hogy a legtömörebb alakok nem feltétlenül vezettek a leggyorsabb megoldásokra (Kautz 
és társai, 1996). Ernst és társai szisztematikus elemzést hajtottak végre (Ernst és társai, 
1997), valamint kifejlesztettek egy automatikus fordítót PDDL problémák ítéletlogikai 
megadásának generálására. A Kautz és Selman által kifejlesztett BLACKBOX tervkészítő 
(Kautz és Selman, 1998) a GRAPHPLAN és SATPLAN alapötleteit kombinálja. 

Az állapottér-tervkészítőkkel kapcsolatos érdeklődés újjáéledésének úttörője Drew 
McDermott UNPOP programja (McDermott, 1996), amely elsőként javasolta a törlési 
listát figyelmen kívül hagyó egyszerűsített problémán alapuló távolság heurisztikát. 
Az UNPOP név a részben rendezett tervkészítőket illető túlzott figyelem egyik reakció- 
ja volt; McDermott szerint más megközelítések nem kapták meg a megérdemelt figyel- 
met. Bonet és Geffner heurisztikus kereső tervkészítője (Heuristic Search Planner — 
HSP) és ennek későbbi leszármazottjai (Bonet és Geffner, 1999) elsőként tették az 
állapottér-keresést alkalmazhatóvá nagyméretű tervkészítési feladatokra. A mai napig 
legsikeresebb állapottér-kereső Hoffmann FASTFORWARD vagy FF keresője, az AIPS 
2000 tervkészítő versenyének győztese (Hoffmann, 2000). Az FF egyszerűsített terv- 
készítési gráf heurisztikát használ egy nagyon gyors, az előrefelé és a lokális keresést 
újszerűen ötvöző algoritmussal. 

Napjainkban a tervek bináris döntési diagram (binary decision diagram) alakú 
reprezentációja hódít, ami egy véges automata tömör leírási módja, melyet a hardver- 
verifikációval foglalkozó közösség részletesen tanulmányozott (Clarke és Grumberg, 
1987; McMillan, 1993). A bináris döntési diagramok jellemzőinek mint egy tervkészí- 
tési probléma megoldásának való megfelelés tulajdonságának bizonyítására számos 
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technika elérhető. Cimatti és társai egy a megközelítésen alapuló tervkészítőt mu- 
tattak be (Cimatti és társai, 1998). Más reprezentációkat szintén felhasználtak; például 
Vossen és társai az egész programozás tervkészítésre való felhasználhatóságát vizsgál- 
ja (Vossen és társai, 2001). 

A döntőbizotság még nem döntött, de a különböző tervkészítési algoritmusok néhány 
nagyon érdekes összevetése már elérhető. Helmert a tervkészítési problémák számos 
osztályát vizsgálja, és megmutatja, hogy az NP-nehéz problémakörökben a megkötés- 
alapú megközelítések, mint a GRAPHPLAN és a SATPLAN bizonyulnak a legjobbnak, míg 
a keresésalapú megközelítések azon problémakörökben hasznosak, ahol visszalépések 
nélkül elérhető egy megfelelő megoldás (Helmert, 2001). A GRAPHPLAN és SATPLAN 
algoritmusoknak nehézséget okoznak a sok objektumot tartalmazó problémák, mert 
ezek miatt sok cselekvésre van szükségük. Az esetek egy részében a probléma elkerül- 
hető vagy elodázható, ha a cselekvések bizonyos részét csak szükség esetén generáljuk 
le dinamikusan, ahelyett hogy már a keresés előtt példányosítanánk mindegyiket. Weld 
a modem tervkészítő algoritmusok két kitűnő áttekintését adja (Weld, 1994; 1999). Érde- 
kes látni az eltelt öt év változásait az áttekintésekben: az első a részben rendezett tervké- 
szítésre fókuszál, míg a második a GRAPHPLAN és SATPLAN algoritmusokra. A Readings 
in Planning (Allen és társai, 1990) a terület legjobb korábbi cikkeinek minden részletre 
kiterjedő antológiája, beleértve néhány áttekintést is. Yang a részben rendezett terv- 
készítők könyv méretű áttekintését adja (Yang, 1997). 

A tervkészítés kutatása a megjelenésétől kezdve központi kérdése a mesterséges in- 
telligencia kutatásának, így a tervkészítésről született cikkek is számottevő részét képe- 
zik a folyóiratok és konferenciák anyagának. Specializált konferenciákat is rendeznek, 
mint az International Conference on AI Planning Systems (AIPS), az International 
Workshop on Planning and Scheduling for Space vagy a European Conference on 
Planning. 


Feladatok 


11.1. Írja le a különbségeket és hasonlóságokat a problémamegoldás és a tervkészítés 
között. 


11.2. Adottak a 11.2. ábra axiómái. Melyek az alkalmazható konkrét példányai a Re- 
pükp, honnan, hova) cselekvésnek a következő állapotban: 


OP), JFK) A OtP2, SFO) A Repülő(Pi) A RepülőlP) 
A Repülőtér JEK) A Repülőtér(SFO) 


11.3. Nézzük meg, hogyan fordíthatunk le egy STRIPS sémahalmazt a szituáció- 
kalkulus követő állapot axiómáira (lásd 10. fejezet). 

. — Vegyük a Repül(p, honnan, hová) sémát. Írja le a RepülElőfeltétekp, honnan, 
hová. s) predikátum logikai definícióját, ami igaz, ha a Repül(p, honnan, ho- 
vá) előfeltételei teljesülnek az s szituációban. 

. — Ezután írjuk fel a Ort(p, x, 5) követő állapot axiómáját, ami a cselekvéssé- 
mával azonos információt tartalmazza, feltételezve, hogy a Repül(p, hon- 
nan, hová) az ágens számára rendelkezésre álló egyetlen cselekvésséma. 
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n.4. 


11.5. 


11.6. 


11.7. 


s — Most feltételezzük, hogy van egy további utazási lehetőség: Teleportálásíp, 
honnan, hová). Ennek egy további előfeltétele a —Torzult(p), extra követ- 
kezménye pedig a Torzultí(p). Magyarázza meg, hogyan kell módosítani a 
szituációkalkulus tudásbázisát. 

s — Végezetül fejlesszen ki egy általános és pontosan specifikált megoldást egy 
STRIPS sémahalmaz követő állapot axióma halmazra való lefordításához. 


Egy majom a , majom-és-banán" feladattal találkozik egy laboratóriumban, ahol el- 
érhetetlen banánfürtök lógnak a plafonról. Van egy doboz, ami lehetővé teszi 
a majom számára a banán elérését, amennyiben felmászik rá. Kiindulásképp a ma- 
jom az A-ban van, a banánok a B helyen és a doboz a C-n. A majom és a doboz 
magassága Alacsony, de ha a majom a dobozra mászik, magassága Magas lesz, 
megegyezik a banánok magasságával. A majom számára elérhető cselekvések tartal- 
mazzák a Menj egyik helyről a másikra, a fol egy tárgyat egyik helyről a másikra, a 
Felmászik egy tárgyra, illetve Lemászik egy tárgyról, és a Megfog, illetve Elenged 
egy tárgyat cselekvéseket. A megmarkolás a tárgy megfogását eredményezi, ha 
a majom és a tárgy ugyanazon a helyen és ugyanabban a magasságban vannak. 
(a) Írja fel a kiinduló állapotot. 

(b) Írja le a hat cselekvés definícióját STRIPS alakban. 

(c) Tegyük fel, hogy a majom meg akarja tréfálni a tudósokat, akik teázni men- 
tek, azáltal hogy megragadja a banánokat, de a dobozt az eredeti helyén 
hagyja. Írja fel ezt mint általános célt (például nem feltételezve, hogy a 
doboz szükségszerűen a C helyen van) a szítuációkalkulus nyelvén. Meg- 
oldható ez egy STRIPS-szerű rendszerrel? 

(d) A tolási axiómája valószínűleg helytelen, mert a tárgy túl nehéz, így a po- 
Zíció azonos marad, ha a Tol operátort alkalmazzuk. Ez elágazási vagy érté- 
kelési feladatra ad példát? Javítsa ki a feladat leírását, hogy figyelembe 
vegye a nehéz tárgyakat. 

Magyarázza meg, hogy a hátrafelé keresésben a megelőző állapotok generálásá- 

nak folyamata miért nem igényli, hogy a cselekvés negatív következményeinek 

megfelelő literálokat is szerepeltessük. 


Magyarázza meg, miért vezet relaxált problémára a negatív következmények 
eldobása egy STRIPS probléma minden cselekvés sémájából. 


Vizsgálja meg a 3. fejezetben szereplő kétirányú keresés (bidirectionai search) 

definícióját. 

(a) A kétirányú állapottér-keresés használata jó ötlet lenne tervkészítéshez? 

(b) És a részben rendezett tervek terében történő kétirányú keresés? 

(c) Tervezze meg a részben rendezett tervkészítő azon verzióját, melyben egy 
cselekvés akkor adható hozzá a tervhez, ha az előfeltételei elérhetők a terv- 
ben már szereplő cselekvések következményein keresztül. Magyarázza 
meg, hogyan kezeljük a konfliktusokat és a rendezési megkötéseket. Szük- 
ségszerűen azonos ez az algoritmus az állapottérben történő előrefelé kere- 
séssel? 


492 11. TERVKÉSZÍTÉS 


(d) Vegyünk egy részben rendezett tervkészítőt, ami kombinálja a c) rész- 
feladat módszerét azzal az általános módszerrel, ahol a nyitott feltételek 
eléréséhez cselekvéseket adunk a tervhez. Azonos lesz az így előálló algo- 
ritmus a b) részfeladattal? 


11.8. Készítse el a I1.2. ábrán szereplő probléma tervkészítési gráfjának 0., 1. és 2. 
szintjét. 


11.9. Bizonyítsa be az alábbi tervkészítő gráfokra vonatkozó állításokat: 
s —— Az a literál, ami nem jelenik meg a gráf utolsó szintjén, nem érhető el. 
s Egy soros gráfban szereplő literál szintköltsége nem lehet nagyobb, mint az 
őt elérő optimális terv költsége. 


11.10. Összevetettük az állapottérben előre- és hátrafelé kereső tervkészítőket a rész- 
ben rendezett tervkészítőkkel úgy. hogy az utóbbit egy tervtérkeresőnek vettük. 
Magyarázza meg, hogyan tekinthető az előre- és hátrafelé történő állapottér- 
keresés tervtérkeresőnek, és mondja meg, mik a tervfinomító operátorok. 


11.11. A 11.16. ábra a kockavilág problémát mutatja, ami Sussman-anomáliaként 
(Sussman anomaly) ismert. A problémát azért tekintették anomáliának, mert 
az 1970-es évek nem összefésülős tervkészítői nem tudták megoldani. Írjuk fel 
a probléma definícióját STRIPS alakban, és oldjuk meg, kézzel vagy egy terv- 
készítő programmal. A nemösszefésülő tervkészítő egy olyan tervkészítő, ami ha 
két Gi és G) részcélt kap. akkor vagy egy G, elérésére szolgáló tervet fűz hoz- 
zá egy G) elérésére szolgáló tervhez, vagy fordítva. Magyarázza meg, hogy egy 
nem összefésülő tervkészítő miért nem tudja megoldani a kockavilág problémát. 


11.12. Vegyük a cipő és zokni felvételének problémáját, ahogy a 11.3. alfejezetben de- 
finiáltuk. Alkalmazzuk a GRAPHPLAN algoritmust erre a problémára, és mutas- 
suk meg, hogyan áll elő a megoldás. Adjuk hozzá a kabát és a kalap felvételére 
szolgáló cselekvéseket. Adjuk meg azt a részben rendezett tervet. ami megoldás, 








Kiinduló állapot Célállapot 














11.16. ábra. A Sussman-anomália kockavilág tervkészítési probléma 
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4 veg 


Met 
4. szoba si 
3. villanykapcsoló, 


Tvilsykapcsotó]  Folyosó 








1. villanykapcsoló; 


4. ajtó 





11.17. ábra. Shakey világa. Shakey képes egy szobán belül mozogni. át tud menni a szobák közötti ajtó- 
kon, fel tud mászni tárgyakra, el tudja tolni a mozdítható tárgyakat, valamint a villanyt tudja kapcsolni. 


11.13. 


és mutassuk meg, hogy ennek 180 különböző sorrendezése van. Mi a 180 kü- 
lönböző sorrendezés reprezentációjához szükséges különböző tervkészítő gráf 
megoldások minimális száma? 


Az eredeti STRIPS programot a Shakey robot irányítására készítették. A 11.17. 

ábra a Shakey világának egy változatát mutatja, melyben négy szoba sorakozik 

egy folyosó mentén, melyek mindegyikének van egy ajtaja és van benne egy 
villanykapcsoló. 

Shakey világának cselekvései tartalmazzák az egyik helyről a másikra való 
mozgást, mozgatható tárgyak (mint dobozok) eltolását, szilárd testekre (mint 
dobozokra) való fel- és lemászást, és villanykapcsolók fel-, illetve lekapcsolá- 
sát. A robot önmagában soha nem volt elég ügyes ahhoz, hogy egy dobozra 
másszon vagy egy kapcsolót átkapcsoljon, de a STRIPS tervkészítő képes a ro- 
bot képességein túlmutató terveket találni és megadni. Shakey hat cselekvése a 
következő: 

s — A Megy(x,y), ami feltételezi, hogy Shakey x-ben van, valamint az x és y he- 
lyek ugyanazon szobában vannak. Konvenció alapján a két szoba közötti 
ajtó mindkét szobában benne van. 

s — A b doboz eltolása x pozícióból ugyanazon szoba y pozíciójába: Tol(p, x, y). 
Szükségünk lesz a Doboz predikátumra és konstansokra a dobozokhoz. 
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11.14. 


11.15. 


11.46. 


11.17. 
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s — Dobozra felmászás: Felmászik(b); dobozról lemászás: Lernászik(b). Szük- 
ségünk lesz a Rajta predikátumra és a Padió konstansra. 

s A villany felkapcsolása: Felgyújt(s); lekapcsolása: Leolt(5). A lámpa fel-, 
illetve lekapcsolásához Shakey-nek egy dobozon kell állnia a villanykapcso- 
ló mellett. 

A 11.17. ábra alapján írja fel Shakey hat cselekvését és a kiinduló állapotot 

STRIps jelölésekkel. Készítsen tervet Shakey számára, hogy a Doboz; dobozt a 

Szoba; szobába mozgassa. 


Láttuk, hogy a tervkészítési gráfok, csak ítéletlogikai cselekvéseket képesek kezel- 
ni. Mi van, hogyha a tervkészítő gráfokat a célban változókat is tartalmazó problé- 
mákra kívánjuk alkalmazni, mint az Ot(P)j, x) A OtPo, x), ahol x egy véges te- 
rület pozícióiból kerül ki? Hogyan tudna egy ilyen problémát átkódolni, hogy 
tervkészítő gráfokkal dolgozhasson? (Segítség: emlékezzen a részben rendezett 
tervkészítés Vége cselekvésére. Ehhez milyen előfeltételeknek kellene tartozni?) 


Egészen eddig feltételeztük, hogy a cselekvések csak a megfelelő helyzetekben 

kerülnek végrehajtásra. Nézzük, hogy az ítéletlogikai követő állapot axiómák 

(mint a 11.1 egyenlet axiómája) mit mondanak az olyan cselekvésekről, melyek 

előfeltételei nem teljesülnek. 

(a) Mutassa meg, hogy az axiómák azt jósolják, hogy semmi sem történik, 
amikor egy cselekvést olyan állapotban hajtunk végre, melyben az előfel- 
tételei nem teljesülnek. 

(b) Vegyünk egy p tervet, ami tartalmazza a cél eléréséhez szükséges cselek- 
véseket és illegális cselekvéseket is. Igaz, hogy ebben az esetben 


kiinduló állapot A követő állapot axiómák Nptk cél 


(c) Egy szituációkalkulusban elsőrendű követő állapot axiómák esetén (mint a 
10. fejezetben) lehetséges bizonyítani, hogy egy illegális cselekvéseket tar- 
talmazó terv elérje a célt? 


A repülőtér problémakörből adott példákkal magyarázza meg, hogy a szimbóhum- 
szétválasztás hogyan csökkenti az előfeltétel és a cselekvéskizárási axiómák 
méretét. Származtasson egy általános képletet, mely az axiómahalmazok méretét 
adja meg az időlépések száma, a cselekvéssémák száma, ezek aritása, valamint 
a tárgyak száma függvényében. 


A 11.15. ábrán szereplő SATPLAN algoritmusban a minden kielégíthetőségi al- 

gorítmus hívás egy további § ő célt eredményez, ahol a 7 értékkészlete 0 ... 

Tmnax: Tegyük fel, hogy ehelyett a kielégíthetőségi algoritmust csak egyszer hívjuk 

meg ag vg! v... v gfrex céllal. 

(a) Ez mindig ad vissza tervet, amennyiben létezik egy Tnax hosszúságú vagy 
annál rövidebb terv? 

(b) Eredményez ez a módszer új hibás megoldásokat? 

(c) Vizsgáljuk meg, hogy hogyan lehetne módosítani egy kielégíthetőségi 
algorimust, például a WALKSAT algoritmust, hogy az (amennyiben létezik) 
rövid megoldásokat találjon, amennyiben hasonló diszjunktív célt kap. 


12. TERVKÉSZÍTÉS ÉS CSELEKVÉS 
A VALÓ VILÁGBAN 


Ebben a fejezetben láthatjuk, hogy a kifejezőbb reprezentáció és az interaktívabb ágens- 
architektúrák hogyan vezetnek a valós világban is használható tervkészítőkhöz. 


Az előző fejezet a tervkészítés legalapvetőbb fogalmait, reprezentációit és algoritmusait 
vezette be. A való világ feladataihoz. mint a Hubble-űrteleszkóp megfigyeléseinek üte- 
mezésére, gyárak működtetésére vagy hadműveletek logisztikai kezelésére jóval összetet- 
tebb tervkészítőket használnak. Ezek kiterjesztik az alaptípusokat mind a reprezentációs 
nyelv, mind pedig a tervkészítés és a környezet együttműködésének szempontjából. 
Ez a fejezet bemutatja hogyan. A 12.1. alfejezet az idő- és erőforráskorláttal rendelke- 
ző tervkészítést mutatja be. A 12.2. alfejezet az előre definiált résztervekhez történő 
tervkészítést írja le. A 12.3-12.6. alfejezet olyan ágensarchitektúrákat mutat be, melye- 
ket a bizonytalan környezet kezelésére terveztek. A 12.7. alfejezet bemutatja, hogyan 
tervezzünk, amikor a környezet más ágenseket is tartalmaz. 


12.1. IDŐ, ÜTEMEZÉS ÉS ERŐFORRÁSOK 


A STRIP reprezentáció azt írja le, hogy mit csinálnak a cselekvések, de mivel a repre- 
zentáció a szituációkalkuluson alapul, nem tartalmazza, hogy milyen hosszú egy cselek- 
vés, sem azt, hogy mikor következik be, kívéve azt, hogy egy másik cselekvés előtt 
vagy után jön. Néhány feladatkörben azt szeretnénk tudni, hogy a cselekvések mikor 
kezdődnek és végződnek. A teherszállítási problémakörben például, azt szeretnénk tud- 
ni, hogy egy adott csomagot hordozó repülőgép mikor érkezik. nem csak azt, hogy 
megérkezik, amikor a repülésnek vége. 

Az alkalmazások egy általános családjának, az ütemezési feladatok (job shop 
scheduling) családjának a lényege az idő. Az ilyen feladatok munkák elvégzését igény- 
lik, melyek mindegyike cselekvések sorozatából áll, ahol minden cselekvés adott idő- 
tartamú és bizonyos erőforrásokat igényelhet. A probléma, hogy egy olyan ütemezést 
határozzunk meg. ami — az erőforráskorlátok figyelembevétele mellett — minimalizálja 
az összes feladat elvégzéséhez szükséges összidőt. 

A 12.1. ábrán egy ütemezési feladatra láthatunk példát. Ez egy nagyon leegyszerűsí- 
tett autó-összeszerelési feladat. Két munkánk van, a C) és a C; autó összeszerelése. 
Minden munka három cselekvésből áll: a motor beszerelése, a kerekek felszerelése, 
valamint az eredmény végső ellenőrzése. Először a motort kell berakni (mivel az első 
kerekek beszerelése megakadályozná, hogy hozzáférjünk a motortérhez), a vizsgálatot 
pedig értelemszerűen utoljára kell végrehajtani. 
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Kiindulás(Karosszériaf Ci) A Karosszéria( Ca) 
A Moror(Eu, Ca 30) A MorortE2, C2. 60) 
A KerekekíW), Cs, 30) A Kerekek(W2, Ca, 159) 
CÉKKÉSZ(CI) A Kész(C2)) 


CselekvéstMotortBeszereke, c), 
ELŐFELTÉTEL: Motorfe, c, d) A Karosszériatc) A -MotorBennetc) 
KÖVETKEZMÉNY: MotorBenne(c) A időtartamtd) 

Cselekvés(KerekeketFelszerelíw, c), 

ELŐFELTÉTEL: Kerekekíw, c, d) A Karosszériatc) h MotorBennetc) 
KÖVETKEZMÉNY: KerekekRajta(c) A Időtrartamíd)) 

CselekvéstÁtvizsgáltc), 

ELŐFELTÉTEL: MotorBenne(c) A KerekekRajta(c) A Karosszéria(c) 
KÖVETKEZMÉNY: Készíc) A Időtartamí10)) 











12.1. ábra. A két autó összeszerelését tartalmazó ütemezési feladat. A jelölésben az Időtartam(d) jelenté- 
se, hogy egy cselekvés d percet vesz igénybe. A MotorfEj, C4, 60) jelentése az, hogy az Ep egy motor, 
ami a Ci alvázba illeszthető és 60 perc alatt szerelhető be. 


A 12.1. ábrán látható probléma bármely eddig látott tervkészítővel megoldható. 
A 12.2. ábra (ha a számokkal nem törődünk) a részben rendezett tervkészítő megoldá- 
sát mutatja. Hogy az inkább egy ütemezési. mintsem egy tervkészítési feladat legyen, 
minden cselekvéshez meg kell határoznunk, hogy mikor kezdődjön és mikor végződ- 
jön. Ez azt jelenti, hogy figyelnünk kell minden cselekvés hosszára, csakúgy, mint 
a sorrendjére. Az Időtartamíd) jelölés egy cselekvés kapcsán (ahol d csak egy számmal 
helyettesíthető be) azt jelenti, hogy egy cselekvés elvégzéséhez d percre van szükség. 

Ha adott a cselekvések egy részleges rendezése az időtartamokkal, ahogy a 12.2. ábra 
is mutatja, akkor a kritikus útvonal módszer (critical path method — CPM) felhasz- 
nálható az egyes cselekvések lehetséges kezdési és befejezési időpontjainak meghatá- 
rozására. Egy részben rendezett tervben található útvonal, cselekvések egy lineárisan 
rendezett sorozata, ami az Indít-ból indul és a Befejez-ben fejeződik be (például a 12.2. 
ábra részben rendezett tervében két út található). 

A kritikus útvonal (critical path) az az út, amelynek a teljes ideje a leghosszabb; 
az útvonal , kritikus", mert meghatározza a teljes terv hosszát. Más utak rövidítése nem 
rövidíti a terv egészét, de a kritikus útvonalon lévő bármely cselekvés kezdetének el- 
halasztása a teljes tervet lassítja. Az ábrán a kritikus útvonal vonalát vastag vonallal 
jelöljük. Hogy a teljes tervet minimális idő alatt hajtsuk végre, a kritikus útvonal cse- 
lekvéseit úgy kell végrehajtani, hogy köztük ne legyen késleltetés. A kritikus útvonalon 
kívül eső cselekvéseknek van valamennyi mozgásterük — egy időablak, amelyben vég- 
rehajthatók. Ezt az időablakot a kezdeti időpont lehető legkorábbi (ES) és a lehető 
legkésőbbi (2.5) értékével definiáljuk. Az LS — ES mérőszámot, a cselekvés mozgás- 
terének (slack) nevezzük. A 12.2. ábrán láthatjuk, hogy a teljes terv 85 percet vesz 
igénybe, a kritikus útvonal minden cselekvésének a mozgástere 0 (ez mindig igaz), és 
a Cy összeszerelésének minden cselekvése egy 15 perces ablakban indítható. A cselek- 
vések ES és LS idői a probléma ütemtervét (schedule) adják. 
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12.2. ábra. A 12.1. ábrán szereplő ütemezési probléma megoldása. Az ábra tetején a részben rendezett 
terv megoldása látható. Minden cselekvés hozza a téglalap alján látható, a legkorábbi és a legkésőbbi 
kezdési időkkel (ES, LS) a bal felső sarokban. A két szám között különbség a cselekvés mozgástere, a 0 
mozgásterű cselekvések a kritikus útvonalon vannak, melyeket vastag vonallal jelölünk. Az ábra alján 
ugyanezen megoldás időrendjét láthatjuk. A szürke téglalapok azt az intervallumot jelölik, ami alatt 
a cselekvés végrehajtható, feltételezve, hogy a sorrendezési megkötéseket betartjuk. A szürke téglalapok 
nem felhasznált, nem kitöltött területei a mozgásteret jelölik. 


A következő kifejezések az ES és LS definícióiként szolgálnak, és egyúttal a kiszá- 
mításukra szolgáló dinamikus programozási algoritmust is körvonalazzák: 


ES(indír) — 0 

ES(B) — maxa ., g ES(A) -- Időtartam(A) 
LS(Befejez) — ES(Befejez) 

LS(A) — min, ., g LS(B) — Időtartam(A) 


Az ötlet az, hogy az ES(Indít) értékének 0-ra állításával indítunk. Ezután, amint elérünk 
egy olyan B cselekvést, hogy minden cselekvés, ami közvetlenül B előtt jön, már ren- 
delkezik ES értékekkel, az ES(B) értéket a közvetlenül megelőző cselekvések közül a 
legkorábbi befejezési idő maximumára állítjuk be, ahol a legkorábbi befejezési időt úgy 
definiáljuk, mint a cselekvés kezdési időpontja plusz a cselekvés időtartama. A folya- 
mat addig folytatódik, amíg minden cselekvéshez egy ES értéket rendelünk. Az LS 
értékeket hasonlóképpen számítjuk ki a Befejez cselekvéstől visszafelé haladva. A rész- 
leteket egy későbbi feladat tartalmazza. 

A kritikus útvonal algoritmus komplexitása csak O(Nb), ahol W a cselekvések száma 
és b az egy cselekvésbe be-, illetve kimenő maximális elágazások száma. (Ennek meg- 
értéséhez vegyük észre, hogy az £S és ES számításokat minden cselekvésre csak egy- 
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szer hajtjuk végre, és minden számítás legfeljebb b másik cselekvésen megy végig.) 
Ezért, ha adott a cselekvések egy részben rendezése, a minimális időtartamú ütemezés 
megtalálása elég könnyedén elvégezhető. 


Ütemezés erőforráskorlátokkal 


A valós ütemezési problémákat az erőforrásokra (resources) vonatkozó korlátozások 
jelenléte megbonyolítja. Például egy motornak az autóba szereléséhez egy motoremelő- 
re van szükség. Ha csak egyetlen emelőnk van, akkor nem tudjuk egyszerre beszerelni 
az Ej motort, a Cy és az E, motort a C2 autóba, így a 12.2. ábrán bemutatott ütemezés 
végrehajthatatlan. A motoremelő példa egy újrahasznosítható erőforrásra (reusable 
resource). Az erőforrás foglalt, amíg a cselekvés tart, de újra használhatóvá válik annak 
befejezése után. Vegyük észre, hogy az újrahasznosítható erőforrásokat nem tudjuk a ha- 
gyományos előfeltétel és következmény alakú cselekvésleírásokkal kezelni, mert a ren- 
delkezésre álló erőforrás-mennyiség nem változik, miután egy cselekvést lezártunk.! 
Ezért kiterjesztjük a leírásunkat, hogy egy ERŐFORRÁS: R(X)-t is tartalmazzon, amelynek 
jelentése, hogy k egység R típusú erőforrásra van szükség a cselekvéshez. Az erőforrás- 
szükséglet mind előfeltétel (a cselekvés nem hajtható végre, ha az erőforrás nem érhető 
el), mind pedig átmeneti következmény, abban az értelemben, hogy az R erőforrás 
rendelkezésre állása k-val csökken a cselekvés időtartama alatt. A 12.3. ábra mutatja, 
hogyan lehet a motorbeszerelés problémáját kiterjeszteni, hogy az három erőforrást is 
tartalmazzon: egy motoremelőt a motorok beszereléséhez, egy kerékállomást a kerekek 
felszereléséhez és két vizsgálóbiztost. A 12.4. ábra a legrövidebb szerelési idejű megol- 
dást mutatja, ez 115 percet igényel. Ez hosszabb, mint az erőforrás-megkötések nélküli 
85 perces ütemezés. Vegyük észre, hogy nincs olyan időpillanat, amikor mindkét vizs- 
gálóbiztosra szükség van, ezért az egyik vizsgálóbiztost azonnal egy termelékenyebb 
posztra helyezhetjük. 

Az erőforrások numerikus mennyiségekként történő leírása mint a Viízsgálóbiz- 
tosok(2), a megnevezett entitások használata helyett, mint a Vizsgálóbiztos(fj) és a 
Vizsgálóbiztosí[ 9), jó példa a nagyon általánosan használt aggregációs (aggrega- 
tion) technikára. Az aggregáció központi ötlete, hogy egyedi objektumokat csopor- 
tosítsunk mennyiségekké, amikor maguk az objektumok nem megkülönböztethetők 
a cél szempontjából. Az összeszerelési problémánkban nem számít, hogy melyik 
vizsgálóbiztos vizsgálja az autót, ezért nincs szükség különbségtételre. (Ugyanez az 
ötlet működik a 3.9. feladat misszionáriusok és kannibálok problémájára.) Az aggre- 
gáció a komplexitás csökkentéséhez elengedhetetlen. Vizsgáljuk meg, mi történik, 
ha egy ütemezés 10 konkurrens Vizsgálat cselekvést tartalmaz, de csak 9 vizsgáló- 
biztos áll rendelkezésre. Ha a vizsgálóbiztosokat mint mennyiségeket reprezentál- 
juk, a bukást az algoritmus azonnal detektálja, és visszalép, hogy egy másik üteme- 
zéssel próbálkozzon. Ha a vizsgálóbiztosokat önálló személyekként reprezentáljuk, 
akkor az algoritmus feleslegesen mind a 10! vizsgálóbiztos-kiosztás kipróbálásához 
visszalép. 


1 Ezzel szemben a fogyóeszköz-erőforrások (consumabte resources), mint az autó-összeszereléshez 
használt csavarok, az eredeti keretrendszeren belül kezelhetők: lásd 12.2. feladat. 
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Kiindulás(Karosszériat Cp) A Karosszériat Co) 

A Motor(E, Ci, 30) A Motor(E, Ca, 60) 

A Kerekek(WI, Cr, 30) A Kerekek(W, C, 15) 

A MotorEmelő(1) A Kerékcsereállomást1) A Vizsgálóbiztosí2ji 
CÉKKésztC4) A Kész(Ca)) 


Cselekvés(MotortBeszeret(e, e, m), 
ELŐFELTÉTEL: Motortfe, c. d) A Karosszériatc) A -MotorBenneíc) 
KÖVETKEZMÉNY: MotorBenne(c) A Időtartamíd) 
ERŐFORRÁS: MotorEmető(1)) 
Cselekvés(KerekeketFelszereltw, c), 
ELŐFELTÉTEL: Kerekekíw, c. d) A Karosszériatc) A MotorBenne(c) 
KÖVETKEZMÉNY: KerekekRajta(c) A Időtartamíd) 
ERŐFORRÁS: KerékcsereÁllomás(1) 
Cselekvés(Árvizsgálc), 
ELŐFELTÉTEL: MotorBenne(c) A KerekekRajta(c) 
KÖVETKEZMÉNY: Készte) A Időtartam(10) 
ERŐFORRÁS: Vizsgálóbiztosí1)) 











12.3. ábra. Két autó összeszerelésének ütemezési feladata erőforrásokkal. Egy összeszerelő állomás, egy 
kerékszerelő-állomás és két vizsgálóbiztos az összes elérhető erőforrás. Az ERŐFORRÁS: jelölés jelentése, 
hogy az r erőforrást egy cselekvés végrehajtása alatt használjuk, de a cselekvés befejezése után újra szabad. 





124. ábra. A 12.3. ábra erőforrásokat is tartalmazó ütemezési feladatának megoldása. Az ábra bal széle 
az erőforrásokat sorolja fel, a cselekvések az általuk használt erőforrásokkal egy sorban jelennek meg. 
Attól függően, hogy melyik összeszerelés használja a motorszerelő-állomást először, két lehetséges üte- 
mezés létezik. Mi az optimális megoldást ábrázoltuk, ami 115 percet vesz igénybe. 


Az előnyök ellenére, az erőforrás-megkötések nagyon megbonyolítják az ütemezési 
feladatokat azáltal, hogy a cselekvések közé további kölcsönhatásokat vezetnek be. Ha- 
bár a megkötések nélküli ütemezés a kritikus útvonal módszer felhasználásával könnyű, 
a legkorábbi befejezési idejű erőforrás-megkötéseket tartalmazó ütemezés megtalálása 
NP-nehéz. Ez a komplexitás gyakran mind a gyakorlatban, mind az elméletben látható. 
Az 1963-ban közzétett nagy kihívást jelentő feladat — egy optimális ütemezés megtalá- 
lása egy 10 gépet, 10 munkát és 100 cselekvést tartalmazó problémához — 23 évig meg- 
oldatlan maradt (Lawler és társai, 1993). Sok megközelítést kipróbáltak, köztük az 
elágazásos megkötést, a szimulált lehűtést, a tabu keresést, a kényszerkielégítést és 
számos más, a II. részben szereplő technikát. A legegyszerűbb, de népszerű heurisztika 
a minimális tartalék (minimum slack) algoritmus. Ez a cselekvéseket mohó jelleggel 
ütemezi. Minden iterációban megnézi azokat a cselekvéseket, amelyeknek az összes 
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előzményét már ütemeztük, és azt ütemezi, amelyiknek a legkevesebb tartalék ideje van 
a legkorábbi lehetséges kezdéshez. Ezután frissíti az ES és LS időértékeket minden 
egyes érintett cselekvésre, és ezt ismétli. 

A heurisztika ugyanazon az ötleten alapul, mint a legjobban korlátozott változó heu- 
risztika a kényszerkielégítésnél. Ez a gyakorlatban gyakran jól műl , de a mi össze- 
szerelési problémánkra egy 130 perces megoldást ad, nem pedig a 12.4. ábrán bemutatott 
115 perceset. 

Az ebben a fejezetben bemutatott megközelítés a , tervezzünk először, ütemezzünk 
később" megközelítés: azaz a teljes problémát egy tervkészítési fázisra és egy ütemezési 
fázisra bontjuk. A tervezési fázisban a cselekvéseket részben rendezzük, hogy elérjük 
a probléma céljait, az ütemezési fázisban pedig az időinformációkat illesztjük a tervhez, 
ezzel biztosítva, hogy a terv kielégítse az erőforrás- és a határidőkorlátokat. Ez a meg- 
közelítés nagyon gyakori a valós idejű gyártási és logisztikai problémákban, ahol a 
tervkészítési fázist leggyakrabban emberi szakértők végzik. Ellenben, amikor sok erő- 
forrás-megkötés van, adódhat, hogy néhány érvényes terv sokkal jobb ütemezéshez 
vezet, mint mások. Ebben az esetben, a tervkészítési és ütemezési fázist célszerű integ- 
rálni úgy, hogy a részben rendezett tervkészítés során figyelembe vesszük a cselekvé- 
sek időtartamait és átfedéseit. A 11. fejezetben bemutatott számos tervkészítő algorit- 
mus kiterjeszthető úgy, hogy ezt az információt is kezelje. Például a részben rendezett 
tervkészítők az okozati kapcsolatok konfliktusainak detektálásához hasonlóan az erő- 
forráskorlát megsértéseit is detektálni tudják. A heurisztikák módosíthatók, hogy a 
cselekvések teljes költségén túl, a tervek teljes végrehajtási idejét is becsüljék. Ez nap- 
jainkban a kutatás egy aktív területe. 






12.2. HIERARCHIKUS FELADATHÁLÓ TERVKÉSZÍTÉS 


Az egyik legelterjedtebb módszer a komplexitás kezelésére a hierarchikus dekompo- 
zíció (hierarchical decomposition). Az összetett szoftvereket szubrutinok vagy objek- 
tum osztályok hierarchiájából építik fel, a hadseregek különböző egységek hierarchiái, 
a kormányok és cégek igazgatóságokból, osztályokból és alosztályokból állnak. A hierar- 
chikus struktúra fő előnye, hogy a hierarchia minden szintjén egy számítási fetadat, egy 
hadművelet vagy egy adminisztratív feladat az eggyel alatta lévő szint néhány cselekvé- 
sére épül, így e cselekvések megfelelő elrendezése a magasabb szinten lévő feladat meg- 
oldásához kis számítási költséggel jár. Másrészről a nem hierarchikus módszerek a fel- 
adatot nagyszámú, független cselekvésre bontják fel, ami nagy léptékű feladatok esetén 
egyáltalán nem praktikus. A legjobb esetben — amikor a magas szintű megoldásokhoz 
mindig kielégítő alacsony szintű megvalósítás tartozik — a hierarchikus megoldások az 
exponenciális idejű tervkészítő algoritmusokkal szemben lineáris időre vezetnek. 

Ez az alfejezet a hierarchikus feladathálókon vagy HFH-kon (hierarchical task 
networks — HTN) alapuló tervkészítési módszert mutatja be. A megközelítésünk ötvözi 
a részben rendezett tervkészítés (11.3. alfejezet) alapötleteit, illetve a , HFH-tervkészítés" 
területét. A HFH-tervkészítésben a kiinduló problémát, amely a feladatot írja le, a vég- 
rehajtandó feladat egy nagyon magas szintű leírásának tekintjük. például: építsünk egy 
házat. A terveket cselekvésdekompozíciókkal (action decomposítions) finomítjuk. 
Minden cselekvésdekompozíció a magas szintű cselekvést alacsonyabb szintű cselek- 
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vések részben rendezett halmazára bontja. A cselekvésdekompozíció ezért a cselekvé- 
sek megvalósítására vonatkozó ismereteket testesíti meg. Például egy ház felépítése az 
engedélyek megszerzésére, a kivitelező megbízására, az építkezés elvégzésére és a 
kivitelező kifizetésére redukálható. (A 12.5. ábra egy ilyen dekompozícióra mutat 
példát.) A folyamat addig folytatódik, amíg csak az egyszerű cselekvések (primitive 
actions) maradnak a tervben. Az egyszerű cselekvések tipikusan azok a cselekvések, 
amelyeket az ágens automatikusan végre tud hajtani. Egy általános kivitelezőre a , kert- 
építés" egy egyszerű cselekvés lehet, mert egyszerűen csak egy kertépítő bevonását 
jelenti. Egy kertépítő számára azonban az olyan cselekvések tekinthetők egyszerűnek, 
mint az , ültessen rododendront ide". 

A , tiszta" HFH-tervkészítésben a terveket csak egymást követő cselekvésdekom- 
pozíciókkal állítjuk elő. A HFH ezért a tervkészítést a cselekvésleírások konkretizálá- 
sának tekinti, szemben az üres cselekvésből kiinduló cselekvésleírás elkészítésének 
folyamatával (ami az állapottér-keresésre és a részben rendezett tervkészítésre is igaz). 
Végezetül kiderül, hogy minden STRIPS cselekvésleírás egy cselekvésdekompozícióra 
írható át (lásd 12.6. feladat), és a részben rendezett tervkészítés a tiszta HFH-terv- 
készítés egy speciális esetének tekinthető. Bizonyos feladatokra azonban — különösen 
, szokatlan" konjunktív célokra — a tiszta HFH-nézőpont eléggé természetellenes, így 
egy hibrid megközelítést részesítünk előnyben, ahol a cselekvésdekompozíciókat mint 
a részben rendezett tervkészítés tervfinomításait használjuk fel, a nyitott előfeltételek telje- 
sítése és az ütközés feloldásra szolgáló rendezési megkötések hozzáadása mellett. (Annak, 
hogy a HFH-tervkészítést a részben rendezett tervkészítés kiterjesztésének tekintjük, 
további előnye, hogy egy teljesen új jelölésrendszer bevezetése helyett ugyanaz használha- 
tó.) Kezdésként a cselekvések dekomponálását mutatjuk be részletesebben, majd elmagya- 
rázzuk, hogy a részben rendezett tervkészítést hogyan kell módosítani a dekompozíciók 
kezeléséhez. Végezetül a teljesség, a komplexitás és a használhatóság kérdéseit tárgyaljuk. 


A cselekvésdekompozíciók reprezentációja 


A cselekvésdekompozíciós módszerek általános leírásait egy tervkönyvtárban (plan 
libary) tároljuk, ahonnan kinyerhetők és a készülő terv igényeinek megfelelően fel- 
használhatók. Minden módszer egy Dekomponáka, d) formájú kifejezés, amelynek jelen- 
tése, hogy egy a cselekvés dekomponálható a d tervbe, mely egy — a 11.3. alfejezetben 
leírtaknak megfelelő — részben rendezett tervként van megadva. 

A házépítés egy szép, konkrét példa, ezért ezt használjuk fel a cselekvésdekompozíció 
bemutatására. A 12.5. ábra a HázatÉpít cselekvés egy lehetséges dekompozícióját mutatja 
négy alacsonyabb szintű cselekvésre. A 12.6. ábra néhány cselekvés leírását tartalmazza 
erre a feladatkörre, valamint a házépítés dekompozícióját, ahogyan az a tervkönyvtárban 
megjelenne. A könyvtárban más lehetséges dekompozíciók is szerepelhetnek. 

A dekompozíció Indít cselekvése szolgáltatja a terv cselekvéseinek összes olyan elő- 
feltételét, melyet más cselekvés nem állít elő. Ezeket külső előfeltételeknek (external 
preconditions) nevezzük. Példánkban a dekompozíció külső előfeltételei a Telek és a 
Pénz. Hasonlóképp a Befejez etőfeltételei a külső következmények (external effects). 
Ezek a terv cselekvéseinek összes olyan következményét jelentik, melyeket más cselek- 
vések nem negálnak. Példánkban a HázatÉpít külső következményei a Ház és a -Pénz. 
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Néhány HFH-tervkészítő szintén különbséget tesz az elsődleges következmények 
(primary effects), mint a Ház, és a másodlagos következmények (secondary effects), 
mint a -Pénz között. Mivel mindkét típusú következmény felhasználása ütközésekhez 
vezethet más cselekvésekkel, csak az elsődleges következményeket használhatjuk a célok 
elérésére, ami nagymértékben csökkenti a keresési teret.? 








12.5. ábra. A HázatÉpít cselekvés egy lehetséges dekompozíciója 


A dekompozíciónak a cselekvés egy korrekt megvalósításának kell lennie. A d terv 
egy a cselekvést korrekten valósít meg, ha d egy teljes és konzisztens részben rendezett 
terv arra a problémára, ahol a előfeltételeiből a következményeit kell elérnünk. Ha a 
dekompozíció egy helyesen működő részben rendezett tervkészítő futásának eredmé- 
nye, akkor nyilvánvalóan korrekt. 

Bármely magas szintű cselekvéshez a tervkönyvtár számos dekompozíciót tartalmazhat, 
például a HázatÉpít-nek lehet egy másik dekompozíciója, amely a folyamatot úgy írja le, 
hogy a házat az ágens saját kezűleg építi kövekből és malterből. Minden dekompozíciónak 
egy korrekt tervnek kell lennie, de a magas szintű cselekvésleírásban szereplőkön túl to- 
vábbi előfeltételeket és következményeket is tartalmazhat. Például a HázatÉpít 12.5. ábrán 
látható dekompozíciója a Telek mellett a Pénz-t is megköveteli, és következménye a 
-Pénz. Másrészről a saját kezű építés nem igényel pénzt, de szükséges hozzá egy felhasz- 
nálásra váró Kő és Malter készlet, valamint eredménye lehet egy FájósHát. 

Mivel egy magas szintű cselekvésnek, mint amilyen a HázatÉpít, számos lehetséges 
dekompozíciója lehet, elkerülhetetlen, hogy a STRIPS cselekvésleírása elrejtse ezen 
dekompozíciók néhány előfeltételét vagy következményét. A magas szintű cselekvés 
előfeltételeit a dekompozícióiban szereplő külső előfeltételek merszete, míg a következ- 
ményit a dekompozíciók külső következményeinek metszete adja. Másképpen, a magas 
szintű előfeltételek és következmények garantáltan részhalmazai minden egyszerű ímp- 
lementáció valós előfeltételeinek és következményeinek. 


2 Ez néhány nem várt terv előállítását is megakadályozhatja. Például egy csődeljárás előtt álló személy min- 
den ingó vagyonát eltüntetheti (a -Pénz elérésével) egy ház megvásárlásával vagy megépítésével. Ez a terv 
hasznos, mert az aktuális törvény kizárja az elsődleges lakóhely hitelezők általi lefoglalását (legalábbis az USA- 
ban — a szerk). 
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CsetekvésíTelketVásárol, ELŐFELTÉTEL: Pénz KÖVETKEZMÉNY: Telek A —Pénz) 
Cselekvés(KölcsöntVeszFel, ELŐFELTÉTEL: Hitel, KÖVETKEZMÉNY: Pénz A Adósság) 
Cselekvés(HázatÉpít. ELŐFELTÉTEL: Telek, KÖVETKEZMÉNY: Ház) 


Cselekvés(EngedélytSzerez, ELŐFELTÉTEL: Telek, KÖVETKEZMÉNY: Engedély) 
Cselekvés(KivitelezőtVeszFel, ELŐFELTÉTEL: Szerződés) 
Cselekvés(Építkezés, ELŐFELTÉTEL: Engedély A Szerződés, 
KÖVETKEZMÉNY: HázFelépítve A -Engedély) 
Cselekvés(KivitelezőtKifizet, ELŐFELTÉTEL: Pénz A HázFelépítve, 
KÖVETKEZMÉNY: -Pénz A Ház A —Szerződés) 
Dekomponál(HázatÉpít, 
TerűLÉPÉSEK:($4: EngedélytSzerez, 52: KivitelezőtVeszFel, 
Sz: Építkezés, Sa; KivitelezőtKifizer) 
RENDEZÉSEK: [/ndít A 512 52 §zX §4 — Befejez, indít A §2 £ Szi, 
KAPCSOLATOK: Hndít—BE S kndít —5 §4, 
§1—eetéh ) §), Sz —eződés a s, 5 — Hefetsine a 54, 
$—E a Befejez, 5— 50 Befejez))) 

















12.6. ábra. A házépítési probléma cselekvéseinek leírása és a HázatÉpít cselekvés részletes dekom- 
pozíciója. A leírások a pénzzel kapcsolatban egy egyszerűsített, az építőkkel kapcsolatban egy optimista 
nézetet alkalmaznak. 


Az információ elrejtésének két másik formáját is meg kell említenünk. Először, a magas 
szintű leírás teljes mértékben figyelmen kívül hagyja a dekompozíciók összes belső követ- 
kezményét (internal effects). Például a HázatÉpít általunk javasolt dekompozíciójának 
ideiglenes belső következménye az Engedély és a Szerződés. ? Másodszor, a magas szintű 
leírás nem specifikálja a cselekvésen belüli időintervallumot, ami alatt a magas szintű elő- 
feltételeknek és következményeknek teljesülniük kell. Például a Telek előfeltételnek csak 
addig kell teljesülnie (a közelítő modellünkben), amíg az EngedélytSzerez nem hajtódik 
végre, és a Ház csak a KivitelezőtKifizet végrehajtása után igaz. 

Az információ elrejtésének ez a módja szükségszerű, ha a hierachikus tervezés cél- 
ja a komplexitás csökkentése. Szükséges, hogy a magas szintű cselekvésekről anél- 
kül dönthessünk, hogy a számtalan implementációs részlet miatt aggódnánk. Ennek 
azonban ára van. Konfliktusok léphetnek fel, például egy magas szintű cselekvés bel- 
ső feltételei, valamint egy másik magas szintű cselekvés belső cselekvései között, 
miközben a magas szintű leírások alapján nincs mód ezek detektálására. Ennek a 
problémának komoly hatásai vannak a HFH-tervkészítő algoritmusokra. Dióhéjban, 
míg a tervkészítő algoritmus az atomi cselekvéseket, mint pontszerű eseményeket 
kezelheti, a magas szintű cselekvéseknek időbeli kiterjedése van, ami alatt minden 
mehet tovább. 


3 Az Építkezés negálja az Engedély-t, egyébként ugyanazon engedély több ház megépítéséhez is használ- 
ható lenne. Sajnos az Építkezés nem zárja le a Szerződés-t. mert előbb a KivitelezőtKífizet-et kell végrehajta- 
nunk. 
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A tervkészítő módosítása a dekompozíciók kezeléséhez 


Most megmutatjuk, hogyan módosítható a részben rendezett tervkészítő, hogy egy 
HFH-tervkészítőt is tartalmazzon. Ehhez a részben rendezett tervkészítő állapotátmenet- 
függvényét (lásd 468. olda!) módosítsuk úgy, hogy lehetővé tegye a 7 aktuális részleges 
terven a dekompozíciós módszerek alkalmazását. Az új következő terveket úgy alakít- 
juk ki, hogy először kiválasztunk néhány nem-atomi a" cselekvést a 7-ből, majd a terv- 
könyvtár minden Dekomponáka, d) metódusára, amelyben a 8 behelyettesítéssel az 
a és a" egyenlővé válik, az a"-t behelyettesítjük a d" — SUBST(8, d)-vel. 

A 12.7. ábrán egy példa látható. Az ábra tetején egy ház megszerzésére vezető T terv 
található. Az a! — HázatÉpít magas szintű cselekvést választottuk a dekompozícióra. 
A 12.5. ábráról a d dekompozíciót választottuk, és a HázatÉpít cselekvést ezzel helyet- 
tesítettük. A dekompozíciós lépés által létrehozott Pénz nyitott feltétel teljesítésére a 
KölcsönrVeszFel járulékos lépést vezettük be. Egy cselekvés helyettesítése annak dekom- 
pozíciójával egy kicsit hasonlít a szervátültetéses műtétekhez. Az új résztervet ki kell 
bontanunk a csomagolásából (az Indít és Befejez lépések közül), be kell illesztenünk és 
mindent megfelelően le kell zámunk. Ezt többféleképpen is megtehetjük. Hogy pontosab- 
bak legyünk, minden lehetséges d" dekompozícióhoz az alábbiakat kell megtennünk: 


1. Először is az a" cselekvést el kell távolítani a T tervből. Ezután a d" minden s lépésére ki 
kell választanunk egy cselekvést, amely kítölti az s szerepét, és hozzá kell adnunk a terv- 
hez. Ez lehet az s egy új példányosítása vagy egy meglévő 5" lépés a 7-ből, ami s-sel 
azonos, A Borkészítés cselekvésdekompozíciója például megkövetelheti a TelketVesz 
cselekvést, de várhatóan használhatjuk ugyanazt a TelketVesz cselekvést, mely már sze- 
repel a tervben, Ezt részfeladat-megosztásnak (subtask sharing) nevezzük. 

A 12.7. ábrán nincsenek megosztási lehetőségek, ezért új cselekvéspéldányokat 
hoztunk létre. Ha egy cselekvést kiválasztottunk, d" minden belső előfeltételét átmá- 
soljuk. Például az EngedélytSzerez cselekvés, az építkezés elé rendelt, és létezik egy 
okozati kapcsolat ezen lépések között, mely szerint az Engedély előfeltétele az Épít- 
kezés-nek. Ez lezárja az a" helyettesítését a dd példányosításával. 


Pénz 
EN mee] vésg éz af eme] 








12.7. ábra. Egy magas szintű cselekvés dekompozíciója egy létező tervben. A HázatÉpít cselekvést a 
12.5. ábra dekompozíciójával helyettesítjük. A felek külső előfeltételt a már létező TelkerVesz-ből kiin- 
duló okozati kapcsolat biztosítja. A Pénz külső előfeltétel nyitott marad a dekompozíciós lépés után, 
ezért a KölcsöntVeszFel cselekvést szúrjuk be. 


12.2. HIERARCHIKUS FELADATHÁLÓ TERVKÉSZÍTÉS 505 


2. A következő lépés, bogy az eredeti tervben szereplő a" sorrendezési megkötéseit 
megfelelően átvezessük a d" lépéseihez. Először vegyük 7 B — a" alakú sorrendezé- 
si megkötéseit. Hogyan kellene B-t rendezni a d" lépéseinek megfelelően? A legké- 
zenfekvőbb megoldás, hogy B az összes d"-ben szereplő lépés előtt jöjjön, amit úgy 
érhetünk el, hogy d" minden Indít — s alakú megkötését a B — s megkötéssel he- 
lyettesítjük. Másrészről ez a megközelítés túlzottan szigorú lehet! Például a TelketVesz 
a HázatÉpít előtt kell következzen, de nincsen szükség arra, hogy a TelketVesz a 
KivitelezőtVeszFel előtt jöjjön a kiterjesztett tervben. Egy túlzottan szigorú rendezés 
felállítása lehetetlenné teheti néhány megoldás megtalálását. Ezért minden rendezé- 
si megkötésre a legjobb megoldás, bogy rögzítsük a megkötés okát. Ha ezután egy 
magas szintű cselekvést kibontunk, az új rendezési megkötések a lehető leglazább- 
ra vehetők az eredeti megkötés okával összhangban. Ugyanezek a megfontolások al- 
kalmazhatók, amikor az a" - C alakú megkötéseket helyettesítjük. 

3. Az utolsó lépés, hogy az okozati kapcsolatokat átvezessük. Haa B—£) a! az ere- 
deti terv egy okozati kapcsolata volt, helyettesítsük azt egy okozati kapcsolathal- 
mazzal, amely B-ből d" összes olyan lépéséhez vezet, amelynek előfeltétele a d 
dekompozíció indít lépése által előállított p (például d" összes lépése, melyekre p 
egy külső előfeltétel). A példában a TelketVesz —£ , HázatÉpít okozati kapcso- 
latot a TelketVesz—"5 ) Engedély kapcsolattal helyettesítjük. (A dekompozícióban 
szereplő KivitelezőtKifizet, Pénz előfeltétele nyitott feltétellé válik, mert az eredeti 
tervben nincs olyan cselekvés, ami a Pénz-t biztosítja a HázatÉpít-hez.) Hasonló- 
képpen a terv összes 1a—55 C okozati kapcsolatát helyettesítsük d" bármely, a d 
dekompozíció Vége lépéséhez p-t szolgáltató lépésből C-be mutató okozati kapcso- 
lathalmazzal (például d" p-t külső következményként tartalmazó lépéséből). Példánk- 
ban a HázatÉpít —S ) Befejez kapcsolatot a KivitelezőtKifizet —£ ; Befejez kap- 
csolattal helyettesítjük. 


Ez lezárja a részben rendezett tervkészítőknél alkalmazott, a dekompozíciók elkészíté- 
séhez szükséges kiterjesztéseket.§ 

A részben rendezett tervkészítő algoritmushoz további módosítások szükségesek, 
mert a magas szintű cselekvések elrejtik az információt a végső elemi megvalósításuk- 
ról. Nevezetesen az eredeti részben rendezett tervkészítő algoritmus hibával lép vissza, 
ha az aktuális terv feloldhatatlan ütközést tartalmaz, vagyis ha egy cselekvés ütközik 
egy okozati kapcsolattal, de nem helyezhető sem elé, sem pedig mögé. (Erre a 11.9. 
ábra mutat példát.) Másrészről, a magas szintű cselekvések esetén a feloldhatatlan üt- 
közések néha feloldhatók az ütköző cselekvések dekompozíciójával és lépéseik össze- 
rendezésével. Erre a 12.8. ábra mutat be egy példát. Így előfordulhat olyan eset, ahol 
dekompozícióval egy teljes és konzisztens alapterv nyerhető, még akkor is, hogyha nem 
létezik teljes és konzisztensen magas szintű terv. Ez a lehetőség azt jelenti, hogy egy tel- 
jes HFH-tervkészítőnek végig kell tekintenie az eredeti részben rendezett tervkészítő- 
höz található számos metszési lehetőséget. Egyébként használhatjuk bármely metszési 
eljárást, remélve, hogy nem hagyunk figyelmen kívül lehetséges megoldást. 


4 Vannak további apró módosítások a magas szintű cselekvések konfliktusfeloldásának kezelésére. Az ér- 
deklődő olvasó ezeknek a fejezet végén hivatkozott irodalmakban nézhet utána. 
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Óra -Óra 
Haj Fésű 







Óra — Boldog(Férf) 
indít 2 etejez 
Haj BoldogíNő) 





(a) Kiindutási feladat 


(c) A (b) dekompozíciója egy konzisztens megoldásra 


12.8. ábra. Az O. Henrik történetből kiragadott Mágusok ajándéka probléma egy inkonzisztens abszt- 
rakt tervet mutat, ami azonban dekomponálható egy konzisztens megoldásra. Az (a) ábra a problémát 
mutatja be: egy szegény házaspárnak csak két értékes tulajdona van. A férfinek egy aranyórája, a nőnek 
pedig a gyönyörű hosszú haja. Mindketten azt tervezik, hogy ajándékot vásárolnak a másiknak, hogy az 
boldog legyen. A férfi úgy dönt, hogy az óráját egy ezüstfésűre cseréli be, míg a nő eladja a haját, hogy 
aranyláncot vegyen az órához. (Feltételezzük, hogy a ,.Fésűt ad" cselekvés előfeltétele a Haj, mivel ha 
a feleségnek nincs hosszú haja, a cselekvés nem éri el a kívánt hatást, hogy boldoggá tegye; és hasonló- 
képpen a , Láncot ad" cselekvésre.) A (b) ábrán szereplő részleges terv inkonzisztens. mert a , Fésűt ad" 
és , Láncot ad" absztrakt lépések nem sorrendezhetők konfliktus nélkül. (c) Dekomponáljuk a , Fésűt ad" 
lépést egy ,beilleszt terv" metódussal. A dekompozíció első lépésében a férj megszerzi a fésűt, és oda- 
adja feleségének, miközben az órát egy későbbi időpontban adja oda fizetségül. A második lépésben az 
órát átadja, és a kötelezettséget teljesíti. Egy hasonló módszer dekomponálja a .Láncot ad" lépést. Amíg 
mindkét odaadó lépést a szállítási lépés elé sorrendezzük, ez a dekompozíció megoldja a feladatot. 
(Vegyük észre, hogy ez azon múlik, hogy a lánc használata az órához vagy a fésű használata a hajhoz 
boldogságot okoz még akkor is, ha a tulajdonjogot már elvesztették.) 


Elemzés 


Kezdjük a rossz hírrel: a tiszta HFH-tervkészítés (ahol az egyetlen megengedett tervfino- 
mítás a dekompozíció), a véges állapottér ellenére is, eldönthetetlen! Ez nagyon elszomo- 
rítónak tűnhet, mivel a HFH-tervkészítés lényege, hogy növeljük a hatékonyságot. Ez a 
nehézség azért lép fel, mert a cselekvésdekompozíciók rekurzívak (recursive) (például 
a sétálás implementálható egy lépés megtételével és utána egy sétálással), így a HFH- 
tervek tetszőlegesen hosszúra nyúlhatnak. Nevezetesen a legrövidebb HFH-megoldás is 
tetszőlegesen hosszú lehet, így nincs arra lehetőség, hogy a keresést egy megadott idő 
után leállítsuk. Ennek ellenére azonban legalább három okunk van a bizakodásra: 


1. Kizárhatjuk a rekurziót, amit csak nagyon kevés tervkészítési feladat igényel meg. 
Ebben az esetben az összes HFH-terv véges vagy megszámlálható hosszúságú. 
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2. Korlátozhatjuk azon megoldások hosszát, amelyekre kíváncsiak vagyunk. Mivel az ál- 
lapottér véges, az olyan terv, amelynek több lépése van, mint az állapottér állapotainak 
száma, mindenképpen tartalmaz ciklust, ami ugyanabba az állapotba többször lép be. 
Az ilyen HFH-megoldások kizárásával nagyon picit vesztünk, de uraljuk a keresést. 

3. Létrehozhatunk egy hibrid megközelítést, ami a részben rendezett és a HFH-terv- 
készítőket kombinálja. A részben rendezett tervkészítés önmagában elegendő, hogy 
eldöntsük, létezik-e terv, így a hibrid feladat is nyilvánvalóan eldönthető. 


A harmadik megoldással egy kicsit óvatosan kell bánnunk. A részben rendezett tervké- 
szítő különböző módokon tud elemi cselekvéseket összehuzalozni, így olyan megoldá- 
sokkal találhatjuk magunkat szembe, amelyek nagyon nehezen érhetők, és amelyeknek 
nincs meg a HFH-tervek szép hierarchikus rendezése. Egy megfelelő kompromisszum, 
hogy a hibrid keresést úgy szabályozzuk, hogy a cselekvésdekompozíciókat előnyben ré- 
szesítjük az új cselekvések hozzáadása előtt, de nem olyan mértékben, hogy tetszőlegesen 
hosszú HFH-tervek jöjjenek létre, mielőtt egy elemi cselekvést hozzáadnánk. A meg- 
valósítás egyik lehetséges módja egy költségfüggvény alkalmazása, amely engedményt 
ad a dekompozíció által bevezetett cselekvésekre. Minél nagyobb az engedmény, a ke- 
resés annál inkább a tiszta HFH-tervkészítésre hasonlít, és a megoldás annál inkább 
hierarchikus. A hierarchikus tervek rendszerint sokkal könnyebben végrehajthatók a va- 
lós helyzetekben, és könnyebben javíthatók, ha valami elromlik. 

A HFH-tervek egy másik fontos tulajdonsága a részfeladat-megosztás lehetősége. 
Emlékezzünk vissza, hogy a részfeladat-megosztás azt jelenti, hogy ugyanazt a cselek- 
vést használjuk fel a tervdekompozícióban szereplő két különböző lépéshez. Ha meg- 
tiltjuk az alfeladat megosztását, akkor a d" dekompozíció minden példányosítása csak 
egyetlen módon hajtható végre, nem pedig sokféleképp, így jelentősen szűkítjük a kere- 
sési teret. Rendszerint ez a szűkítés időt spórol, és a legrosszabb esetben ís az optimá- 
lisnál csak kicsivel hosszadalmasabb megoldásra vezet. Néhány esetben azonban több 
problémát is okozhat. Vegyük például az , élvezzük a mézesheteket, és neveljünk fel 
egy családot" célt. A tervkönyvtár a , házasodj és menj Hawaiira" tervvel állhat elő az 
első részcélra és a , házasodj és legyenek gyermekeid" tervvel a másodikra. A részfeladat 
megosztás nélkül a terv két különálló házasodás cselekvést tartalmaz, ami nagymérték- 
ben kerülendő. 

Egy érdekes példa a részfeladat-megosztás költségeire és előnyeire a fordítók opti- 
malizálásánál fordul elő. Vegyük a tan(x) — sin(x) kifejezés fordításának problémáját. 
A legtöbb fordító ezt két külön szubrutin triviális összeolvasztásával éri el: a tan lépé- 
sek a sin lépések előtt következnek. Vegyük azonban a sin és tan alábbi Taylor soros 
közelítéseit: 

Eső all CZSÁN én ek 

THK) EE ee 15 "315 sin(x) s x 6 to 5040 
Egy részfeladat-megosztást tartalmazó HFH-tervkészítő sokkal hatékonyabb megoldá- 
sokat készíthet, mert a sin kiszámításának számos lépésére választhatja a tan meglévő 
lépéseit. A legtöbb fordító nem alkalmazza ezt a fajta procedúrák közötti megosztást, mert 
az összes lehetséges megosztott terv figyelembevétele túl sok időt venne igénybe. Ehe- 
lyett a legtöbb fordító minden résztervet függetlenül készít el, majd esetleg módosítja az 
eredményt egy optimalizáló használatával. 
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A cselekvésdekompozíció álta! bevezetett járulékos bonyolítások tudatában miért 
hisszük mégis, hogy a HFH-tervkészítés hatékony lehet? A komplexitás valós forrásai 
a gyakorlatban nehezen analizálhatók, ezért vegyünk egy idealizált esetet. Tegyük fel 
például, hogy egy n cselekvésből álló tervet akarunk létrehozni. Egy nemhierarchikus 
előrefelé haladó állapottér-tervező költsége, minden állapotban b megengedett cselek- 
véssel, 0(b"). A HFH-tervkészítő esetén feltételezzünk egy nagyon általános dekom- 
pozíciós formát: minden nem elemi cselekvésnek, d lehetséges dekompozíciója van, 
mindegyik a következő alacsonyabb szinten k cselekvésből áll. Tudni szeretnénk, hogy 
ebben a struktúrában hány különböző dekompozíciós fa létezik. Ha a kiindulási szinten 
n cselekvés van, akkor a gyökér alatti szintek száma logyn, így a belső dekompozíciós 
csomópontok száma I 4 k -4 k2 - ... klogw-t — (n — 1)/(k — 1). Minden belső csomó- 
pontnak d lehetséges dekompozíciója van, így összesen dír-DAk-D lehetséges 
dekompozíciós fa alkotható. Ezt a képletet megvizsgálva láthatjuk, hogy d alacsonyan 
tartása nagy k mellett óriási megtakarításokat eredményezhet. Ha b és d összemérhe- 
tő, akkor gyakorlatilag a nemhierarchikus költség k-adik gyökét vesszük. Másrészről 
azonban egy kisszámú, de hosszú dekompozíciót tartalmazó tervkönyvtár megal- 
kotása, bár lehetővé teszi bármely probléma megoldását, nem mindig lehetséges. 
Másképp mondva, a hosszú makrók, amelyek problémák széles körén alkalmazhatók, 
kiemelten értékesek. 

Egy másik és talán jobb ok arra, hogy a HFH-tervkészítő hatékonyságában higgyünk, 
az, hogy a gyakorlatban működik. A nagyméretű alkalmazásokhoz használt tervkészí- 
tők majdnem mindegyike HFH-tervkészítő, mert a HFH-tervkészítés lehetőséget ad az 
emberi szakértő számára, hogy a komplex feladatok végrehajtásához szükséges elen- 
gedhetetlen tudást átadhassák, hogy a nagy tervek kicsi számítási ráfordítással elkészít- 
hetők legyenek. Például a HFH-tervkészítést az ütemezéssel ötvöző O-PLAN-t (Bell és 
Tate, 1985) arra használták, hogy a Hitachi számára készítsen gyártási terveket. Egy 
tipikus gyártási sor probléma 350 különböző terméket, 35 összeszerelő gépet és több 
mint 2000 különböző műveletet tartalmaz. A tervkészítő egy 30 napos ütemezést készít, 
naponta három 8 órás műszakkal és több millió lépéssel. 

A HFH-tervkészítés kulcsa így egy tervkönyvtár megalkotása, amely a komplex 
magas szintű cselekvések megvalósításához tartalmazza az ismert módszereket. 
A könyvtár megalkotásának egyik módja, hogy a problémamegoldások tapasztalatai- 
ból tanuljunk módszereket. Egy terv elkészítésének gyötrelmes tapasztalatai után az 
ágens elmentheti a tervet a könyvtárba mint egy a feladat (task) által definiált magas 
szintű cselekvés megvalósítási módját. Ily módon az ágens egyre kifinomultabbá 
válik, ahogy a régi módszerekre alapozva új módszerek épülnek. Ennek a tanulási fo- 
lyamatnak egyik fontos szempontja, hogy az elkészített módszereket általánosítani tud- 
ja, a tervből csak a kulcslépéseket megtartva, azaz a probléma példányainak specifikus 
részleteit elhagyva (például az építő nevének és címének elhagyása a tervekről). 
Az ilyen általánosításra alkalmas módszereket a 19. fejezetben mutatjuk be. Számunkra 
elképzelhetetlen, hogy hasonló mechanizmusok nélkül az emberek olyan kompetensek 
lehetnek, mint amilyenek. 
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12.3. TERVKÉSZÍTÉS ÉS CSELEKVÉS 
NEMDETERMINISZTIKUS PROBLÉMAKÖRÖKBEN 


Eddig csak klasszikus tervkészítési (classical planning) környezeteket vettünk figye- 
lembe, amelyek teljesen megfigyelhetők, statikusak és determinisztikusak. Mindezeken 
túl feltételeztük, hogy a cselekvésleírások megfelelők és teljesek. Ilyen körülmények 
között egy ágens először tervez, majd , becsukott szemmel" végrehajtja a tervet. Egy 
bizonytalan környezetben másrészről az ágensnek az érzékeit is fel kell használnia, 
hogy kövesse a történéseket a terv végrehajtása alatt, valamint szükség esetén módosítsa 
vagy helyettesítse a tervet, amennyiben valami váratlan dolog történik. 

Az ágensnek meg kell küzdenie mind a nem teljes, hiányos (incomplete), mind pedig 
a nem megfelelő, hibás (incorrect) információkkal. A nem teljesség abból következik, 
hogy a világ vagy csak részben megfigyelhető, vagy nemdeterminisztikus, vagy mind- 
kettő. Például az irodaszerszekrény ajtaja vagy be van zárva, vagy nincs. Az egyik 
kulcsom vagy kinyitja az ajtót, vagy nem, már amennyiben be van zárva. Ráadásul is- 
mereteim e hiányosságainak vagy tudatában vagyok, vagy nem. Ebből kifolyólag a 
világról alkotott modellem gyenge, de helyes. Másrészről a nem helyesség azért lép 
fel, mert a világ nem szükségszerűen felel meg a róla alkotott modellemnek. Például én 
hihetem, hogy a kulcsom kinyitja az irodaszerszekrényt, de ebben tévedhetek is, ha a 
zárakat kicserélték. A helytelen információ kezelési képességének hiányában az ágens 
olyan buta lehet, mint egy ganajtúró bogár (71. oldal), ami még az után is megpróbálja 
a ganajgolyót bedugni a fészkébe, hogy a golyót eltávolították a fogásából. 

A teljes és korrekt ismeretek megszerzésének lehetősége attól függ, hogy mennyi 
nemdeterminisztikusság van a világban. Korlátos nemdeterminisztikusság (bounded 
indeterminacy) esetén a cselekvéseknek megjósolhatatlan következményei lehetnek, 
de a lehetséges következményeket felsorolhatjuk a cselekvésleíró axiómákban. Például 
amikor feldobunk egy pénzt, jogosan feltételezhetjük, hogy a kimenetele vagy fej, vagy 
írás lesz. Egy ágens kezelheti a korlátos nemdeterminisztikusságot úgy, hogy a terve- 
ket az összes lehetséges körülményre felkészíti. Nem korlátos nemdeterminisztikus- 
ság (unbounded indeterminacy) esetén azonban az előfeltételek vagy hatások halma- 
Za vagy nem ismert, vagy túl nagy ahhoz, hogy kimerítően felsoroljuk. Ez az eset áll 
fenn a nagyon összetett vagy dinamikus problémakörökben, mint amilyenek például az 
autóvezetés, a gazdaságos tervezés vagy a hadműveletek. Egy ágens csak úgy kezelheti 
a nem korlátos nemdeterminisztikusságot, ha felkészítjük arra, hogy átdolgozza a ter- 
veit és/vagy a tudásbázisát. A nem korlátos nemdeterminisztikusság közeli rokonság- 
ban van a 10. fejezetben tárgyalt kvalifikációs problémával (gualification problem) 
(az összes előfeltétel felsorolásának lehetetlenségével, amire egy valódivilág-beli cse- 
lekvésnek szüksége van, hogy a szándékolt hatást elérje). 

A nemdeterminisztikusság kezelésére négy tervkészítő módszer létezik. Az első kettő 
a korlátos nemdeterminisztikusság, a második kettő pedig a nem korlátos nemdeter- 
minisztikusság esetén használható: 

.  Érzékelőmentes tervkészítés (sensorless planning): ez a más néven alkalmazkodó 


tervkészítésnek (conformant planning) nevezett módszer normál, szekvenciális 
terveket készít, melyeket érzékelés nélkül kell végrehajtani. Az érzékelésmentes terv- 
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készítő algoritmusnak biztosítania kell, hogy a terv a célt minden lehetséges körül- 
mény között elérje függetlenül a valós induló állapottól és a cselekvések aktuális 
kimeneteleitől. Az érzékelésmentes tervkészítés a kényszerítésen (coercion) alapul, 
alapgondolata, hogy a világ erőszakkal egy megadott állapotba vihető még akkor is, 
ha az ágensnek csak részleges információi vannak az aktuális állapotról. A kénysze- 
rítés nem mindig lehetséges, így az érzékelésmentes tervkészítés gyakran alkalmaz- 
hatatlan. Az érzékelőmentes feladatmegoldást, amely magában foglalja a hiedelem 
állapottérben történő keresést, a 3. fejezetben mutattuk be, 

s Feltételes tervkészítés (conditional planning): a más néven eshetőségi tervkészítés 
(contingency planning) módszere a korlátos nemdeterminizmust kezeli úgy, hogy 
egy feltételes tervet készít, amely a különböző eshetőségekhez különböző ágakat 
tartalmaz. Csakúgy, mint a klasszikus tervkészítésben. az ágens először tervez, majd 
végrehajtja az elkészített tervet. Az ágens érzékelő cselekvéseket épít a tervbe, hogy 
ellenőrizze a megfelelő feltételeket, így meghatározhatja, hogy a terv mely részét 
hajtsa végre. A légi szállítási feladatkörben például olyan terveink lehetnek, ame- 
lyek a következőket mondják: , ellenőrizd, hogy az SFO repülőtér használható-e. 
Ha igen, repülj oda; egyébként repülj Oaklandba". A feltételes tervkészítéssel a 
12.4. alfejezet foglalkozik. 

" Végrehajtás monitorozás és újratervezés (execution monitoring and replanning): 
ebben a megközelítésben az ágens bármely ezt megelőző tervkészítő technikát felhasz- 
nálhat (klasszikus, érzékelőmentes vagy feltételes), de használ egy végrehajtás moni- 
torozást (execution monitoring), amely eldönti, hogy a terv használható-e az aktuá- 
lis állapotban, vagy újra kell gondolni. Újratervezés (replanning) akkor történik, 
amikor valami hiba lép fel. Ily módon az ágens a nem korlátos nemdeterminisz- 
tikusságot is kezelni képes. Például ha az újratervező ágens nem látta előre az SFO 
lezárásának lehetőségét, észreveheti ezt a szituációt, amikor fellép, és a tervkészítő 
Által új útvonalat találhat a célhoz. Az újratervező ágenseket a 12.5. alfejezetben tár- 
gyaljuk. 

. Folytonos tervkészítés (continuous planning): minden eddig látott tervkészítő arra 
készült, hogy elérje a célt, és megálljon. A folytonos tervkészítő egy életen keresztüli 
működésre van tervezve. Kezelni képes a környezetben fellépő nem várt körülménye- 
ket még akkor is, ha azok az ágenst egy tervkészítés közepén érik. A célújraformálás 
(goal formulation) által képes kezelni a célok elhagyását, illetve új célok keletke- 
Zését is. A folytonos tervkészítést a 12.6. alfejezetben tárgyaljuk. 


"Vegyünk egy példát, hogy megvilágítsuk a különböző ágensek közötti különbségeket. 
A probléma a következő: a kiinduló állapotban adott egy szék, egy asztal és néhány do- 
boz festék. A színe semminek sem ismert, és olyan állapotot kell elémi, ahol az asztal és 
a szék színe azonos. 

A klasszikus tervkészítő ágens nem tudja kezelni ezt a problémát, mert a kiinduló 
állapot nem teljesen specifikált, azaz nem tudjuk, hogy milyen színűek a bútorok. 

Az érzékelőmentes tervkészítő ágensnek egy olyan tervet kell találni, ami érzékelés 
nélkül működik a terv végrehajtása során. A megoldás, hogy bármelyik festékesdobozt 
nyitjuk ki, a festéket mind az asztalra, mind a székre alkalmazzuk. Így kényszerítjük 
(coercing) őket, hogy azonos színűek legyenek (még akkor is, ha az ágens nem tudja, 
hogy ez milyen szín). A kényszerítés akkor helyénvaló, ha az előzetes információk 
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gyűjtése drága vagy lehetetlen. Például az orvosok gyakran egy széles spektrumú anti- 
biotikumot használnak ahelyett, hogy egy feltételes tervet készítenének, ami egy vér- 
vizsgálatot hajt végre, megvárja az eredményeket, és utána egy specifikus antibiotiku- 
mot alkalmaz. Ezt az indokolja, hogy a vérteszt rendszerint nagy költséggel és késede- 
lemmel jár. 

A feltételes tervkészítő ágens jobb tervet készíthet: először megvizsgálja az asztal 
és a szék színét, majd ha ezek már eleve azonosak, a terv kész. Ha nem, megnézi a fes- 
tékesdobozok címkéit, ha ezek közt talál olyan színűt, mint amilyen a színe bármelyik 
bútordarabnak. akkor ezt a festéket alkalmazza a másikon. Egyébként befesti mindkét 
darabot bármelyik színnel. 

Az újratervező ágens a feltételes tervkészítővel azonos tervet készíthet vagy első- 
re egy jóval kevesebb ágat tartalmazót, majd amennyiben szükséges, a végrehajtási 
időben tölti fel a többit. A cselekvésleírások nem megfelelőségét szintén kezelni tudja. 
Például tegyük fel, hogy a Fest(tárgy, szín) cselekvésnek a Szín(tárgy, szín) determi- 
tisztikus hatást tulajdonítjuk. Egy feltételes tervkészítő feltételezi, hogy a következ- 
mény teljesül, ha a cselekvést végrehajtottuk, de az újratervező ágens ellenőrizheti a 
hatást és ha az nem igaz (talán mivel az ágens figyelmetlen volt és kihagyott egy 
részt), újra tervezhet és újra festhet egy részt. Ehhez a példához az 520-521. oldalon 
visszatérünk. 

A folytonos tervkészítő ágens a nem várt események kezelésén túl újra is tervezhet, 
ha mondjuk a , legyen ebéd az asztalon" új célt illesztjük be, azaz a festési tervet el kell 
halasztani. 

A valódi világban az ágensek a különböző megközelítések kombinációit használják. 
Az autógyártók pótkereket és tartalék légzsákokat árulnak, amelyek fizikai megtestesí- 
tői a feltételes tervágaknak, melyeket a defektek vagy az ütközések kezelésére készí- 
tettek. Másrészről a legtöbb autóvezető soha nem veszi figyelembe ezeket a lehető- 
ségeket, így a defektekre vagy az ütközésekre mint újratervező ágensek reagálnak. 
Általánosságban az ágensek csak azokra az eshetőségekre készítenek feltételes tervet, 
amelyeknek fontos hatásai vannak, és nem elhanyagolható eséllyel okoznak hibát. Így 
egy autóvezetőnek, aki a Szaharán keresztül kíván utazni, igencsak figyelembe kell 
vennie a lerobbanás lehetőségét, míg egy áruházba vezető út jóval kevesebb megelő- 
ző tervezést igényel. 

Az ebben a fejezetben bemutatott ágensek a nemdeterminisztikusság kezelésére 
készültek, de nem alkalmasak arra, hogy mérlegeljenek a sikeresség valószínűsége és a 
terv elkészítésének költsége tekintetében. A 16. fejezet további eszközöket biztosít az 
ilyen problémák kezelésére. 
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Feltételes tervkészítés a bizonytalanság kezelésének egy mó 
előre meghatározott pontjain ellenőrzi, hogy valójában mi is történik a környezetben. 
A feltételes tervkészítés bemutatása a tejjesen megfigyelhető környezetek esetén a leg- 
egyszerűbb, így ezzel az esettel kezdünk. A részlegesen megfigyelhető eset jóval nehe- 
zebb, de egyben jóval érdekesebb is. 
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Feltételes tervkészítés teljesen megfigyelhető 
környezetekben 


A teljes megfigyelhetőség jelentése, hogy az ágens mindig ismeri az aktuális állapotot. 
Nemdeterminisztikus környezet esetén azonban, az ágens nem képes megjósolni a 
cselekvéseinek kimenetelét. A feltételes tervkészítő ágens a nemdeterminisztikusságot 
úgy kezeli, hogy a tervekbe feltételes lépéseket épít be (tervkészítési időben), amelyek 
ellenőrzik a környezet állapotát (futási időben), hogy a továbbiakról dönthessen. A kér- 
dés tehát, hogyan készíthetők el az ilyen feltételes tervek. 

Példaként a porszívóvilág (vacuum word) problémakört használjuk, amelynek álla- 
potterét a determinisztikus esetre a 103. oldalon fektettük le. Emlékezzünk vissza, 
hogy a Balra, a Jobbra és a Szív a rendelkezésre álló cselekvések. Szükségünk lesz 
néhány propozícióra, hogy definiáljuk az állapotokat: legyen az OrtBal (OrtJobb) igaz, 
ha az ágens a bal (jobb) állapotban van, és legyen a TisztaBal (TisztaJobb) igaz, ha a 
bal (jobb) állapot tiszta.5 Az első feladatunk a STRIPS nyelv kiterjesztése, hogy megen- 
gedje a nemdeterminisztikusságot. Ennek érdekében megengedjük a cselekvésekben a 
diszjunktív következményeket (disjunctive effects), ami azt jelenti, hogy egy cselek- 
vést bármikor végrehajtva annak kettő vagy több különböző kimenetele is lehet. Tegyük 
fel például, hogy a Balra lépés néha sikertelen. Ekkor a 


Cselekvés(Balra, ELŐFELTÉTEL:OrtJobb, KÖVETKEZMÉNY:OttBal A -OtrtJobb) 
normál cselekvésleírást módosítanunk kell, hogy diszjunktív következményt is tartalmazzon: 
Cselekvés(Balra, ELŐFELTÉTEL:OttJobb, KÖVETKEZMÉNY: OttBal V OrtJobb)  (12.1 


Szintén hasznosnak találjuk a feltételes következményeket (conditional effects), ami- 
kor is egy cselekmény következménye függ attól az állapottól, amelyben végrehajtjuk. 
A feltételes következmények a cselekvés KÖVETKEZMÉNY részében jelennek meg a , when 
Afeltétel2: ckövetkezmény5" szintaxissal. Például a Szív cselekvés modellezésére a 


Cselekvés(Szív, ELŐFELTÉTEL:, KÖVETKEZMÉNY :(when OttBal: TisztaBal) 
A (when OttJobb: TisztaJobb))] 


kifejezést írnánk fel. A feltételes következmények nem vezetik be a nemdeterminisz- 
tikusságot, de segítséget nyújtanak annak modellezésében. Tegyük fe! például, hogy 
egy körmönfont porszívónk van, ami néha, ha mozog, piszkot szór a célnégyzetre, de 
csak akkor, ha az tiszta. Ez a 


Cselekvés( Balra, ELŐFELTÉTEL:OrtJobb, KÖVETKEZMÉNY: OrtBal 
V (OrtBal A (when TisztaBal: -TisztaBal)) 


leírással modellezhető, ami mind diszjunktív, mind pedig feltételes.é Hogy feltételes ter- 
veket készíthessünk, feltételes lépésekre (conditional steps) van szükségünk. Ezeket az 
,Á4f cteszt2 then terv A else terv B" szintaxis használatával írjuk le, ahol a cteszt2 egy 


5 Nyilvánvalóan az OrtJobb akkor és csak akkor igaz, ha a -OrrBal igaz, és fordítva. A két állítás használa- 
tának oka főként az olvashatóság javítása. 

6 A when TisztaBal: -TisztaBal feltételes következmény egy kicsit furcsának tűnhet. Emlékezzünk vissza azon- 
ban, hogy itt a TiszraBal a cselekvés előtti, míg a -fiszraBal a cselekvés végrehajtása utáni helyzetre vonatkozik. 
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kétértékű függvénye az állapotváltozóknak. Az , if OnBal A TisztaBal then Jobbra else 
Szív" például a porszívóvilág egy feltételes lépése lehet. Egy ilyen lépés végrehajtása a ké- 
zenfekvő módon történik. A feltételes lépések egymásba ágyazásaival a tervek fák lesznek. 

A feltételes tervektől elvárjuk, hogy működjenek, függetlenül attól, hogy valójában 
a cselekvés mely kimenetele következik be. Ezzel a problémával egy másik köntösbe 
bújtatva már találkoztunk korábban. A kétszemélyes játékokban (lásd 6. fejezet) olyan 
lépéseket szeretnénk, amelyek az ellenfél lépéseitől függetlenül győzelemhez vezetnek. 
A nemdeterminisztikus tervkészítési problémákat ezért gyakran természet elleni játé- 
koknak (games against nature) nevezik. 

Vegyük a porszívóvilág egy speciális példáját. A kiinduló állapotban a robot a tiszta vi- 
lág jobb oldali négyzetén van. Mivel a környezet teljesen megfigyelhető, az ágens ismeri 
a teljes OrrJobb A TisztaBal N TisztaJobb állapot! . A célállapotban a robot a tiszta 
világ bal oldali négyzetén van. Ez a feladat elég triviális lenne, ha nem a . dupla-Murphy" 
porszívóval lenne dolgunk, amely néha piszkot hagy maga után, amikor egy tiszta célnégy- 
zetre lép, és néha bepiszkolja a tiszta négyzetet, ha a Szívás cselekvés végrehajtódik, 

Ennek a környezetnek a , játékfáját" a 12.9. ábrán mutatjuk be. A cselekvéseket a ro- 
bot a fa , állapot" csomópontjaiban hajtja végre, majd a körrel jelölt , valószínűségi" 
csomópontokban a természet dönt a cselekvés kimeneteléről. A megoldás egy részfa, 
mely (1) minden levelében egy cél csomópontot tartalmaz, (2) minden , állapot" csomó- 
ponthoz egy cselekvést specifikál, és (3) minden ,, valószínűségi" csomópontban tar- 
talmazza az összes kimenetelhez tartozó ágat. Az ábrán a megoldást vastag vonallal 
jelöltük, ami a [Balra, if OrtBal A TisztaBal A TisztaJobb then [] else Szív] tervnek fe- 
lel meg. (Mivel állapottér-tervkészítőt használunk, a feltételes lépésekben használt tesz- 
tek egyelőre teljes állapot leírások.) 

A játékok pontos megoldásához a minimax algoritmust használjuk (lásd 6.3. ábra). 
Ehhez a feltételes tervkészítésben tipikusan két módosítás tartozik. Először is, a MAX és 











CIKLUS 





12.9. ábra. A , dupla-Murphy" porszívóvilág keresési fájának első két szintje. Az állapotcsomópontok- 
ban és a VAGY csomópontokban cselekvéseket kell választani. A valószínűségi csomópontok, amelyeket 
körökkel jelöltünk És csomópontok, ahol, ahogy azt a kimenő ágakon szereplő ív is jelöli, minden kime- 
netelt kezelni kell. A megoldást vastag vonallal jelöltük. 
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A MIN csomópontok VAGY és És csomópontokká válhatnak. Nyilvánvalóan a tervnek min- 
den elért állapotban választania kell valamilyen cselekvést, de kezelnie kell ezen cselekvés 
minden kimenetelét. Másodszor, az algoritmusnak nemcsak egy lépést kell megadnia, 
hanem egy feltételes tervet kell készítenie. Egy VAGY csomópontban a terv egyszerűen a 
választott cselekvés, amelyet bármi követhet. Egy És csomópontban a terv if-then-else lé- 
pések egymásba ágyazott sorozata, melyek minden lehetséges kimenetelhez egy résztervet 
adnak meg. Ezen lépésekben a feltétel vizsgálatokban teljes állapotleírások szerepelnek.7 





function És-VAGY-GRÁF-KERESÉS( feladat) returns egy feltételes terv vagy kudarc 
VAGY-KERESÉS(KINDULÓ-ÁLLAPOT[ feladat), feladat, ÚJ) 





function VAGY-KEREsÉS(állapot, [/eladarl, feladat, [J) returns egy feltételes terv vagy kudarc 
íf CéL-TEszr[feladar (állapot) then return üres terv 
Át állapot az útvonai-on then return kudarc 
for each cselekvés, állapot halmaz ín KÖVETŐÁLLAPOTOK[feladatkállapor) do 
terv — És-KEREsés(állapot. halmaz, feladat, lállapotlátvonai)) 
ít terv z kudarc then return fcselekvéslterv) 
return kudarc 





function És-KEREsÉS(állapot. halmaz, feladat, terv) returns egy feltételes terv vagy kudarc 
for each s; in állapot. halmaz do 
terv; 5 VAGY-KERESÉS(S,, feladat, terv) 
áf terv — kudarc then return kudarc 
return [if s, then rervy else if 52 then terv else ... if s, , then terv,, , else rerv,] 








12.10. ábra. Egy algoritmus a nemdeterminisztikus környezetek által generált És-VAGY gráfok keresésére 
Feltételezzük, hogy az ÁLLAPOTÁTMENET függvény a cselekvések egy listáját adja vissza, melyek mind- 
egyike egy lehetséges kimenetel halmazhoz tartozik. A cél egy feltételes terv megtalálása, ami bármilyen 
körülmények között elér egy célállapotot. 


Formálisan az eddig definiált keresési tér egy ÉS-VAGY gráf. Az ÉS-vAGY gráfok ko- 
rábban a 7. fejezetben az ítéletlogikai Horn-klóz következtetésben jelentek meg. Itt az 
ágak logikai következtető lépések helyett cselekvések, de az algoritmus azonos, A 12.10. 
ábra az ÉS-VAGY gráfok keresésére egy rekurzív, mélységi kereső algoritmust ad meg. 

A bemutatott algoritmusban kulcsfontosságú a nemdeterminisztikus tervkészítési 
problémákban gyakran felmerülő ciklusok kezelésének módja (például ha egy cselek- 
vésnek néha nincs következménye vagy egy helytelen következmény kijavítható). Ha 
az aktuális állapot azonos a gyökértől idáig vezető útvonal egy állapotával, akkor hibá- 
val tér vissza. Ez nem jelenti, hogy nincs megoldás az aktuális állapotból, egyszerűen 
annyit jelent, hogy van egy nemciklikus megoldás, ami elérhető az aktuális állapot 
korábbi előfordulásából, így az állapot újabb bekövetkezése kihagyható. Ezzel az ellen- 
őrzéssel biztosítjuk, hogy az algoritmus minden véges állapottér esetén leálljon, mivel 
minden útvonal célt ér, zsákutcába jut, vagy egy állapot ismétlése. Vegyük észre, hogy 
az algoritmus nem ellenőrzi, hogy az aktuális állapot egy másik útvonalon szereplő 
állapot ismétlése-e. A 12.15. feladat ezt a kérdést járja körül. 


7 Az ilyen terveket case szerkezettel is leírhatnánk. 
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12.II. ábra. A ,4ripla-Murphy" porszívóvilág keresési gráfjának első szintje, ahol a ciklusokat explicit 
megjelöltük. A problérna összes megoldása ciklikus terv. 


Az És-VAGY-GRÁF-KERESÉS által visszaadott tervek feltételes lépéseket tartalmaz- 
nak, melyek a teljes állapotleírást megvizsgálják, hogy egy ágról döntsenek. A legtöbb 
esetben ennél jóval kevésbé kimerítő ellenőrzésekkel is megúszhatjuk. Például a 12.9. 
ábrán látható megoldás a [Balra, if TisztaBa! then (]) else Szív] megadással egyszerűen 
leírható. Ennek oka, hogy a TisztaBal teszt elegendő, hogy az És csomópont állapotait 
két egyelemű halmazba sorolja úgy, hogy a tesztek után az ágens pontosan ismerje az 
állapotát. Valójában az egyváltozós if-then-else tesztek sorozata mindig elegendő, hogy 
állapotok egy halmazát egyelemű halmazokra ossza, feltéve, hogy az állapot teljesen 
megfigyelhető. Ezért az általánosság teljes megőrzése mellett a teszteket egyváltozós 
tesztekre szűkíthetjük. 

Az utolsó nehézség, ami gyakran felmerül a nemdeterminisztikus feladatkörökben, 
a következő: a dolgok nem mindig működnek elsőre, így újra kell próbálkozni. Vegyük 
például a , tripla-Murphy" porszívó példáját, mely (a korábban bemutatott szokások 
mellett) néha nem mozdul az utasítás ellenére. Például csakúgy, mint a (12.1) egyenlet- 
ben, a Balra cselekvés tartalmazhatja a OrtBal V OrtJobb diszjunktív hatást. Ekkor a 
[Balra, if TisztaBal then (] else Szív] terv már nem garantált, hogy működik. A 12.11. 
ábra a keresési gráf egy részletét mutatja. Tisztán látható, hogy a továbbiakban nincse- 
nek ciklusmentes megoldások, és az És-VAGY-GRÁF-KERESÉS hibával térne vissza. 
Létezik azonban egy ciklikus megoldás (cyclic solution), ami addig próbálgatja a Bal- 
ra lépést, mígnem egyszer működik. Ez a megoldás könnyebben kifejezhető, ha a terv 
egy részét egy címkével (label) jelöljük meg, és a terv ismételgetése helyett erre a cím- 
kére hivatkozunk. Így a ciklikus megoldásunk 


IL, : Balra, if OrtJobb then L, else if TisztaBal then [] else Szív] 


alakú. (A , while OrrJobb do Balra" kifejezés egy jobb szintaxis a terv ciklikus részére.) 
Az És-VAGY-GRÁF-KERESÉS-ben szükséges módosításokat a 12.16. feladat dolgozza 
fel. A megvalósítás kulcsa, hogy az állapottérben egy L állapotba visszalépő hurok 
a tervben egy arra a pontra visszamutató hurkot jelent, ahol az L állapotba vezető rész- 
tervet végrehajtjuk. 

Így már képesek vagyunk feltételeket és ciklusokat tartalmazó programokhoz hason- 
latos összetett tervek létrehozására. Sajnos ezek a ciklusok végteten ciklusok lehetnek. 
Például a tripla-Murphy világ cselekvés reprezentációjában a semmi jelentése, hogy 
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a Balra szükségszerűen sikeres. A ciklikus tervek ezért kevésbé előnyösek, mint a cik- 
lus nélküliek, de megoldásnak tekinthetők, amennyiben minden levél egy célállapot, és 
a terv minden pontjából elérhető egy levél. 


Feltételes tervkészítés részlegesen megfigyelhető 
környezetekben 


Az előző alfejezet teljesen megfigyelhető környezetekkel foglalkozott, amelyek elő- 
nye, hogy a feltételes ellenőrzések bármit kérdezhetnek, és biztosak lehetnek a választ 
kapnak. A valódi világban a részleges megfigyelhetőség jóval gyakoribb. Egy részle- 
gesen megfigyelhető tervkészítési feladat kiinduló állapotában az ágens csak bizonyos 
dolgokat tud az aktuális állapotról. Ennek a helyzetnek a legegyszerűbb modellezése, 
ha a kiinduló állapotról annyit mondunk, hogy egy állapothalmazba tartozik. Az ál- 
lapothalmaz az ágens kiinduló hiedelmi állapotát (belief state) írja le.8 

Tegyük fel, hogy a porszívóvilág ágens tudja, hogy a jobb oldali négyzeten van, és az 
tiszta, de nem tudja érzékelni a piszok jelenlétét vagy hiányát a többi négyzeten. Ekkor, 
legjobb ismeretei szerint két állapotban lehet: a bal oldali négyzet vagy piszkos, vagy tisz- 
ta. Ezt a hiedelmi állapotot a 12.12. ábrán A-val jelöltük. Az ábra a , váltakozó dupla- 
Murphy" porszívóvilág És-vaGY gráfjának egy részét mutatja be, melyben a tiszta négy- 
zetet elhagyó ágens piszkot hagyhat maga után.? Ha a világ teljesen megfigyelhető volna, 
az ágens egy , Mozogj balra és jobbra, és szívd fel a piszkot, amennyiben találsz, amíg 
mindkét kocka tiszta nem lesz, és a bal oldali kockán vagyok" formájú ciklikus megoldást 
készíthetne (lásd 12.16. feladat). Sajnos csak lokális szemétérzékeléssel ez a terv végre- 
hajthatatlan, hiszen a , mindkét kocka tiszta" teszt igazságértéke nem határozható meg. 

Figyeljük meg az ÉS-vAGY gráf felépítését. Az A hiedelmi állapotból a Balra mozgás 
kimenetelét mutatjuk. (A többi cselekvésnek nincs értelme.) Mivel az ágens piszkot 
hagyhat maga után, a két kiinduló világból négy lehetséges világ adódhat, ahogy az a 
B és C állapotokban látható. A rendelkezésre álló érzékelő információk alapján a világ 
két különálló hiedelmi állapotra osztható.!10 A B-ben, az ágens tudása a TisztaBal, míg 
€-ben a -TisztaBal. A piszok feltakarítása C-ben az ágenst a B-be mozgatja. A B-ből 
a jobbra mozgás vagy hagy piszkot maga után, vagy nem, így az ágensnek azon tudása 
alapján, hogy TisztaJobb igaz (vissza az A-ra) vagy hamis (D hiedelmi állapot), ismét 
négy lehetséges világ adódik. 

Összegezve a nemdeterminisztikus, részben megfigyelhető környezetek a hiedelmi 
állapotok egy ÉS-vAGY gráfját eredményezik. Ebből adódóan feltételes tervek találhatók 
pontosan ugyanazon algoritmusokkal, mint a teljesen megfigyelhető esetben, nevezetesen 
az És-VAGY-GRÁF-KERESÉS-sel. Ez abból is könnyen megérhető, ha belátjuk, hogy az 
ágens hiedelmi állapota mindig teljesen megfigyelhető, azaz mindig tudja, hogy mit tud. 
A , hagyományos" teljesen megfigyelhető problémamegoldás csak egy speciális eset, 


8 Ezeket a fogalmakat a 3.6. alfejezetben vezettük be, így az olvasó ezt átismételheti a továbblépés előtt. 
9 A kisgyermekes szülők jól ismerhetik ezt a jelenséget. Tisztelet a kivételnek. 
10 Vegyük észre, hogy ezek nem aszerint kerülnek osztályzásra. hogy az ágens piszkot hagy-e maga után. 
amikor mozdul. A hiedelmi állapottérbeti elágazásokat a különböző tudáslehetőségek, és nem a különböző fizi- 
kai kimenetelek okozzák. 
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12.12. ábra. A , váltakozó dupla-Murphy" porszívóvilág És-vAGY gráfjának egy részét mutatja be, mely- 
ben a tiszta négyzetet elhagyó ágens piszkot hagyhat maga után. Az ágens nem tudja érzékelni a más 
négyzetben levő piszkot. 


melyben minden hiedelmi állapot egy egyelemű halmaz, pontosan egy fizikai állapottal. 
Ezzel készen vagyunk? Nem egészen! Még meg kel! határoznunk, hogy hogyan rep- 
rezentáljuk a hiedelmi állapotokat, hogyan működik az érzékelés, és hogy ebben az új 
helyzetben hogyan írjuk le a cselekvéseket. 
A hiedelmi állapotok esetén alapvetően három választásunk van: 


1. Teljes állapotleírások halmazai. Például a 12.12. ábra kiinduló hiedelmi állapota az 
((OrtJobb A TisztaJobb N TisztaBal), (OnuJobb A TisztaJobb A —TisztaBal)) 


Ezzel a leírással könnyű dolgozni, de nagyon költséges: ha n kétértékű ítéletállítás 
definiál egy állapotot, akkor a hiedelmi állapot 0(2") fizikai állapotleírást tartalmaz- 
hat, melyek mindegyike 0(n) méretű. Ha az ágens az ítéletállításoknak csak egy 
töredékét ismeri, exponenciálisan nagy hiedelmi állapotok adódnak — minél keve- 
sebbet tud, annál több lehetséges állapotban lehet. 

2. Logikai mondatok, melyek pontosan leírják a hiedelmi állapotban lehetséges világok 
halmazát. Például a kiinduló állapot az 


OnJobb A TisztaJobb 


formában adható meg. Nyilvánvaló, hogy bármely hiedelmi állapot pontosan be- 
foglalható egyetlen logikai mondatba. Ha akarjuk, az összes konjuktív állapotleírás 
diszjunkcióját vehetjük, de a példánk mutatja, hogy ennél tömörebb mondatok 
létezhetnek. 
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Az általános logikai mondatok egyik hátulütője, hogy mivel sok ekvivalens, de 
különböző logikai mondat írhatja le ugyanazt a hiedelmi állapotot, az ismétlődő álla- 
potok ellenőrzése általános tételbizonyító képességeket vár el a gráfkereső algorit- 
mustól. Ezért a mondatok egy kanonikus reprezentációját szeretnénk, amelyben 
minden hiedelmi állapot pontosan ugyanannak a mondatnak felel meg.!! Egy ilyen 
reprezentáció, azaz ítéletállítások nevei alapján rendezett literálok konjukcióját 
használja, melynek egy példája a —OrtJobb A TisztaJobb. Ez a It. fejezet nyílt világ 
feltételezésében (open-world assumption) egy egyszerű állapotleírás. Nem minden 
logikai mondat írható fe) ilyen alakban (például nincs mód az OrtBal V TisztaJobb 
felírására), de számos probléma kezelhető. 

3. Tudás ítéletállítások (knowledge propositions), amelyek az ágens ismereteit írják le. 
(Ugyanezt lásd a 7.7. alfejezetben.) A kiinduló állapotunk: 


K(OnJobb) A KíTisztaJobb) 


ahol K jelentése , tudja" és K(P) jelentése, hogy az ágens tudja, hogy P igaz.12 A tu- 
dás ítéletállításokkal zárt világ feltételezést használunk, azaz ha egy állítás nem je- 
lenik meg a listában, akkor hamisnak feltételezzük. Például a -aK(TisztaBal) és a 
-K(-TisztaBal) implicit szerepelnek a fenti mondatban, így az rögzíti a tényt, hogy 
az ágens érzéketlen a TisztaBal igazságértékére. 


Kimutatható, hogy a második és harmadik lehetőségek durván azonosak, de mi a 
harmadik tudás, az ítéletállítás lehetőséget használjuk, mert ez az érzékelés egy erősebb 
leírását adja, és mert már tudjuk, hogy hogyan írhatunk a zárt világ feltételezés (ciosed- 
world assumption) mellett STRIPS kifejezéseket. 

Mindkét esetben, minden ítéletszíimbólum háromféleképpen jelenhet meg: lehet 
pozitív, negált vagy ismeretlen. Ezért így pontosan 3" lehetséges hiedelmi állapot 
adható meg. A hiedelmi állapotok halmaza így a hatványhalmaza (az összes rész- 
halmaz halmaza) a fizikai állapotoknak. Összesen 2" fizikai állapot van, ezért 27 
hiedelmi állapot, ami sokkal több, mint 3", így a 2. és 3. választás eléggé korlátozot- 
tan alkalmas a hiedelmi állapotok leírására. Ez jelenleg használhatatlannak tűnik, 
hiszen bármely séma, ami képes minden lehetséges hiedelmi állapot reprezentálásá- 
ra, 0(1og(22)) — 0(2") bitet igényel, hogy legrosszabb esetben mindegyiket leírhas- 
sa. A mi egyszerű sémánk csak O(i) bitet igényel a hiedelmi állapotok leírásához, mert 
a kifejezőképességet a tömörségre cseréltük. Nevezetesen. ha egy cselekvés megje- 
lenik, amelynek az előfeltételei ismeretlenek, akkor az eredményként kapott hiedel- 
mi állapot nem lesz pontosan reprezentálhazó, és a cselekvés kimenetele ismeretlen 
lesz. 

Most arról kell döntenünk, hogy az érzékelés hogyan működik. Itt két választásunk 
van. Használhatunk automatikus érzékelést (automatic sensing), ami annyit tesz, 
hogy az ágens minden időlépésben az összes elérhető érzetet megkapja. A 12.12. ábrán 
látható példa a helyzet és a helyi tisztaság meghatározására automatikus érzékelést fel- 








11 Az általános ítéletlogikai mondatok legjobb kanonikus reprezentációja a bináris döntési diagram tbinary 
decision diagram) vagy BDD (Bryant, 19921. 

12 Ez a jelölés ugyanaz, mint amit a 7. fejezetben az áramköralapú ágenseknél használtunk. Néhány szerző 
ezt a tudja, hogy P igaz-e" értelemben használja. A két értelmezés közötti fordítás kézenfekvő. 
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tételez. Használhatunk ellenben aktív érzékelést (active sensing), ami annyit jelent, 
hogy az érzékelt információk csak megadott érzékelési cselekvések (sensory actions), 
(mint TisztaságEllenőrzés és PozícióEllenőrzés) végrehajtásával nyerhetők, Az érzéke- 
lési típusokat sorban tárgyalni fogjuk. 

Most használjunk tudás állításokat a cselekvések leírásához. Tegyük fel, hogy az 
automatikus helyi tisztaságérzékeléssel felruházott váltakozó-dupla-Murphy világ 
problémában az ágens Balra lép. Az erre a világra vonatkozó szabályoknak megfele- 
lően az ágens hagy, vagy talán nem hagy piszkot maga után, ha a négyzet tiszta volt. 
Mint fizikai következmény, ez diszjunktív lenne, de mint rudás következmény ez egy- 
szerűen törli az ágens TisztaJobb tudását. Emellett az ágens a helyi piszokérzékelés 
miatt így vagy úgy tudni fogja, hogy vajon a TisztaBal igaz-e, és tudni fogja, hogy a 
pozíciója OrrBal: 


Cselekvés(Balra, ELŐFELTÉTEL:OttJobb, 
KÖVETKEZMÉNY:K(OrtBal) A AK(OttJobb) NA 
when TisztaJobb: -K(TisztaJobb) N 
when TisztaBal: K(TisztaBal) A 
when -TisztaBal: K(-TisztaBah) (122) 


Vegyük észre, hogy az előfeltételek és a when feltételek egyszerű állítások és nem tu- 
dás állítások. Ez úgy van, ahogy lennie kell, hiszen a cselekvések kimenetele függ az 
aktuális világtól, de hogyan ellenőrizhetnénk ezen feltételek igazságértékét csupán a 
hiedelmi állapot alapján? Ha az ágens az aktuális hiedelmi állapotban tudju mondjuk 
a K(OttJobb) állítást, akkor az állításnak igaznak kell lennie az aktuális fizikai állapot- 
ban, így egyben a cselekvés is alkalmazható. Ha az ágens nem ismeri az állítást (pél- 
dául TisztaBal az if feltételt), akkor a hiedelmi állapotnak tartalmaznia kell olyan vilá- 
gokat, melyekben a TiszraBal igaz, és olyan világokat, amelyekben a TisztaBal hamis. 
Pontosan ez az, ami miatt egy cselekvés többszörös hiedelmi állapotokat eredményez. 
Így, ha a kiinduló állapot a (X(OrrJobb) A K(TisztaJobb)), akkor a Balra lépés után a 
(K(OrtBal) A K(TisztaBal)) és a (K(OrtBah) A K(-TisztaBal)) a két lehetséges hiedelmi 
állapot. Mindkét esetben ismert a TisztaBal értéke. így a TisztaBal teszt felhasználható 
a tervben. 

Aktív érzékelés (mint az automatikus érzékelés ellentettje) esetén, az ágens csak 
kérésre kap új megfigyeléseket. Így a Balra lépés után az ágens nem tudja, hogy a bal 
oldali négyzet piszkos-e, ezért a (12.2) cselekvésleíró egyenletben az utolsó két feltéte- 
les következmény már nem jelenik meg. Az ágens a TisztaságEltenőrzés cselekvéssel 
derítheti ki, hogy a négyzet piszkos-e: 


Cselekvés(TisztaságEllenőrzés, KÖVETKEZMÉNY: when OrtBal A TisztaBalt: K(TisztaBal) A 
when OrtBal A —TisztaBat: K(-TisztaBal) A 
when OwtBal A TisztaJobb: K(TisztaJobb) A 
when OttBal A -TisztaJobb: K(-TisztaJobb) (12.3) 


Könnyű megmutatni, hogy aktív érzékelés esetén a Balra lépéssel követett Tiszta- 
ságEllenőrzés cselekvés ugyanazt a két hiedelmi állapotot eredményezi, amit az auto- 
matikus érzékelés esetén a Balra adott. Aktív érzékelés esetén a fizikai cselekvések 
egy hiedelmi állapotot mindig egyetlen követő hiedelmi állapotra képeznek le. A több- 
szörös hiedelmi állapotok csak az érzékelő cselekvések által jöhetnek létre, melyek 
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specifikus tudást adnak. s ezért lehetővé teszik a feltételvizsgálatok használatát a ter- 
vekben. 

Az eddigiekben az állapottér ÉS-VAGY keresésén alapuló feltételes tervkészítésre mu- 
tattunk be egy általános megközelítést. Ez a megközelítés néhány tesztproblémán elég 
hatékonynak bizonyult, de más feladatokra alkalmatlan. Bizonyítható, hogy a feltételes 
tervkészítés nagyobb algoritmikus komplexitású, mint a hagyományos. Emlékezzünk 
vissza, hogy az NP osztály definíciója alapján egy megoldásról ellenőrizhető, hogy 
polinomiális idejű-e. Ez a hagyományos tervekre (legalábbis a polinomiális méretűek- 
re) igaz, így a hagyományos tervkészítés az NP osztályba tartozik. A feltételes tervké- 
szítés esetén egy jelöltre ellenőrizni kell. hogy az összes lehetséges állapotra a tervben 
létezik-e valamilyen, a célt kielégítő útvonal. Az , összes/valamilyen" összeállítás nem 
ellenőrizhető polinomiális időben, így a feltételes tervkészítés nehezebb, mint NP. Ez 
csak úgy kerülhető el, hogy a tervkészítési fázisban figyelmen kívül hagyunk néhány 
lehetséges eshetőséget, és ezeket csak akkor kezeljük, ha valójában fellépnek. A követ- 
kező alfejezetben ezt a megközelítést elemezzük. 


12.5. VÉGREHAJTÁS MONITOROZÁSA 
ÉS ÚJRATERVEZÉSE 


A végrehajtás-monitorozó (execution monitoring) ágens érzékelőivel ellenőrzi, hogy 
minden a terv szerint megy-e. Murphy törvénye alapján az egereknek, embereknek és 
a feltételes tervkészítő ágenseknek még a legjobban elkészített tervei is gyakran siker- 
telenek. A probléma a nem korlátos nemdeterminisztikusság, azaz néhány váratlan körül- 
mény mindig felmerül, melyre az ágens cselekvés leírásai helytelenek. A valós környeze- 
tekben ezért a végrehajtás-monitorozás elengedhetetlen. Kétféle végrehajtás-monitorozást 
veszünk számba: az egyszerű, de gyenge cselekvésmonitorozást (action monitoring), 
ahol az ágens a környezet vizsgálatával ellenőrzi, hogy a következő cselekvés működni 
fog, és az összetettebb, de hatékonyabb tervmonitorozást (plan monítoring), melyben 
az ágens a terv teljes hátralevő részét ellenőrzi. 

Az újratervező (replanning) ágens tudja, hogy váratlan események esetén mit kell 
tennie: újra meghívja a tervkészítőt, hogy a cél eléréséhez egy új tervet biztosítson. 
Annak elkerülésére, hogy túl sok időt töltsünk tervkészítéssel, ez rendszerint a régi 
terv javításával történik, azaz utat keresünk a fennálló nem várt állapotból vissza, a 
meglévő tervhez. 

Példaként térjünk vissza a 12.9. ábra dupla-Murphy porszívóvilágához. Ebben a vi- 
lágban egy tiszta cellára lépés néha bepiszkolja azt. De mi történik, ha az ágens ezt nem 
tudja vagy nem foglalkozik vele? Akkor egy nagyon egyszerű megoldással áll elő: 
[Balra]. Ha a terv végrehajtásánál érkezéskor nem történik piszkítás, akkor az ágens 
a cél elérését detektálja. Ellenkező esetben azonban, mivel az implicit Befejez lépés 
TisztaBal előfeltétele nem teljesül, az ágens új tervet készít: [Szív]. Ennek a tervnek a 
végrehajtása mindig sikeres. 

A végrebajtás-monitorozás és újratervezés együttesen egy általános stratégia, ami 
mind a teljesen, mind pedig a részben megfigyelhető környezetekre alkalmazható a 
tervkészítési reprezentációk széles körén, beleértve az állapottér-, a részben rendezett 
és a feltételes terveket. A 12.13. ábra az állapottér-tervkészítésre mutat be egy egy- 
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szerű megközelítést. A tervkészítő ágens egy céllal indít. és kiinduló tervet készít 
ennek eléréséhez. Ellentétben más tervkészítő ágensekkel. az újratervező ágens követi 
mind a hátralevő, még végrehajtatlan terv részletet, valamint a teljes eredeti tervet 
teljes. terv-et. Cselekvésmonitorozást (action monitoring) használ: a terv következő 
cselekvésének végrehajtása előtt az ágens megvizsgálja az érzékelőit, hogy megbizo- 
nyosodjon arról, hogy a terv előfeltételei nem váltak-e váratlanul kielégítetlenné. Ha 
igen, akkor az ágens egy cselekvéssorozat újratervezésével megpróbál a teljes terv 
egy pontjára visszajutni. 





function ÚJRATERVEZŐ-ÁGENS(érzékelés) returns egy cselekvés 
static: TB, egy tudásbázis (cselekvésleírásokat tartalmaz) 
terv. egy terv, kezdetben[) 
teljes terv, egy terv, kezdetben[] 
cél, egy cél 


ÉRTESÍT(TB, ÉRZÉKELŐ-MONDAT-Készíréstérzékelés, 1) 

aktuális — LEÍRÁS-KÉSZÍTÉS(TB, 1) 

if rerv — (] then 
teljes terv — terv — TERVKÉSZÍTŐ(akiuális, cél, TB) 

if ELŐFELTÉTELEK(ELŐSZÖR(terv)) aktuálisan nem igaz a TB-ben then 
jelöltek — RENDEZÉS(teljes terv, az aktuális-tól vett távolság szerint rendezve) 
keres állapot s a jelöltek amelyekre 

kudarc 7 javítás — TERVKÉSZÍTŐ(aktuális, s, TB) 
folytatás — a teljes. terv 5-ből induló farokrésze 
teljes. terv — terv 1— Hozzárűz (javítás, folytatás) 
return RRT(terv) 











12.13. ábra. Egy cselekvésmonitorozó és -újratervező ágens. Ez szubrutinként a TERVKÉSZÍTŐ teljes ál- 
lapottér tervkészítő algoritmust használja. Ha a következő cselekvés előfeltételei nem teljesülnek, az 
ágens a teljes. terv lehetséges p pontjain iterál olyat keresve, amelyhez a TERVKÉSZÍTŐ útvonalat tud ter- 
vezni. Ezt az útvonalat hívjuk javításnak. Ha a TERVKÉSZÍTŐ sikeres a javításban, az új terv készítéséhez 
összefűzi a javítást és a terv p utáni részét. Az ágens ezután a terv első lépését adja vissza. 





A 12.14. ábra a folyamat sematikus illusztrációja. Az újratervező észreveszi, hogy 
a terv első cselekvésének előfeltételeit az aktuális állapot nem elégíti ki. Ezután meg- 
hívja a tervkészítőt, hogy készítsen egy új javítás-nak nevezett résztervet, amely az 
aktuális állapotból a teljes terv valamely s állapotába vezet vissza. Ebben a példában 
az s történetesen egylépésnyi visszalépést jelent az aktuális hátralévő terv-ből. (Ez az 
oka, hogy a hátralévő terv helyett a teljes tervet figyeljük.) Általánosságban s-et a jelen 
állapothoz a lehető legközelebbre választjuk. Az új terv a javítás és a teljes terv s-től 
hátralevő része — amit folytatás-nak nevezünk — összefűzéséből adódik, mellyel az 
ágens készen áll a végrehajtás folytatására. 

Térjünk vissza az asztal és a szék azonos színűre festésének problémájához, ez alka- 
lommal újratervezéssel. Feltételezzük a teljesen megfigyelhető környezetet. A kiinduló 
állapotban a szék kék, az asztal zöld, valamint 1 doboz kék és 1 doboz zöld festék áll 
rendelkezésünkre. Ez a következő probléma definícióhoz vezet: 
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Vé téteyetásnszsség szet KENE e a náetesáánásétes tj né ástál ny 





12.14. ábra. A végrehajtás előtt a tervkészítő egy teljes rerv-nek nevezett tervet készít, mely §-ből G-be 
vezet. Az ágens az E-vel jelölt pontig végrehajtja a tervet. A rerv hátralevő részének végrehajtása előtt a 
szokásos módon ellenőrzi az előfeltételeket, és azt találja, hogy valójában az O állapotban van, és nem 
az E-ben. Ezután meghívja a tervkészítő algoritmust. hogy készítsen egy juvítás-t, mely egy terv az 0-ból 
az eredeti teljes terv egy P pontjához. Az új terv ezután a javítás és a folytatás (az eredeti teljes. terv ma- 
radék része) összefűzéséből adódik. 


Kiindulás(SzínetSzék, Kék) A Színe(Asztal, Zöld) 

A SzíntTartalmaz( BC, Kék) A FestékDoboz (BC) 

A SzíntTartalmaz( RC, Piros) A FestékDoboz (RC) 
Cél(Színe(Szék, x) A Színe(Asztal, x)) 
Cselekvés(Fest(tárgy, szín), 

ELŐFELTÉTEL: Van Festék(szín) 

KÖVETKEZMÉNY: Színeítárgy, szín)) 
Cselekvés(Nyit(doboz), 

ELŐFELTÉTEL:FestékDobozídoboz) N Színe(doboz, szín) 

KÖVETKEZMÉNY: Színe(szín)) 


Az ágens TERVKÉSZÍTŐ-jének a következő tervvel kellene előállnia: 
[/ndít; Nyi(BC); Fest(Asztal, Kék); Befejez] 


Az ágens most készen áll a terv végrehajtására. Tegyük fel, hogy minden jól megy, és 
az ágens kinyitja a kék festéket és az asztalra keni. Az előző alfejezet ágensei a terv 
lépésének befejezése után győzelmet kiáltanának. A végrehajtás-monitorozó ágensnek 
ellenben először ellenőriznie kell a Befejez lépés előfeltételét, ami azt mondja, hogy 
a két bútornak azonos színűnek kell lennie. Tegyük fel, hogy az ágens azt érzékeli, 
hogy a bútorok nem azonos színűek. mivel a festés hiányossága miatt az asztalon egy 
zöld folt maradt. Az ágensnek ezután keresnie kell egy célpontot a teljes terv-ben, 
amelyet megcélozhat, és egy javító cselekvéssorozatot kell kidolgoznia, hogy ide jus- 
son. Az ágens észreveszi, hogy az aktuális állapot azonos a Fest cselekvés előfeltéte- 
leivel, így a javító egy üres sorozat, és a terv azonos az épp végrehajtott [Fest, Befe- 
Jjezl sorozattal. Ezzel az új tervvel a monitorozás végrehajtása folytatódik, és a Fest 
cselekvés újra végrehajtásra kerül. Ez a viselkedés addig ismétlődik, amíg az asztalt 
teljesen lefestettnek nem érzékeljük. Vegyük észre, hogy a ciklus a terv—végrehaj- 
tás-újratervezés folyamat során alakult ki, nem pedig egy explicit ciklus az eredeti 
tervben. 
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A cselekvésmonitorozás a végrehajtás-monitorozás nagyon egyszerű módszere, de 
néha kevésbé intelligens viselkedéshez vezethet. Például tegyük fel, hogy az ágens 
olyan tervet készít, amelyben az asztalt és a széket is pirosra festi. Ekkor kinyitja a piros 
festéket, és azt találja, hogy nincs elegendő festék a székhez. A cselekvésmonitorozás 
nem érzékelné ezt a sikertelenséget, csak miután a széket befestettük, amikor is a 
VanFesték(Piros) hamissá válik. Amire valójában szükségünk van, az az, hogy akkor 
érzékeljük a hibát, amikor olyan állapotba jutunk, ahonnan a terv hátralevő része már 
nem működik. A tervmonitorozás (plan monitoring) ezt úgy éri el, hogy a teljes bát- 
ralevő tervben szereplő előfeltételek sikerességét ellenőrzi, azaz a terv minden lépésé- 
nek előfeltételeit, kivéve azokat, amelyeket a hátralévő terv egy másik lépésével ér el. 
A tervmonitorozás a hibás terv végrehajtását a lehető leghamarabb megszakítja, azaz 
nem várja meg, míg a hiba valójában fellép.!3 Néhány esetben ez az ágenst a teljes bu- 
kástól mentheti meg, amikor a hibás terv egy olyan zsákutcába vezetne, melyből a cél 
már elérhetetlen. 

Elég kézenfekvő a tervkészítő algoritmus módosítása, hogy az a terv minden pontján 
tartalmazza a hátralevő terv sikeréhez szükséges előfeltételeket. Ha a tervmonitorozást 
kiterjesztjük, hogy az aktuális pont helyett az összes jövőbeni pontra ellenőrizze, hogy 
az aktuális állapot kielégíti-e a terv előfeltételeit, akkor a tervmonitorozás kihasználhat- 
ja a szerencsés rábukkanást (serendipity), azaz a véletlenszerű sikert. Ha valaki arra 
jártában pirosra festi az asztalt ugyanabban az időben, amikor az ágens a széket festi 
pirosra, akkor a végső terv előfeltételei teljesülnek (a cél teljesül), és az ágens korábban 
megpihenhet. 

Eddig a monitorozást és újratervezést a teljesen megfigyelhető környezetek esetére 
mutattuk be. A részlegesen megfigyelhető környezetek esetén jóval komplikáltabb 
problémák léphetnek fel. Először ís olyan hibák léphetnek fel, amelyet az ágens nem 
tud érzékelni. Másodszor , az előfeltételek ellenőrzése" érzékelő cselekvések végre- 
hajtását teheti szükségessé, amelyet tervezni kell vagy a tervkészítési időben, ami a 
feltételes tervkészítéshez vezet vissza, vagy a végrehajtási időben. A legrosszabb eset- 
ben az érzékelési cselekvések végrehajtása összetett tervet igényel, melyhez monitoro- 
zás, így további érzékelési cselekvések szükségesek. És ez így megy tovább. Ha az 
ágens ragaszkodik minden előfeltétel ellenőrzéséhez, akkor elképzelhető, hogy soha- 
sem jut hozzá, hogy valójában tegyen is valamit. Az ágensnek csak a fontos változók 
ellenőrzését kellene szem előtt tartani, melyek jó eséllyel okoznak hibát, és nem túl 
drága a megfigyelésük. Ez lehetőséget ad az ágensnek, hogy megfelelőképpen reagál- 
jon a fontos fenyegetésekre, de ne vesztegessen időt annak ellenőrizgetésére, hogy 
összeomlik-e az ég. 

Miután bemutattuk a monitorozás és újratervezés módszerét, meg kell kérdeznünk: 
sMűködik?" Ez meglepően becsapós kérdés. Ha a kérdést úgy értelmezzük, hogy 
,Garantálni tudjuk-e, hogy az ágens mindig, még nem korlátos nemdeterminisz- 
tikusság esetén is célt ér?", akkor a válasz nem, hiszen az ágens figyelmetlenségből 
zsákutcába juthat, csakúgy. mint a 4.5. alfejezetben bemutatott online keresés. Például 
lehet, hogy a porszívóágens nem tudja, hogy az elemei kifogyhatnak. Zárjuk ki a 


13 A tervmonítorozás okosabbá teszi az ágensünket egy ganajtúró bogárnál (lásd 71. oldal). Az ágensünk 
észrevenné, hogy a ganaj már nincs a lábainál, újratervezne, hogy szerezzen egy másikat, és azzal zárná le 
a lyukat, 
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Zsákutcákat, azaz tételezzük fel, hogy az ágens olyan tervet tud létrehozni, amelyben 
a célt a környezet bármely állapotából eléri. Ha feltételezzük. hogy a környezet való- 
ban nemdeterminisztikus, abban az értelemben, hogy egy ilyen tervnek egy adott vég- 
rehajtása esetén mindig van valamekkora esélye a sikerre, akkor az ágens szükségsze- 
rűen célt ér. Az újratervező ágens képességei ezért megfelelnek a feltételes tervkészítő 
ágens képességeinek. Valójában módosíthatjuk a feltételes tervkészítőt, hogy csak rész- 
leges megoldást készítsen, amely ,if cteszr- then terv A else újratervez" formájú 
lépéseket tartalmaz. Az említett korlátozásokkal egy ilyen terv megfelelő megoldása 
lehet az eredeti problémának, és elkészítése szintén sokkal olcsóbb lehet, mint a teljes 
feltételes tervnek. 

Hiba akkor lép fel, ha az ágens ismételt kísérletei is sikertelenek a cél elérésében, az- 
az valamilyen, számára ismeretlen előfeltétel vagy következmény blokkolja. Például ha 
az ágens rossz kulcskártyát kap a hotelszobájához, akkor nincs az a beillesztési és eltá- 
volítási próbálkozás. ami kinyitná az ajtót.14 Egy megoldás, hogy ugyanazon terv ismé- 
telgetése helyett véletlenszerűen választunk egy lehetséges javítóterv halmazból. Ebben 
az esetben egy új kulcskártya kérése a recepcióról hasznos alternatív javító terv. Mivel 
nem biztos, hogy az ágens képes a valóban nemdeterminisztikus esetet és a hiába- 
valóság esetét megkülönböztetni, egy kis változatosság a javításban általánosságban is 
jó ötlet. 

A helytelen cselekvés problémájára egy másik megoldás a tanulás. Néhány próbál- 
kozás után a tanuló ágensnek képesnek kell lennie a cselekvésleírás módosítására, hogy 
az igényelje, hogy a kulcs nyissa az ajtót. Ezen a ponton az újratervező automatikusan 
egy új tervvel áll elő, mint egy új kulcs megszerzése. A 21. fejezet ezt a fajta tanulást 
mutatja be. 

Az újratervező ágensnek még ezekkel a lehetséges javításokkal is vannak további hát- 
rányai. Nem hatékony a valós idejű környezetekben, és nincs korlát az újratervezési időre, 
ezáltal nincs korlát a cselekvésről való döntés idejére sem. Szintén képtelen saját célokat 
kialakítani vagy a meglévő célokhoz új célokat fogadni, azaz nem lehet hosszú életű egy 
összetett környezetben. Ezeket a hátrányokat kezeljük a következő fejezetben. 


12.6. FOLYTONOS TERVKÉSZÍTÉS 


Ebben az alfejezetben olyan ágenst tervezünk, amely meghatározatlanul sokáig kitart 
egy környezetben. Így ez nem egy , problémamegoldó", ami egyetlen célt szeretne elérni 
És ezt tervezi, és addig cselekszik, amíg a célt el nem éri, hanem folyamatosan változó cé- 
lok, tervkészítési és cselekvési fázisok sorozatát éli meg. Ahelyett hogy a tervkészítőt 
és a cselekvésmonitorozót mint különálló, de egymásnak eredményeket szolgáltató fo- 
Iyamatokat tekintetnénk, a folytonos tervkészítő ágensben (continuous planning agent) 
ezeket egyetlen folyamatként képzeljük el. 

Az ágensre mindig úgy gondolunk, mint ami része egy terv végrehajtásának, az élete 
nagy tervének. Cselekvései tartalmazzák a végrehajtásra készen álló terv lépéseinek 
végrehajtását, a nyitott előfeltételek kielégítésére vagy a konfliktusok feloldására szolgá- 
ló tervfinomítást, a végrehajtás során nyert új információk fényében a terv módosítását. 


14 A tervjavítás hatástalan ismétlése pontosan megfelel a szöcskeölő darázs viselkedésének (lásd 72. oldal). 
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Nyilvánvaló, hogy amikor először új célt formál, az ágensnek nincsenek végrehajtásra 
kész cselekvései, ezért egy kis időt a részleges terv elkészítésével tölt. Nagyon is lehetsé- 
ges azonban, hogy az ágens a terv teljes befejezése előtt elkezdi a végrehajtást, különö- 
sen ha független részcélokat kell elérni. A folytonos tervkészítő ágens folyamatosan 
monitorozza a világot, az új megfigyelések alapján módosítja ennek modelljét, még ak- 
kor ís, ha elképzelései még mindig változnak. 

Először egy példán haladunk végig, majd bemutatjuk az ágens programját, amelyet 
FOLYTONOS-RRT-ÁGENS-nek nevezünk, mivel a tervezett cselekvések reprezentálá- 
sára részben rendezett terveket használ. Hogy a leírást egyszerűsítsük, teljesen meg- 
figyelhető környezetet feltételezünk. Ugyanezen technikák kiterjeszthetők a részben 
megfigyelhető esetre is. 

A példánk a kockavilág problémakörből származik (lásd 11.1. alfejezet). A kiinduló 
állapot a 12.15. (a) ábrán látható. A Mozgat(x, y) cselekvésre van szükségünk, ami az x 
kockát az y kockára mozgatja, amennyiben mindketten szabadok. A cselekvés sémája: 


Cselekvés(Mozgat(x, y), 
ELŐFELTÉTEL:Tiszta(x) A Tisztaty) A Rajta(x, 2) 
KÖVETKEZMÉNY: Rajta(x, y) A Tiszta(z) A —Rajtatx, z) A —Tisztaty) 


Az ágensnek először egy célt kell megfogalmaznia. Itt nem tárgyaljuk a célkialakí- 
tást, helyette feltételezzük, hogy az ágensnek valahogy megmondták (vagy saját maga 
eldöntötte), hogy a Rajta(C, D) N Rajta(D, B) célt kell elérnie. Az ágens ehhez a célhoz 
kezdi a tervezést. Ellentétben minden másik ágensünkkel, amelyek lekapcsolják érzé- 
kelőiket, amíg a tervkészítő egy teljes megoldást nem ad a problémára, a folytonos 
tervkészítő ágens inkrementálisan épít egy tervet, ahol a terv minden bővítése egy kor- 
látos időtartamot vehet igénybe. Minden bővítés után az ágens egy NoOp cselekvést ad 
vissza, és ellenőrzi az érzékeléseit. Feltételezzük. hogy az érzékelt adatok nem változ- 
nak, és az ágens gyorsan megalkotja a 12.16. ábrán látható tervet. Vegyük észre, hogy 
bár mindkét cselekvés előfeltételeit teljesíti az Indít állapot, van egy követési megkötés, 
ami a MozgakD, B) cselekvést a Mozgat(C, D) elé helyezi. Erre azért van szükség, 
hogy a Tiszta(D) igaz maradjon, amíg a Mozga(D, B) befejeződik. A folytonos terv- 
készítési folyamat alatt az indít mindig az aktuális állapot címkéje. Az ágens minden 
cselekvés után módosítja az állapotot. 

A terv készen áll a végrehajtásra, de még mielőtt az ágens cselekedhetne, a környe- 
zet közbeszól. Egy külső ágens (talán az ágens tanítója vált türelmetlenné) a (d) kockát 
a (b)-re helyezi, a világ most a 12.15. ábra (b) állapotának felel meg. Az ágens ezt érzé- 
keli, észreveszi, hogy a Tiszra(B) és a Rajta(D, G) már nem igaz az aktuális állapotban, 
és ennek megfelelően módosítja az aktuális állapot modelljét. Az okozati kapcsolatok, 
amelyek a MozgakD, B) cselekvés Tiszta(B) és Rajta(D, G) előfeltételeit adták, már 
nem helyesek, el kell távolítani őket a tervből. Az új tervet a 12.17. ábra mutatja. Min- 
den pillanatban az indít az aktuális állapotot reprezentálja, így ez az fndít különbözik 
az előző ábra hasonló állapotától. Vegyük észre, hogy a terv most nem teljes: a Moz- 
gakD, B) előfeltételei közül kettő nyitott, és a Rajta(D. y) most nem példányosított, 
mert már nincs okunk feltételezni, hogy a lépés a G-ről indul. 

Az ágens most kihasználhatja a , segítő" közbeavatkozást, észrevéve, hogy a 
Mozga(D,By—an22 , Befejez okozati kapcsolat helyettesíthető az Indít-ból a Be- 
fejez állapotba mutató direkt kapcsolattal. Ezt a folyamatot az okozati kapcsolat 
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12.15. ábra. Az állapotok sora, amint a folytonos tervkészítő ágens megpróbálja a (d)-nek megfelelő Raj- 
tat C, D) A Rajta(D, B) célállapotot elérni. A kiinduló állapot az (a). A (b) állapotnál egy másik ágens közbe- 
lépett és (d)-t (b)-re helyezte. A (c) állapotban az ágens a Mozgat(C. D) cselekvést hajtotta végre, ami si- 
kertelen volt, (c)-t az (a)-ra ejtette. Újrapróbálja a Mozgar(C, D) cselekvést, amivel eléri a (d) célállapotot. 
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12.16. ábra. A folytonos tervkészítő ágens által készített kiinduló terv. A terv egyelőre nem különbözik 
egy átlagos részben rendezett tervkészítő által készítettől. 


E [mozoac 0] 

[mozgattc.D)] D) 
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kal he zaj [ Mozgat(D.8); 
12.17. ábra. Miután valaki más elmozdította a D kockát a 8-re, a Tiszta(B) és a Rajta(D, G) biztosítására 
szolgáló kapcsolatokat eldobjuk, ai ezt a tervet eredményezi 


kiterjesztésének (extension) nevezzük, és akkor alkalmazzuk, amikor egy feltétel 
egy későbbi helyett egy korábbi lépéssel biztosítható, új ütközés okozása nélkül. 

Miután a régi MozgakD, B) és Befejez közötti okozati kapcsolatot eltávolítottuk, a 
Mozgak(D, B) továbbiakban nem forrása egyetlen okozati kapcsolatnak sem. Ez most 
egy redundáns lépés (redundant step). Minden redundáns lépést és bármely ezt biz- 
tosító kapcsolatot kitörlünk a tervből. Ez a 12.18. ábrán látható tervet eredményezi. 

Most a Mozgak(C, D) lépés készen áll a végrehajtásra, hiszen az Indít lépés kielé- 
gíti minden előfeltételét, nincs szükség más megelőző lépésre, és nem ütközik a terv 
egyetlen másik kapcsolatával sem. A lépést eltávolítjuk a tervből, és végrehajtjuk. 
Sajnos az ágens ügyetlen, és a C-t az A-ra ejti a B helyett, ami a 12.15. ábra (c) álla- 
potát eredményezi. Az új tervállapotot a 12.19. ábra mutatja. Vegyük észre, hogy bár 
most nincsenek cselekvések a tervben, a Befejez lépésnek még mindig van egy nyitott 
feltétele. 

Az ágens úgy dönt, hogy a nyitott feltételhez készít tervet. Újra a Mozgat(C, D) elé- 
gíti ki a célfeltételt. Ennek előfeltételeit az indít lépésből induló új okozati kapcsolatok 
teljesítik. Az új tervet a 12.20. ábra mutatja. 
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12.18. ábra. A MozgatíC, D) által létrehozott kapcsolatot helyettesítettük az [ndít kapcsolatával, a most 
már redundáns Mozgar(D. B) lépést pedig elhagytuk 
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TIszta(G) 
12.19, ábra. A Mozga(C, D) végrehajtása és a tervből való eltávolítása után az indít lépés következmé- 


nyei azt a tényt tükrözik, hogy a C a várt D helyett az A kockára került. A Rajra(C, D) cél előfeltétel még 
minding nyitott. 


Bata(C Ar 
Ke eezzzás [UZT 
5 BatotC 0) 
cgi 83 [57] 
Tianntó) 
12.20. ábra. A nyitott előfeltételt a Mozgat(C, D) ismételt hozzáadásával oldjuk fel. Vegyük észre az elő- 
feltételekhez szükséges új kapcsolatokat. 


A Mozgat(C, D) újra készen áll a végrehajtásra. Ez alkalommal működik, ami a célál- 
lapotot eredményezi, melyet a 12.15. ábra (d) része mutat. Miután egy lépést elhagyunk 
a tervből, a Rajta(C, D) célfeltétel újra nyitottá válik. Mivel az indít lépést frissítettük, 
hogy tükrözze az új állapotot, a célfeltétel azonnal kielégíthető egy kapcsolattal az In- 
dít lépésből. Ez az események normális folyása, ha egy cselekvés sikeres. A végleges 
tervállapotot a 12.21. ábra mutatja. Mivel az indít lépés az összes célfeltételt kielégíti, 
és nincsenek hátralevő cselekvések, az ágens szabadon eltávolíthatja a Befejez állapot 
céljait, és új célokat fogalmazhat meg. 

Ebből a példából látható, hogy a folytonos tervkészítés nagyban hasonlít a részben 
rendezett tervkészítéshez. Minden iterációban az algoritmus talál valami tervsérülésnek 
(plan flaw) nevezett javítanivalót a tervben, és megjavítja. A részben rendezett terv- 
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12.21. ábra. A MozgattC, D) végrehajtása és tervből eltávolítása után a Rajta(C, D) megmaradt nyitott 
feltételt az /ndít lépésből induló okozati kapcsolat hozzáadásával oldjuk fel. A terv most tetjes. 


528 12. TERVKÉSZÍTÉS ÉS CSELEKVÉS A VALÓ VILÁGBAN 


készítő algoritmus egy sérüléseltávolító algoritmusnak tekinthető, ahol a kétféle sérülés 
a nyílt előfeltétel és az okozati ütközés lehet. A folytonos tervkészítő ágens másrészről 
sérülések egy jóval szélesebb körét kezeli: 


s Hiányzó cél: az ágens eldöntheti, új célt vagy célokat ad a Befejez állapothoz. 
(Folytonos tervkészítésben értelmesebb lenne a Befejez állapot nevét Örökkévaló- 
ság-ra és az Indít-ét Aktuális-ra változtatni, de ragaszkodunk a hagyományokhoz.) 

e Nyílt előfeltétel: egy okozati kapcsolatot ad a nyílt előfeltételhez, egy meglévő vagy 
egy új cselekvést választva (mint a részben rendezett tervkészítőben). 

9 Okozati ütközések: adott az A —5 3 B ok-okozati kapcsolat és a -p következményű 
C cselekvés. Válasszunk az ütközés feloldásához egy rendezési megkötést vagy egy 
változómegkötést (mint a részben rendezett tervkészítésben). 

5. Nem támogatott kapcsolat: ha van egy Starr —553 A ok-okozati kapcsolat, ahol a p 
nem igaz az Indít állapotban, akkor távolítsuk el a kapcsolatot. (Ez megóv minket 
attól, hogy végrehajtsunk egy olyan cselekvést, melynek előfeltételei hamisak.) 

s  Redundáns cselekvések: ha egy A cselekvés nem eredményez ok-okozati kapcsola- 
tokat, akkor távolítsuk el a kapcsolataival együtt. (Ez lehetővé teszi számunkra, 
hogy kihasználjuk a szerencsés helyzeteket.) 

e  Végrehajtatlan cselekvés: ha egy (a Befejez-től eltérő) A cselekvésnek, melynek az 
előfeltételeit az Indít kielégíti. nincs (az /ndíf-tól eltérő) cselekvés elé sorolva, és 
nem ütközik okozati kapcsolatokkal, akkor távolítsuk el A-t és ok-okozati kapcsola- 
tait, majd adjuk vissza mint a végrehajtandó cselekvést. 

a Szükségtelen történelmi cél: ha nincsenek nyílt előfeltételek és nincsenek a tervben 
cselekvések (azaz minden ok-okozati kapcsolat közvetlen az Indít-ból a Befejez álla- 
potba mutat), akkor elértük az aktuális célhalmazt. Távolítsuk el a célokat és az 
ezekbe mutató kapcsolatokat, hogy új célokat tegyünk lehetővé. 


A 12.22. ábra a FOLYTONOS -RRT -ÁGENS-t mutatja be. Ennek ciklusa az , érzékelés, el- 
távolítás a folyamatból, cselekvés". Tudásbázisában egy állandó tervet tart, és minden 
lépésben eltávolít egy folyamatot ebből a tervből. Ezután cselekszik (bár gyakran ez 
a cselekvés a NoOp) és ismétli a ciklust. Ez az ágens az 523-524. oldalon tárgyalt új- 
ratervező ágenshez felsorolt problémák nagy részét képes kezelni. Nevezetesen valós 
időben cselekszik, kezeli a kedvező helyzeteket, saját célokat fogalmaz meg, és kezeli 
a váratlan eseményeket, melyek a jövőbeli terveket érintik. 





function FOLYTONOS-RRT-ÁGENS( érzékelés) returns egy cselekvés 
static: rerv, egy terv, kezdetben csak indít, Befejez 


cselekvés — NoOp (alapértelmezés) 
KÖVETKEZMÉNYEK[ Start] — MÓDOSÍTÁS(KÖVETKEZMENYEK[Srart], érzékelés) 
Tökés-ELTÁvoLíTÁS(ter") // várhatóan egy cselekvés módosítása 

return cselekvés 











12.22. ábra. A FOLYTONOS-RRT-ÁGENS, egy folytonos, részben rendezett tervkészítő ágens. Egy érzé- 
kelés után az ágens eltávolít egy lépéssorozatot a folytonosan javított tervéből, és visszaad egy cselekvést. 
Gyakran számos cselekvéssor-eltávolító tervkészítés lépésre van szükség. mialatt csak a NoOp-ot adja 
vissza, mielőtt készen állna egy valós cselekvés végrehajtására. 
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12.7. MULTIÁGENS TERVKÉSZÍTÉS 


Eddig egyágenses környezetekkel (single-agent enviroments) foglalkoztunk, amely- 
ben az ágensünk egyedül van. Amikor más ágensek is jelen vannak a környezetben, az 
ágensünk egyszerűen hozzáveheti őket a környezetről alkotott modelljéhez, az alapvető 
algoritmusainak módosítása nélkül. Sok esetben azonban ez gyenge teljesítményhez 
vezetne, mert többi ágenssel való foglalkozás nem azonos a környezet kezelésével. Ne- 
vezetesen, a természet (feltételezhetően) közömbös az ágens szándékait illetően, míg 
más ágensek nem.!15 Ez az alfejezet ezen kérdések kezelésére a multiágens tervkészítést 
mutatja be. 

A 2. fejezetben láthattuk, hogy a multiágens környezetek lehetnek együttműködők 
(cooperative) vagy versengők (competitive). Egy nagyon egyszerű kooperatív példá- 
val kezdünk: egy páros teniszcsapat tervkészítésével. Olyan tervek alkothatók. amelyek 
a csapat mindkét játékosának a cselekvéseit meghatározzák. Az ilyen tervek hatékony 
elkészítéséhez használható technikákat mutatjuk be. A hatékony tervkészítés hasznos, 
de nem garantálja a sikert. Az ágenseknek egyet kell érteniük a felhasznált tervben! Ez 
valamilyen koordinációt (coordination) feltételez, amit valószínűleg kommunikáció- 
val (communication) érhetünk el. 


Kooperáció: közös célok és tervek 


A páros teniszt játszó ágenscsapatoknak közös céljuk van, a meccs megnyerése, ami 
különböző részcélokat eredményez. Tegyük fel, hogy a játék egy pontján a közös cél- 
juk az átütött labda visszaadása úgy, hogy legalább egyikőjük a hálót védi. Ezt a gon- 
dolatot egy multiágens tervkészítési (multiagent planning) problémával írhatjuk le, 
amint azt a 12.23. ábra is mutatja. 





ÁgensektA. B) 
Kiindulás(OtkA, (Bat, Alapvonat))), OB, Iobb, Háló)) A 
Megközelír( abda, (Jobb, Alapvonaf])) A PartenA, B) A PartnertB, A) 
CékVisszaadotttLabda) A Orttágens, (x, Hálól)) 
Cselekvés(Ütéstágens, Labda), 
ELŐFELTÉTEL:Megközelít(Labda, [x, y) A Ottlágens, (x, y]) A Partnertágens, partner) 
A -Orparmer, [x, y]) 
KÖVETKEZMÉNY: Vis idott(íLabda)) 
Cselekvés(Menj(ágens, Ix, yD, 
ELŐFELTÉTEL:Ott(ágens, [a, b) 
KÖVETKEZMÉNY: Ott(ágens, Íx, xy A -Ortágens, [a, bp) 














12.23. ábra. A páros tenisz probléma. Két ágens együtt játszik, és négy pozíció egyikében lehetnek: [Bal , 
Alapvonal). LJobb. Alapvonal), (Bal. Háló) és Jobb. Hálój. A labda visszaadható, ha pontosan egy játé- 
kos van a megfelelő helyen. 


15 Nem biztos, hogy az Egyesült Királyság lakói, ahol egy pikniknek már pusztán a tervezése is esőt garantál, 
egyetértenek ezzel. 
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Ez a jelölésrendszer két újdonságot vezet be. Először az Ágens(A, B) deklarálja, hogy 
két ágensünk van, A és B, akik a tervben szerepelnek. (Ebben a problémában a szem- 
ben álló játékosokat nem ágensnek vesszük.) Másodszor minden cselekvés az ágenst 
explicit módon, mint egy paramétert említi, mert pontosan követnünk kell, melyik 
ágens mit csinál. 

A multiágens tervkészítési probléma megoldása egy együttes terv (joint plan), 
amely minden ágenshez tartalmaz cselekvéseket. Az együttes terv egy megoldás, ha a 
célt elérjük azáltal, hogy mindegyik ágens végrehajtja a számára kijelölt cselekvéseket. 
A következő terv a tenisz probléma egy megoldása : 


TERvI: 
A: IMegy(A. (Jobb, Alapvonatp, Ü(A, Labda)) 
B: INo0Op(B), NoOp(B)] 


Ha mindkét ágens ugyanazzal a tudásbázissal rendelkezne, és ez lenne az egyetlen meg- 
oldás, akkor minden rendben lenne; minden ágens meghatározná a megoldást, és együt- 
tesen végrehajtanák. Az ágensek számára sajnálatos (és hamarosan látni fogjuk, hogy ez 
miért sajnálatos), hogy van egy másik terv is, ami az elsőhöz hasonlóan kielégíti a célt: 


TERV 2: 
A: IMegy(A. (Bal, Háló)), NOOP(A)] 
B: IMegXB, (Jobb, Alapvonat)]), ÜKB. Labda)) 


Ha az A a 2. tervet választja, és B az 1-et, akkor senki sem fogja visszaadni a labdát. 
Fordítva, ha A az 1-et és B a 2-t választja, akkor várhatóan összeütköznek egymással, 
senki nem adja vissza a labdát, és a háló is fedezetlenül marad. Ezért a helyes együttes 
terv létezése nem jelenti, hogy a célt el is érjük. Az ágenseknek szükségük van egy 
koordinációs (coordination) mechanizmusra, hogy ugyanazt az együttes tervet érjék 
el, sőt mi több, az ágensek közös tudással is kell rendelkezzenek (lásd 10. fejezet) arról, 
hogy melyik együttes tervet hajtják végre. 


Többtestű tervezés 


Ez az alfejezet a megfelelő együttes tervek megalkotására fókuszál, elodázva egyelőre 
a koordinációs kérdéskört. Ezt többtestű tervkészítésnek (muitibody plannining) ne- 
vezzük, és tulajdonképpen az a tervkészítési probléma, mellyel egy egyedülálló centra- 
lizált ágens áll szemben, mely cselekvéseket diktálhat minden fizikai entitásnak. Egy 
valóban multiágens esetben ez lehetővé teszi minden ágens számára, hogy felderítse 
melyek a lehetséges együttes tervek, melyek együttes végrehajtása sikeres lenne. 

Megközelítésünkben a többtestű tervkészítést a 1 1.3. alfejezetben bemutatott részben 
rendezett tervkészítésre alapozzuk. Az egyszerűség kedvéért teljes megfigyelhetőséget 
feltételezünk. Van még egy kérdés, ami nem merül fel az egyedülálló ágens esetén: 
a környezet a továbbiakban nem igazán statikus (static), mert a többi ágens cseleked- 
het, amíg egy bizonyos ágens gondolkozik. Ezért foglalkoznunk kell a szinkronizációval 
(synchronization). Az egyszerűség kedvéért feltételezzük, hogy minden cselekvés vég- 
rehajtási ideje azonos, illetve hogy az összetett terv minden pontján a cselekvések végre- 
hajtása szimultán történik. 
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Bármely időpontban minden ágens pontosan egy cselekvést hajt végre (beleértve 
a NoOp(Üres) operátort is). Ezen konkurens cselekvések halmazát együttes cselek- 
vésnek (joint action) nevezzük. A tenisz problémában (530. oldal) például a (NoOp(A), 
ÜKB, Labda)) az A és B ágenseknek egy együttes cselekvése. Egy együttes terv együt- 
tes cselekvések részben rendezett gráfja. Például a tenisz probléma második terve az 
együttes cselekvések következő sorozatával írható le: 


(Megy(A, [Bal. Háló). Megy(B, (Jobb. Alapvonat))) 
(NoOp(A). ÜKB. Labda)) 


Végrehajthatnánk a tervkészítést a hagyományos részben rendezett tervkészítő algorit- 
mussal, azt az összes lehetséges együttes cselekvés halmazára futtatva. Az egyetlen 
probléma a halmaz mérete: 10 cselekvéssel és 5 ágenssel 105 együttes cselekvést ka- 
punk. Elég unalmas lenne az összes cselekvés előfeltételét és következményét helyesen 
definiálni, és nem lenne hatékony egy ilyen nagy halmazzal tervezni, 

Egy másik lehetőség az együttes cselekvések implicit definiálása úgy, hogy minden 
egyes cselekvéshez leírjuk, hogy milyen kölcsönhatásban áll a többi lehetséges cselek- 
véssel. Ez egyszerűbb lenne, hiszen a legtöbb cselekvés független a legtöbb másiktól, 
ezért csak azon néhány cselekvést kellene listáznunk, amelyek valójában kölcsönhatás- 
ban vannak. Ezt a hagyományos STRIPS vagy ADL cselekvésleírások egy új tulajdon- 
sággal való kiterjesztésével tehetjük meg: ez a konkurens cselekvések listája (con- 
current action list). Ez nagyon hasonlít a cselekvés leírásában szereplő előfeltételhez, 
kivéve, hogy az állapotváltozók leírása helyett ez cselekvéseket ír le, amelyeket egy- 
szerre kell, vagy éppen nem szabad egyszerre végrehajtani. Például a Találat cselekvés 
a következőképpen írható le: 


Cselekvés( A, Labda), 
KONKURENS:-ÜK(B, Labda) 
ELŐFELTÉTEL:MegközelíLabda, (x, yD) A OHA, (x, Xb 
KÖVETKEZMÉNY: Visszaadott(Labda)) 


Itt egy tiltó egyidejűségi megkötésünk van, azaz az Üt cselekvés végrehajtása alatt egy 
másik ágens nem hajthat végre egy másik Üt cselekvést. Hasonlóképpen megkövetelhe- 
tünk egyidejű cselekvést. Például amikor két ágensre van szükség egy üdítőkkel teli hű- 
tőtáska teniszpályához cipeléséhez. Ezen cselekvés leírása azt fejezi ki, hogy az A ágens 
nem hajthatja végre a Cipel cselekvést, hacsak nincs egy másik B ágens, aki egyidejű- 
leg egy Cipel cselekvést hajt végre ugyanazon hűtőtáskával: 


Cselekvés(CipekA, hűtőtáska, itt, ott), 
KONKURENS:Cipel(B, hűtőtáska, itt, ott) 
ELŐFELTÉTEL:OHKA, itt) A OmHűtőtáska, itt) A Hűtőtáska(htűítőtáska) 
KÖVETKEZMÉNY: Ott(A, ott) A Orhűtőtáska. ott) 
A OKA, itt) A —Ort(hűtőtáska, itt) 


Ezen reprezentáció segítéségével a részben rendezett tervkészítőhöz nagyon közeli 
tervkészítő hozható létre. Mindössze három különbség van: 


1. Az A - B temporális rendezési relációt kiegészítendő megengedjük az A — B-t és az 
A - B-t, ami , egyidejűséget", illetve , megelőzőséget vagy egyidejűséget" jelent. 


hg 12. TERVKÉSZÍTÉS ÉS CSELEKVÉS A VALÓ VILÁGBAN 


2. Amikor egy új cselekvés egyidejű cselekvéseket igényel, példányosítani kell ezen 
cselekvéseket a terv új vagy létező cselekvéseinek felhasználásával. 

3. A tiltottan egyidejű cselekvések a megkötések újabb forrásai. Minden megkötést fel 
kell oldani az ütköző cselekvések egymás elé vagy mögé rendelésévei. 


Ez a reprezentáció a többtörzsű problémakörökhöz alkalmazott, részben rendezett terv- 
készítővel ekvivalens. Kiterjeszthetnénk ezt a megközelítést az utolsó két fejezet fino- 
mításaival - HFH-ek részleges megfigyelhetőség, feltételek, végrehajtás-monitorozás és 
újratervezés -, de ez túlmutat a könyv célkitűzésein. 


Koordináló mechanizmusok 


A legegyszerűbb módszer, amivel ágensek egy csoportja biztosíthatja az egyetértést 
egy együttes tervben, hogy egy konvenciót (convention) fogadnak el az együttes 
cselekvés megkezdése előtt. A konvenció az együttes tervek közötti választásra vonat- 
kozó bármely olyan megkötés, amely túlmutat az alapmegkötésen, amely szerint egy 
együttes tervnek működni kell, ha minden ágens alkalmazza. Például a , maradj a saját 
térfeleden" konvenció a páros partnereket a második terv kiválasztására sarkallja, míg 
az ,egy játékos mindig a hálónál marad" konvenció az egyes tervhez vezetné őket. 
Néhány konvenció, mint az út megfelelő oldalán való vezetés, olyan széles körben 
elterjedt, hogy ezeket már társadalmi törvényszerűségekként (social laws) kezeljük. 
Az emberi nyelvek szintén konvencióknak tekinthetők. 

Az előző alfejezet konvenciói alkalmazási terület specifikusak és a cselekvésleírások 
megkötéseivel implementálhatók, amelyekkel kizárjuk a konvenciók megszegéseit. 
Egy általánosabb megközelítés, hogy problémakör-független konvenciókat használ- 
junk. Például ha mindegyik ágens ugyanazon többtestű tervkészítő algoritmust futtatja 
ugyanazon bemenetekkel, követi azt a konvenciót, miszerint az elsőként megtalált, 
használható összetett tervet hajtsa végre, miközben biztos benne, hogy a többi ágens 
ugyanezzel a választással él. Egy sokkal robusztusabb, de jóval költségesebb stratégia 
lenne az összes összetett terv elkészítése, majd az ebből való választás (mondjuk annak 
kiválasztása, amelynek leírt reprezentációja ábécé-sorrendben az első). 

Konvenciók szintén adódhatnak a folyamatok evolúciós fejlődésévet. Például a kö- 
zösségben élő rovarok nagyon kidolgozott összetett terveket hajtanak végre, melyeket 
a kolónia egyedeinek közös genetikus összeállítása biztosít. Az azonosságot szintén 
nyomatékosítja a tény, hogy a konvencióktól való eltérés csökkenti az evolúciós alkal- 
masságot, így bármely alkalmazható összetett terv stabil egyensúlyi helyzetet eredmé- 
nyezhet. Hasonló megfontolások alkalmazhatók az emberi nyelv fejlődésére, ahol nem 
az a fontos, hogy egyes személyek milyen nyelvet beszélnek, hanem az a tény, hogy 
minden személy ugyanazt a nyelvet beszéli. 

Egy utolsó példa a madarak gyülekezési viselkedése. Megfelelő szimulációt nyerhe- 
tünk, ha minden egyes madár ágens (melyet néha madaroidnak vagy roidnak neve- 
zünk) a következő három szabályt követi valamilyen kombináció alapján: 


1. Különválás; távolodjunk el a szomszédoktól, amikor túl közel kerülünk: 





3. Irányultság: kerüljünk a szomszédokhoz képest átlagos orientációba (haladási irányba). 
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Ha minden madár azonos szabályrendszert hajt végre, a csapat repülése egy kialakuló 
viselkedést (emergent behavior) mutat, hasonlóan egy nagyjából azonos sűrűségű 
pszeudomerev test viselkedéséhez, amely nem bomlik fel az idő során. Mint a bogaraknál, 
itt sincs szükség arra, hogy minden ágens ismerje a teljes összetett tervet, ami a többi ágens 
cselekvését modellezi. 

A konvenciók ahelyett, hogy minden egyes új problémához kifejlesztenénk őket, 
tipikusan egyedi multiágens tervkészítő problémák egy egész csoportjához készülnek. 
Ez rugalmatlansághoz és hibához vezethet, amit néha láthatunk, ha a páros tenisz játsz- 
mában a labda nagyjából azonos távolságra van a két partner között. Egy alkalmazható 
konvenció hiányában az ágensek kommunikálhatnak (communication), hogy egy 
közös tudást érjenek el az alkalmazható összetett tervből. Például a teniszpáros egy 
játékosa felkiálthat , Enyém!" vagy , Tiéd!", hogy jelezze a preferált tervet. A kommu- 
nikációs mechanizmusokat nagyobb mélységben a 22. fejezetben tárgyaljuk, ahol meg- 
figyelhetjük, hogy akommunikáció nem szükségszerűen szóbeli információcserét jelent. 
Például egy játékos úgy ís közölheti az általa előnyben részesített összetett tervét a má- 
sikkat, hogy végrehajtja annak kezdő részletét. A teniszjátszma problémánkban, ha az 
A ágens elindul a hálóhoz, akkor a B ágens rákényszerül, hogy visszamenjen az alapvo- 
nalhoz megütni a labdát, mivel a második terv az egyetlen összetett terv, ami A hálóhoz 
mozgásával kezdődik. Ez az irányítási megközelítés, amelyet gyakran a terv felismerésé- 
nek (pian recognition) nevezünk, akkor működik, ha egyetlen cselekvés (vagy cselek- 
vések rövid sorozata) elegendő, hogy egyértelműen azonosítsuk az összetett tervet. 

Azt a terhet, amely biztosítja, hogy az ágensek egy sikeres összetett tervhez jussanak, 
vagy az ágensek készítőire, vagy magukra az ágensekre helyezhetjük. Az első esetben 
mielőtt az ágensek tervezni kezdenének, az ágens készítőjének bizonyítania kell, hogy 
az ágensek szabályai és stratégiái sikeresek lesznek. Az ágensek önmagukban lehetnek 
reaktívak, amennyiben ez működik az őket körülvevő környezetben, valamint ha nem 
kell, hogy pontos modelljük legyen a többi ágensről. Az utóbbi esetben az ágensek 
megfontoltak: bizonyítaniuk vagy demonstrálniuk kell, hogy a tervük hatékony lesz, 
figyelembe véve a többi ágens megfontolásait. Például egy A és 8 logikai ágenst tartal- 
mazó környezetben mindketten rendelkezhetnek a következő definícióval: 


Vp, s  Megfelelőtp, s) 6 KözösTudás((A, B), Eléritp, s, Cél) 


Ez azt mondja, hogy bármely s szituációban, a p terv egy alkalmazható összetett terv, 
ha az ágensek közösen tudják, hogy a p eléri a célt. További axiómákra van szüksé- 
günk, hogy biztosítsuk egy adott összetett terv végrehajtására vonatkozó közös szán- 
dék (joint intention) együttes ismeretét. Az ágensek csak ebben az esetben kezdhetnek 
cselekedni. 


Versengés 


A többágenses környezeteknek nem mindegyike áll együttműködő ágensekből. Az egy- 
másnak ellentmondó működésű ágensek versenyben (competition) vannak egymással. 
Erre egy példát jelentenek a két játékost igénylő, de zérus összegű játékok, mint amilyen a 
sakk. A 6. fejezetben láthattuk, hogy a sakkozó ágensnek figyelembe kell vennie az ellen- 
fél következő néhány lehetséges lépését is. Azaz egy versengő környezetben levő ágens- 
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nek (a) fel kell ismernie, hogy vannak más ágensek, (b) meg kell határoznia a többi 
ágens lehetséges terveit, (c) meg kell határoznia, hogy a többi ágens hogyan tervezi 
a saját terveivel való kölcsönhatást, és (d) el kell döntenie, hogy ezek fényében mi a 
legjobb cselekvés. A versengés, hasonlóan az együttműködéshez, a többi ágens tervé- 
nek modelljét igényli. Másrészről, egy versengő környezetben nincs elhatározás egy 
összetett terv mellett. 

A 124. alfejezet felvázolta a játékok és a feltételes tervkészítési problémák közötti 
analógiát. A 12.10. ábrán szereplő feltételes tervkészítő algoritmus olyan tervet készít, 
amely a környezetről a legrosszabb esetet feltételezve is működik, így olyan verseny- 
helyzetekben is alkalmazható, ahol az ágenst csak a siker vagy a bukás érdekli. Amikor 
az ágens és ellenfelei a terv költségeivel is foglalkoznak, akkor a minimax megoldás 
a helyénvaló. Eddig nagyon kevés munkát fordítottak a minimax módszer olyan mód- 
szerekkel való kombinálására, mint a részben rendezett tervkészítés vagy a HFH-terv- 
készítés, ami túlmutat a 6. fejezetben használt állapottér-keresési modellen. A vérsen- 
gés kérdésére a játékelmélettel foglalkozó 17.6. alfejezetben még visszatérünk. 


12.8. ÖSSZEFOGLALÁS 


Ez a fejezet a valódi világban alkalmazott tervkészítés és cselekvés nehézségeivel fog- 
lalkozott. Összefoglaljuk a fő megállapításokat. 


" A legtöbb cselekvés erőforrásokat (resources) használ, például pénzt, benzint vagy 
nyersanyagokat. Ezen erőforrásokat készletekre vonatkozó mérőszámokként cél- 
szerű kezelni, mintsem hogy megpróbáljunk következtetni mondjuk a világ minden 
egyes pénzérméjéről és papírpénzéről. A cselekvések generálhatnak és elfogyaszt- 
hatnak erőforrásokat, és rendszerint olcsó és hatékony, ha a további finomítások 
végrehajtása előtt a részleges terveket ellenőrizzük, hogy az erőforrásokra vonatozó 
korlátozásokat kielégítik-e. 

" Az idő az egyik legfontosabb erőforrás. Ez speciális ütemező algoritmusokkal kezel- 
hető, vagy az ütemezést integrálhatjuk a tervkészítésbe. 

s A hierarchikus feladat háló (hierarchical task network) (HFH) tervkészítés lehe- 
tővé teszi az ágens számára, hogy dekompozíciós szabályok formájában tanácsokat 
fogadjon el a feladatkör tervezőjétől. Ez lehetővé teszi, hogy nagyon nagy terveket 
készítsünk, amelyekre számos valódivilág-beli alkalmazáshoz szükség van. 

s A hagyományos tervkészítő algoritmusok teljes és helyes információt és determinisz- 
tikus, teljesen megfigyelhető környezetet feltételeznek. A legtöbb problémakörre nem 
igaz ez a feltételezés. 

e A hiányos információ kezelhető azáltal, hogy érzékelő cselekvéseket tervezünk, 
amelyekkel megszerezzük a szükséges információt. A feltételes tervek (condítional 
plans) lehetővé teszik az ágens számára, hogy a végrehajtás során érzékelje a kör- 
nyezetét, hogy eldönthesse, mely ágát követi a tervnek. Néhány esetben érzékelő- 
mentes (sensorless) vagy alkalmazkodó tervkészítés (conformant planning) 
használható az érzékelést nem igénylő terv elkészítéséhez. Mind az érzékelőmentes, 
mind pedig a feltételes tervek előállíthatók a hiedelmi állapotok (belief states) teré- 
ben történő kereséssel. 
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s A helytelen információk kielégítetlen előfeltételeket eredményeznek a cselekvések 
és a tervek számára. A végrehajtás-monitorozás (execution monitoring) a terv 
sikeres befejezése érdekében érzékeli az előfeltételek megszegéseit. 

s Az újratervező ágens (replanning agent) végrehajtás-monitorozást használ és 
szükség esetén javításokat szúr be. 

. A folytonos tervkészítő (continuous planning) ágens előrehaladása során új célokat 
alkot és valós időben reagál. 

s.  Multiágens (multiagent) tervezésre van szükség, amikor a környezetben más ágen- 
sek is találhatók, melyekkel együttműködni vagy versengeni kell, vagy amelyeket 
koordinálni kell. A többtestű (multibody) tervkészítés az együttes cselekvésleírá- 
sok hatékony dekompozícióját felhasználva együttes terveket alkot. de ki kell egé- 
szíteni valamilyen koordinációval, amennyiben két együttműködő ágensnek egyet 
kell érteni abban, hogy melyik együttes tervet hajtsák végre. 


Irodalmi és történeti megjegyzések 


A folytonos idővel való tervkészítést elsőként DEVISER vetette fel (Vere, 1983). 
Az időnek a tervekben való szisztematikus reprezentációjával Dean és társai dolgoz- 
tak a FORBIN rendszerben (Dean és társai, 1990). A NONLIN4 (Tate és Whiter, 1984) 
és a SIPE (Wilkins, 1988; 1990) kezelni tudta a korlátos erőforrások különböző terv- 
lépésekhez való hozzárendelését. Az 0-PLAN (Bell és Tate, 1985) HFH-tervkészítő az 
idő- és erőforrás-korlátozások egységes és általános reprezentációját tartalmazta. 
A szövegben említett Hitachi-alkalmazás kiegészítéseképpen, az O-PLAN módszert a 
Price Waterhouse-ban a szoftverbeszerzési tervkészítéshez alkalmazták, míg a Jaguar 
Autógyárban a hátsó tengely összeszerelési tervének készítésénél. Számos hibrid terv- 
készítő és ütemező rendszert alkalmaztak: az ISIs (Fox és társai, 1982; Fox, 1990) egy 
ütemezési feladatban alkalmazták a Westinghouse-nál, a GARi (Descotte és Latombe, 
1985) mechanikus alkatrészek gépesítését és készítését tervezte, a FORBIN-t gyár 
vezérlésre használták, végezetül a NONLIN-- hajózási logisztikai tervkészítéshez alkal- 
mazták. 

Az 1980-as években megindult elméleti munka tetőzése után, napjainkban ismét a 
temporális tervkészítés kerül előtérbe, amikor az új algoritmusok és a megnövekedett 
feldolgozási teljesítmény lehetővé tette a gyakorlati felhasználást. A két tervkészítő 
a SAPA (Do és Kambhampati, 2001) és a T4 (Haslum és Geffner, 2001) előrefelé törté- 
nő állapottér keresést alkalmaztak, amit az időtartammal és erőforrásokkal rendelkező 
cselekvések kezeléséhez egy kifinomult heurisztikával egészítettek ki. Egy másik lehe- 
tőség a nagyon költséges cselekvésleíró nyelvek használata, melyeket kézzel írt és al- 
kalmazási terület specifikus heurisztikákkal irányíthatunk, amint az az ASPEN (Fuku- 
naga és társai, 1997), a HSTS (Jonsson és társai, 2000) és az IXTeT (Ghallab és Laruelle, 
1994) esetén is történik. 

Az ütemezés az űrkutatásban nagyon hosszú múltra tekint vissza. A T-SCHED (Drabble, 
1990) rendszert az UOSAT-II műhold küldetésvezérlő parancssorozatainak ütemezésére 
használták. Az O0-PLAN-en alapuló OPTIMUM-AIV (Aarup és társai, 1994) és a PLAN- 
ERSI (Fuchs és társai, 1990) az űrrepülőgép-összeszerelésben a megfigyelési tervkészí- 
tésben használták fel az Európai Űrkutatási Ügynökségnél (ESA). 


536 12. TERVKÉSZÍTÉS ÉS CSELEKVÉS A VALÓ VILÁGBAN 


A SPIKE rendszert (Johnston és Adorf, 1992) a NASA-nál a Hubble-űrteleszkóp meg- 
figyelés-tervezéséhez használták, míg az űrsikló földi feldolgozásütemező rendszer 
(Deale és társai, 1994) emberi erőforrás ütemezést végez egészen 16 000 munkás-mű- 
szak értékig. A Remote Ágens (Muscettola és társai, 1998) lett az első önálló tervké- 
szítő és ütemező, mely űrsiklót vezérelt, mialatt a Deep Space One űrszonda fedélzetén 
repült 1999-ben. Az emberi erőforrás ütemezés irodalmát Vaessens és társai (Vaessens 
és társai, 1996) foglalták össze, az elméleti eredményeket Martin és Shmoys (Martin és 
Shmoys, 1996) jelentette meg. 

A STRIPS programban található a macrops — elemi lépések sorozatából álló , makró- 
operátorok" (macro operators) — tanulásra szolgáló eszköztár, az első hierarchikus 
mechanizmusnak tekinthető (Fikes és társai, 1972). A hierarchiát szintén alkalmazták 
a LAWALY rendszerben (Siklossy és Dreussi, 1973). Az ABSTRIPS rendszer (Sacerdoti, 
1974) az absztrakciós hierarchia (abstraction hierarchy) ötletét vezette be, ahol a 
magasabb szintű tervezés megengedte a cselekvések alacsonyabb szintű előfeltételei- 
nek figyelmen kívül hagyását, hogy egy működő terv általános struktúráját származtat- 
hassa. Austin Tate PhD-tézise (Tate, 1975b) és Earl Sacerdoti (Sacerdoti, 1977) mun- 
kája a HTM tervkészítés modern formájának alapötleteit vezette be. Számos gyakorlati 
tervkészítő, beleértve az O-PLAN és a SIPE tervkészítőket, HFH-tervkészítő. Yang 
(Yang, 1990) a HFH-tervkészítést hatékonnyá tevő cselekvések jellemzőit tárgyalja. 
Erol, Hendler és Nau (Erol és társai, 1994, 1996) egy teljes hierarchikus dekompozíciót 
alkalmazó tervkészítőt mutat be, valamint számos komplexitásbeli eredményt a tiszta 
HFH-tervkészítőkhöz. Más szerzők (Ambros-Ingerson és Steel, 1988); Young és társai 
(Young és társai, 1994); Barrett és Weld (Barett és Weld, 1994); Kambhampati és társai 
(Kambhampati és társai, 1998) az ebben a fejezetben bemutatott hibrid megközelítést 

" javasulták, melyben a dekompozíciók mindössze a részben rendezett tervkészítéshez 
használható finomítások egy másik formáját jelentik. 

A SrTgips-ben szereplő makróoperátorokkal kezdődően a hierarchikus tervkészítés 
egyik célja a korábbi, általánosított tervek formájában rendelkezésre álló tervkészítési 
tapasztalat újrahasznosítása. A magyarázatalapú tanulás (explanation-based learning) 
technikáját, amit részleteiben a 19. fejezet mutat be, számos rendszerben, mint a SOAR 
Laird és társai (Laird és társai, 1986) és PRODIGY (Carbonell és társai, 1989) alkalmazták 
a korábban elkészített tervek általánosítására. Egy másik megközelítés, hogy a korábban 
kiszámított terveket eredeti formájukban tároljuk el, majd az új hasonló feladatokban az 
eredeti feladat analógiájára újrahasznosítjuk őket. Ezt a megközelítést esetalapú terv- 
készítésnek (case-based planning) (Carbonell, 1983; Alterman, 1988; Hammond, 1989) 
nevezzük. Kambhampati (Kambhampati, 1994) érvelése szerint az esetalapú tervkészítést 
a finomító tervkészítéshez hasonlóan kellene vizsgálni. Emellett lefekteti az esetalapú rész- 
ben rendezett tervkészítés formális alapjait. 

A valós környezetek kiszámíthatatlanságát és részleges megfigyelhetőségét elsőként 
tervkészítési technikákat használó robotikai projektekben — beleértve a Shakey (Fikes 
és társai, 1972) és a FREDDY (Michie, 1974) projekteket — ismerték fel. A problémakör 
több figyelmet kapott McDermott nagy hatású Tervezés és cselekvés (Planning and 
Acting) c. cikkének megjelenését követően (McDermott, 1978a). 

A korai, feltételeket és ciklusokat nem tartalmazó tervkészítők nem tükrözték ponto- 
san a feltételes tervkészítés megközelítésmódját, de ennek ellenére néha kényszerítően 
reagáltak a környezet bizonytalanságára. Sacerdoti NoAHi rendszere kényszerítést hasz- 
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nált a , kulcsok és dobozok" (keys and boxes) probléma megoldásában, egy olyan terv- 
készítési kihívásban, ahol a tervkészítő keveset tud a kiinduló állapotról. Mason 
(Mason, 1993) kijelentette, hogy a robotikai tervkészítés nélkülözni tudja és nélkülöz- 
nie is kell az érzékelést, és bemutatott egy érzékelőmentes tervet, ami a kiindulási pozí- 
ciótól függetlenül képes egy eszközt csuklómozdulatok sorozatával az asztal egy meg- 
adott pozíciójába mozgatni. Ezt az ötletet a robotika kontextusában tárgyaljuk (lásd 
25.17. ábra). 

Goldman és Boddy (Goldman és Boddy, 1996) bevezették az alkalmazkodó tervké- 
szítés (conformant planning) fogalmát, az érzékelőmentes tervkészítőkre, melyek a 
bizonytalanságot a környezet ismert állapotokba való kényszerítésével kezelik, megje- 
gyezve, hogy az érzékelőmentes tervek gyakran hatékonyak még akkor is, ha az ágens 
rendelkezik érzékelőkkel. Az első megfelelően hatékony alkalmazkodó tervkészítő 
Smith és Weld (Smith és Weld, 1998) Conformant Graphplan (CGP) rendszere volt. 
Ferraris és Giunchiglia (Ferraris és Giunchiglia, 2000), valamint Rintanen (Rintanen, 
1999) függetlenül fejlesztettek ki SATPLAN-alapú alkalmazkodó tervkészítőket. Bonet és 
Geffner (Bonet és Geffner, 2000) a hiedelmi állapotok terén végzett heurisztikus kere- 
sésalapú alkalmazkodó tervkészítőt mutat be, olyan ötletekre alapozva, melyeket először 
1960-ban fejlesztettek ki a részlegesen megfigyelhető Markov döntési folyamatokhoz 
(Partially Observable Markov Decision Process — POMDP) (lásd 17. fejezet). Jelenleg a 
leggyorsabb hiedelmi állapot alkalmazkodó tervkészítők, mint például a HSCP (Bertoli 
És társai, 2001a) bináris döntési diagramokat (BDD) (Bryant, 1992) használnak a hiedel- 
mi állapotok leírására, valamint öt nagyságrenddel gyorsabbak, mint a CGP. 

A WARPLAN-C (Warren, 1976), ami a WARPLAN egy változata, volt az első feltételes 
cselekvéseket használó tervkészítők egyike. Olawski és Gini (Olawski és Gini, 1990) 
a feltételes tervkészítés fő problémáit vetette fel. 

A fejezetben bemutatott feltételes tervkészítési megközelítés a Jimenez és Torras 
(Jimenez és Torras, 2000), valamint Hansen és Zilberstein (Hansen és Zilberstein, 
2001) által kifejlesztett ciklikus ÉS-vAGY gráfok hatékony keresési algoritmusán alapul. 
Bertoli és társai (Bertoli és társai, 2001b) egy BDD-alapú megközelítést mutatnak be, 
ami ciklikus feltételes terveket készít. A C-BURIDAN rendszer (Draper és társai, 1994) 
egy folytonos tervkészítést végez valószínűségi kimenetelű cselekvésekre, melynek 
problémája a POMDP vezérlése során is felmerült (lásd 17. fejezet). Szoros kapcsolat 
van a feltételes tervkészítés és az automatizált programkészítés között. A 9. fejezet szá- 
mos ilyen hivatkozást tartalmaz. A két területet egymástól függetlenül tárták fel, ami- 
nek oka az az óriási költségkülönbség, ami egy gépi utasítás végrehajtása, valamint 
robot- vagy manipulátorcselekvések végrehajtása között fennáll. Linden (Linden, 1991) 
a két terület közötti tudásmegosztást szorgalmazza. 

Történelmi távlatból már látható, hogy hogyan vezetett a két fő klasszikus tervkészí- 
tő algoritmus kibővített verziókhoz a bizonytalan környezetek kezelése céljából. A ke- 
resésalapú technikák a hiedelmi állapottér keresésre vezették (Bonet és Geffner, 2000). 
A SATPLAN algoritmus a sztochasztikus SATPLAN (Majercik és Littman, 1999) algorit- 
musra, valamint a kvantorokat alkalmazó logikai tervezésre vezetett (Rintanen, 1999). 
A részben rendezett tervkészítésből az UWL (Etzioni és társai, 1992), a CNLP (Peot és 
Smith, 1992) és a CASSANDRA (Pryor és Collins, 1996) származik. A GRAPHPLAN, az 
érzékeléses GRAPHPLAN (sensory GRAPHPLAN-SGP) (Weld és társai, 1998) algorítmus- 
ra vezetett, de a teljesen valószínűségi GRAPHPLAN algoritmus még kifejlesztésre vár. 
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A végrehajtás monitorozás első fő megjelenése a PLANEX (Fikes és társai, 1972), ami 
egy STRIPS tervkészítővel működött a Shakey robot irányításán. A PLANEX háromszög 
táblákat használt — ami egy szükségszerűen hatékony tárolási mechanizmus a terv elő- 
feltételeinek tárolására a terv minden pontján —, hogy teljes újratervezés nélkül helyre- 
állhasson egy részleges végrehajtási hiba után. A végrehajtás Shakey-modelljét a 25. 
fejezetben tárgyaljuk tovább. A NASL tervkészítő (McDermott, 1978a) a tervkészítési 
problémát egyszerűen, mint egy komplex cselekvés végrehajtásának specifikációját te- 
kintette, így a tervezés és végrehajtás teljesen egységessé vált. Az összetett cselekvések 
levezetésére tételbizonyítást használ. 

A SiPE (System for Interactive Planning and Execution Monitoring) (Wilkins, 1988, 
1990) volt az első tervkészítő, ami az újratervezés problémáját szisztematikusan kezel- 
te. Különböző problémakörök demonstrációs feladataiban is felhasználták, például az 
űrsiklóhordozó fedélzeti terv készítésére vagy emberi erőforrás ütemezésére egy auszt- 
rál sörgyárban. Egy másik vizsgálat a SrpE rendszert többemeletes éj letek tervezésében 
alkalmazta, ami az egyik legbonyolultabb problémakör, amit tervkészítő valaha kezelt. 

Az IPEM (Intergrated Planning, Execution, and Monitoring) (Ambros-Ingerson és 
Steel, 1988) volt az első rendszer, ami integrálta a részben rendezett tervkészítést és a 
végrehajtást, hogy folytonos tervkészítő ágensre jusson. Az általunk tárgyalt folytonos, 
részben rendezett tervkészítő ágens (CONTINUOUS-POP-AGENT) az IÍPEM a PUCCINI (Gol- 
den, 1998) és a CYPREss (Wilkins és társai, 1995) tervkészítők ötleteit kombinálja. 

Az 1980-as évek közepén néhányan úgy gondolták, hogy a részben rendezett tervké- 
szítés és a kapcsolódó technikák soha nem futhatnak eléggé gyorsan, hogy egy valódi- 
világ-beli ágens számára használható viselkedést biztosítsanak (Agre és Chapman, 1987). 
Ezek helyett a reaktív tervkészítő (reactive planning) rendszereket vezették be. Ezek 
alapesetben reflexszerű ágensek, esetenként belső állapottal, melyek számos különböző 
feltétel-cselekvés szabályábrázolás segítségével implementálhatók. Brooks (Brooks, 
1986) bennfoglalási architektúrája (lásd. 7. és 25. fejezet) rétegzett véges állapotú álla- 
potgépeket használt, lábbal és kerékkel ellátott robotok mozgásának és akadályok elke- 
rülésének a szabályozására. Pengi (Agre és Chapman, 1987) egy (teljesen megfigyel- 
hető) videojátékot tudott játszani, az aktuális célok ,.látott" reprezentációja. az ágens 
belső állapota, valamint kétértékű áramkörök kombinálásával. 

Az univerzális tervek" (Schoppers, 1987) a reaktív tervkészítés keresőtábla módsze- 
reként került kifejlesztésre, de mint kiderült, ez a Markov döntési folyamatokban hasz- 
nált eljárásmód (policy) ötletének újrafelfedezése volt. Egy univerzális terv (vagy egy 
eljárásmód) bármely állapotban az adott állapotban végrehajtandó cselekvésre mutató le- 
képezési tartalmazza. Ginsberg (Ginsberg, 1989) lelkes támadást indított az univerzális 
tervek ellen, ami kezelhetetlenségi eredményeket is tartalmazott a reaktív tervkészítési 
probléma néhány alakjára. Erre Schoppers 1989-ben egy hasonlóan lelkes választ adott 
(Schoppers, 1989). 

Mint a legtöbb esetben a hibrid megközelítés feloldja az ellentmonást. Jól tervezett 
hierarchiák használatával a HFH tervkészítők, mint a PRS (Georgeff és Lansky, 1987) 
és a RAP (Firby, 1996), valamint a folytonos tervkészítő ágensek használható válasz- 
időket és összetett hosszú távú terveket érhetnek el számos problémakörben. 

A multiágens tervkészítés napjainkban vált népszerűvé, bár hosszú történelme van. 
Konolige (Konolige, 1982) a multiágens tervkészítés elsőrendű logikai leírását adta meg, 
míg Pednault (Pednault, 1986) egy STRIPS-alakú leírást készített. A kölcsönös szándék 
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ötlete, ami elengedhetetlen, ha az ágensek együttes tervet hajtanak végre, a kommuni- 
kációs viselkedés kutatásából ered (Cohen és Levesgue, 1990; Cohen és társai, 1990). 
Az általunk bemutatott többtestű részben rendezett tervkészítés Boutilier és Brafman 
(Boutilier és Brafman, 2001) munkáján alapul. 

Az itt szereplő, a multiágens tervkészítésben az együttműködést célzó munka bemu- 
tatása éppcsak a jéghegy csúcsa. Durfee és Lesser (Durfee és Lesser, 1989) azt tárgyal- 
ja, hogy a feladatok hogyan oszthatók meg az ágensek között egyezkedés útján. Kraus 
és társai (Kraus és társai, 1991) egy Diplomacyt - egy egyezkedést, együttműködést, 
felbomlást és ügyeskedést igénylő táblajátékot — játszó rendszert mutatnak be. Stone 
(Stone, 2000) bemutatja, hogy az ágensek hogyan tudnak csapattagként együttműköd- 
ni a robotfoci versengő, dinamikus, részben megfigyelhető környezetében. A (Weiss, 
1999) a multiágens rendszerek egy könyvhosszúságú áttekintése. Az 533. oldal moid mo- 
dellje Reynoldsnak köszönhető (Reynolds, 1987), aki ennek a Batman visszatér (Batman 
returns) c. film denevérseregeire és pingvincsapatára való alkalmazásával Oscar-díjat is 
nyert. 


Feladatok 


12.1. Vizsgáljuk meg figyelmesen a 12.1. alfejezetben az idő és az erőforrások repre- 
zentációját. 

(a) Miért jobb, ha egy cselekvés következménye az Időtartam(d), mint ha a cse- 
lekvésnek egy IDŐTARTAM: d alakú külön mezője lenne? (Segítség: vegyük fi- 
gyelembe a feltételes következményeket és a diszjunktív következményeket.) 

(b) Az ERŐFORRÁS; m miért egy külön mező a cselekvésben, nem pedig egy 
következmény? 


122. Egy fogyóeszköz (consumable resource) egy olyan erőforrás, ami (részlege- 
sen) felhasználásra kerül a cselekvésben. Például a motor beszerelése az autóba 
csavarokat igényel. Miután a csavarokat felhasználtuk, már nem használhatók 
további rögzítésekhez. 

(a) Magyarázza meg, hogyan módosítsuk a 12.3. ábra reprezentációját úgy, 
hogy 100 kiinduló csavarunk legyen az E) motor 40 csavart, az E, pedig 50 
csavart igényel. A -t- és — szimbólumok felhasználhatók az erőforrásokat 
leíró következménylíiterálokban. 

(b) Mutassa meg, hogy a részben rendezett tervkészítésben alkalmazott okoza- 
ti kapcsolatok és cselekvések közötti ütközés (conflict) definícióját hogyan 
kell módosítani, hogy a fogyóeszközöket kezelje. 

(c) Néhány cselekvés, például a gyár ellátása csavarokkal vagy egy autó fel- 
tankolása, növelheti az erőforrások készletét. Egy erőforrás monoton nem 
növekvő, ha egyetlen cselekvés sem növeli. Magyarázza meg, hogyan 
használható ez a tulajdonság a keresési tér megmetszéséhez. 


12.3. Adjon dekompozíciót a 12.7. ábra KivitelezőtVeszFel és EngedélytSzerez lépései- 
re, és mutassa meg, hogy a dekomponált résztervek hogyan állnak össze egy teljes 
tervvé. 
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12. TERVKÉSZÍTÉS ÉS CSELEKVÉS A VALÓ VILÁGBAN 


Adjon példát a házépítési problémakörben két olyan absztrakt résztervre, ami 
nem egyesíthető egy teljes tervvé lépések megosztása nélkül. (Segítség: azok a 
pontok, ahol egy ház fizikai részei csatlakoznak. egyúttal a résztervek várható 
csatlakozási kölcsönhatási pontjai is.) 


Sokan mondják, hogy a HFH-tervkészítés előnye, hogy ,tegyünk egy körutat 
Los Angelesből New Yorkba, és vissza" típusú problémákat is meg tud oldani, 
amelyeket nehéz nem HFH-jelölésekkel kifejezni, hiszen a kiinduló és a cél- 
állapotok azonosak lennének (Ot(LA)). Tud mondani megfelelő reprezentációt, 
illetve meg tudja-e oldani ezt a problémát HFH-k nélkül? 


Mutassa meg, hogy az eredeti STRIPS cselekvésleírás hogyan írható át HFH- 


dekompozícióvá. Használja az Eléri(p) cselekvést a p feltétel eléréséhez szüksé- 
ges cselekvés jelölésére. 


A hagyományos programozási nyelvekben számos művelet modellezhető olyan 
cselekvéssel, amely megváltoztatja a világ állapotát. Például egy értékadási operá- 
tor egy memóriaterület tartalmát másolja, míg egy nyomtatás operátor megvál- 
toztatja a kimenet állapotát. Egy, ezekből a műveletekből álló programot tervnek 
tekinthetünk, melynek célját a program specifikációja definiálja. A felkészítő algo- 
ritmusok ezért felhasználhatók egy adott specifikációjú program elkészítéséhez. 
(a) Írjon egy operátorsémát az értékadási operátorhoz (egy változó értékének 
átadása egy másik változónak). Vegye figyelembe, hogy az eredeti érték fe- 
lülíródik! 
(b) Mutassa meg, hogy az objektumok létrehozása hogyan használható a felké- 
szítő által két változó értékének egy átmeneti változó felhasználásával tör- 
ténő felcserélésére. 


Tekintsük a következő indoklást: egy bizonytalan kiinduló állapotot megenge- 
dő keretrendszerbe a diszjunktív következmények (disconjuctíve effects) 
csak jelölési könnyebbséget jelentenek, és nem a kifejezőképesség növelésére 
szolgálnak. Egy P V 0 diszjunktív következményt tartalmazó a cselekvéssémát 
mindig helyettesíthetünk a when R: P A when -R: 0 feltételes következmé- 
nyekkel, ami cserében két hagyományos cselekvésre redukálható. Az R kife- 
jezés egy a kiinduló állapotban ismeretlen véletlen állítást takar, melyhez nem 
tartozik érzékelő cselekvés. Helyes ez az indoklás? Vegyünk ki két esetet, 
egyet, melyben csak egy a cselekvésséma szerepel a tervben, és egy másikat, 
melyben több mint egy példány van. 





Miért nem tudja a feltételes tervkészítés kezelni a nem korlátos nemdeterminisz- 
tikusságot? 


A kockavilágban két STRIPS cselekvést kellett bevezetnünk, hogy az Üres pre- 
dikátumot helyesen megtartsuk, a Mozgat és az AsztalraTesz cselekvéseket. 
Mutassuk meg, hogy a feltételes következmények hogyan használhatók mindkét 
eset egyetlen cselekvéssel történő leírására. 
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12.11. 


12.12. 


12.13. 


12.14. 


12.15. 


12.16. 


12.17. 


A feltételes következményeket a porszívóvilág Szív cselekvésére mutattuk be, ahol 
az, hogy melyik kocka lesz tiszta, attól függ. hogy mely kockán áll a robot. Tud 
mondani olyan ítéletlogikai változókat, melyek a porszívóvilág állapotait definiál- 
ják úgy, hogy a Szív cselekvésnek feltétel nélküli leírása legyen? Adja meg a Szív, 
a Balra és a Jobbra cselekvések leírását az állításaik felhasználásával, és mutassa 
meg, hogy ezek kielégítők a világ összes lehetséges állapotának leírásához. 


Adja meg a Szív cselekvés teljes leírását a dupla-Murphy porszívó problémára, 
ami néha piszkot hagy maga után, amikor egy tiszta célterületre mozog, és néha 
piszkot rak le, ha a Szív cselekvést egy tiszta négyzeten hajtjuk végre. 


Keressen egy megfelelően piszkos szőnyeget, amely akadálymentes és porszí- 
vózza ki. Rajzolja le a porszívó által választott útvonalat, amilyen pontosan 
csak tudja. Indokolja a választ hivatkozva a fejezetben tárgyalt tervkészítési 
módszerekre. 


A következő idézetek samponos flakonok hátuljáról származnak. Azonosítsa 
mindegyiket, mint egy feltétel nélküli, feltételes vagy végrehajtás monitorozó 
tervet. (a) . Mosás. Öblítés. Ismételje." (b) , Tegye a sampont a fejére, és hagy- 
ja ott néhány percig. Öblítsen és ismételje, ha szükséges." (c) , Amennyiben az 
irritáció nem szűnik, forduljon orvoshoz." 


A 12.10. ábrán szereplő És-VAGY-GRÁF-KERESÉS algoritmus csak a gyökér és az 
aktuális állapot közötti útvonalat ellenőrzi le ismétlődő állapotokra. Mindehhez 
tegyük fel, hogy az algoritmus eltárolt minden meglátogatott állapotot, és össze- 
veti ezzel a listával (lásd például 3.19. ábra GRÁF-KERESÉS). Határozza meg, 
hogy milyen információt kellene tárolni, és azt, hogy az algoritmus hogyan 
használja ezt fel, amikor ismétlődő állapotot talál. (Segítség: szüksége lesz arra, 
hogy különbséget tegyen azon állapotok, melyekhez egy sikeres részterv készült 
korábban, és azon állapotok között, melyekre nem talált résztervet.) Magyaráz- 
za meg, hogyan használhatunk címkéket (labels), hogy elkerüljük a résztervek 
duplikálását. 


Mutassa meg precízen, hogy hogyan módosítjuk az És-VAGY-GRÁF-KERESÉS 
algoritmust, hogy ciklikus tervet generáljon, amennyiben ciklusmentes terv nem 
létezik. Ehhez három problémával kell megküzdenie: a terv lépéseinek címké- 
zése, hogy egy ciklikus terv vissza tudjon mutatni a terv egy korábbi pontjára, 
a VAGY-KERESÉS módosításával, hogy egy ciklikus terv megtalálása után ciklus- 
mentes tervet keressen, és a terv leírásának olyan bővítésével, mely jelzi, hogy 
a terv ciklikus. Mutassa meg, hogyan működik az algoritmus (a) a tripla- 
Murphy porszívóvilágban, (b) a váltakozó dupla-Murphy porszívóvilágban. 
Használhat számítógépes implementációt az eredmények ellenőrzéséhez. A (b) 
eset terve felírható egy hagyományos ciklusszintaxis használatával? 





Specifikálja teljesen a hiedelem állapot módosító folyamatot részben megfigyel- 
hető környezetekre. Azaz a módszert, ami az új hiedelmi állapot leírást számítja 
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12.18. 


12.19. 


12.21. 
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(mint ismeret állítások listáját) az aktuális hiedelmi állapot leírásból és a felté- 
teles következményeket tartalmazó cselekvésleírásokból. 


Írjon a (12.2.) egyenlettel analóg cselekvésleírásokat a Jobbra és a Szív cselek- 
vésekre. Adja meg a leírását a PozícióEltenőrzés cselekvésnek, a (12.3.) egyen- 
letnek megfelelően. Ismételje ezt meg a 12.11. feladat alternatív állítás halma- 
zának felhasználásával. 


Tekintse meg az 525. oldal listáját, ami felsorolja, hogy mit nem tud az újraterve- 
ző ágens végrehajtani. Vázoljon fel egy algoritmust néhány problérna kezelésére. 


. Vegyük a következő feladatot: egy páciens olyan tünetekkel érkezik az orvoshoz, 


amelyet kiszáradás vagy D fertőzés okozhat (de nem mindkettő). Két lehetséges 
cselekvés van: Iszik, ami feltétel nélkül kúrálja a kiszáradást, és Gyógyszert szed, 
amely a D fertőzést kúrálja ki. de káros mellékhatása van, ha a páciens kiszáradt. 
Írja fel a probléma leírást PDDL-ben, és az összes releváns világ számbavétele 
mellett ábrázolja az érzékelőmentes tervet, ami megoldja a problémát. 


Az előző feladat gyógyszerszedési problémájához adja hozzá a Vizsgál cselek- 
vést, melynek feltételes következménye a TenyészetNövekedés, amennyiben 
a Fertőzés igaz, és minden esetben van egy érzékelési következménye: Is- 
mert(TenyészetNövekedés). Ábrázolja a feltételes tervet, ami megoldja a prob- 
lémát és minimalizálja a GyógyszertSzed cselekvés felhasználását. 
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13. BIZONYTALANSÁG 


Ebben a fejezetben meglátjuk, mit kell egy ágensnek tennie, ha nem minden kristálytiszta. 


13.1. CSELEKVÉS BIZONYTALAN TUDÁS ESETÉN 


A II. és IV. részben leírt logikai ágensek ismeretelméleti kijelentéseket tesznek az állí- 
tások igaz, hamis vagy ismeretlen voltáról. Ha egy ágens elegendő mennyiségű tényt 
ismer a környezetére vonatkozóan, akkor a logikai megközelítés révén olyan terveket 
tud származtatni, amelyek biztosítják a sikert. Ami nagyon jó. Sajnos azonban az ágen- 
sek szinte soha nem férnek hozzá a környezetüket érintő teljes igazsághoz. Vagyis az 
ágenseknek bizonytalanság (uncertainty) közepette kell működniük. A 7. fejezet 
wumpous világának ágense például csak olyan szenzorokkal rendelkezik, amelyek loká- 
lis információt szolgáltatnak; a világ nagy része nem figyelhető meg közvetlenül. 
A wumpus ágens gyakran képtelen felfedezni, hogy két négyzet közül melyik tartalmaz 
csapdát. Ha a két négyzet az aranyhoz vezető úton van, akkor az ágensnek kockáztat- 
nia kell, és rá kell lépnie az egyikre. 

A világ a valóságban nagyságrendekkel bonyolultabb a wumpus világnál. Egy logikai 
ágens nem biztos, hogy képes kimerítő és helyes leírást adni arról, hogy a cselekedetei 
mennyire lesznek eredményesek. Tegyük fe! például, hogy az ágens ki szeretne vinni 
valakit a repülőtérre egy bizonyos járathoz. Ehhez egy Agg nevű tervet tekint, amely 
szerint a járat indulása előtt 90 perccel kell elindulnia otthonról és normális sebesség- 
gel kell vezetnie. Mindemellett, még ha a repülőtér csak 15 kilométerre van is, az ágens 
nem juthat a következő határozott kijelentésre: az Agg terv alapján időben kiérünk a 
repülőtérre, hanem csak egy gyengébb következtetésre: az Agg terv alapján időben ki- 
érünk a repülőtérre, ha az autóm nem romlik el vagy nem fogy ki belőle az üzemanyag, 
továbbá, ha nem történik velünk baleset, valamint a hídon sem lesz baleset, és a gép 
nem száll fel korábban, továbbá ha nem lesz földrengés... E feltételek egyike sem ve- 
zethető le, így a terv sikere sem következtethető ki biztosan. Mindez a 10. fejezetben 
említett minősítési problémára (gualification problem) mutat példát. 

Ha egy logikai ágens nem tud arra a következtetésre jutni, hogy valamely cselekvés- 
sorozat eléri a célját, akkor képtelen lesz cselekedni. A feltételes tervezés bizonyos 
mértékben úrrá lehet a bizonytalanságon, de csak akkor, ha az ágens érzékelési tevé- 
kenységei képesek megszerezni a szükséges információt, továbbá ha nincs túl sok külön- 
böző eshetőség. Egy másik lehetőség az lehetne, ha az ágenst egy egyszerű, de hibás 
elmélettel ruháznánk fel, amely biztosan lehetővé tenné valamely terv származtatását; egy 
ilyen terv az esetek többségében valóban működik is, ugyanakkor problémák lépnek fel, 
ha az események az ágens elméletének ellentmondanak. Sőt az ágens elméletének pon- 


"81 


546 13. BIZONYTALANSÁG 


tossága és használhatósága közötti egyensúly kezelése maga is megköveteli a bizony- 
talanság végiggondolását. Összegezve, egyetlen tisztán logikai ágens sem lesz képes arra 
a következtetésre jutni, hogy az Agg tervet kell követnie. 

Mindazonáltal tegyük fel, hogy az Agg ténylegesen a helyes és követendő terv. De mit 
is értünk ezen a kijelentésen? Ahogy már a 2. fejezetben kifejtettük, ez a kijelentés azt 
takarja, hogy a végrehajtható összes lehetséges terv közül az Agg az, amelyik a környe- 
zetre vonatkozó adott információ mellett várhatóan az ágens teljesítményének legna- 
gyobb mértékét biztosítja. A teljesítmény foka magában foglalja a járathoz időben való 
kiérést a repülőtérre, továbbá a repülőtéren való hosszú, értelmetlen várakozás és a 
gyorshajtás miatti megbírságolás elkerülését. Az ágens rendelkezésére álló információ 
ezen kimenetelek közül egyiket sem szavatolja az Agg esetén, de bizonyos mértékű 
hihetőségét nyújtja annak, hogy azok be fognak következni. Más tervek, mint például 
az Aj2o, megnövelné az ágens hitét abban, hogy időben kiérnek a repülőtérre, de egy- 
ben megnövelné a hosszú várakozás valószínűségét is. A helves cselekedet — az ésszerű 
döntés (rational decision) — ezért függ mind a különböző célok viszonylagos fontossá- 
gától, mind pedig a megvalósulásuk valószínűségétől és mértékétől. Az alfejezet hátra- 
levő részében ezeket a gondolatokat szeretnénk hangsúlyozni, előkészítvén az ebben és 
a következő fejezetekben bemutatott bizonytalan következtetés és az ésszerű döntés 
általános elméleteinek a kifejlesztését. 


Bizonytalan tudás kezelése 


Ebben az alfejezetben a bizonytalan tudás természetét vizsgáljuk meg közelebbről. Egy 
egyszerű diagnosztikai példán keresztül mutatjuk be az érintett fogalmakat. A diag- 
nosztika — legyen az orvosi, gépjármű-javítási vagy bármi egyéb — olyan feladat, amely 
szinte mindig tartalmaz bizonytalanságot. Hogy lássuk a logikai megközelítés sikerte- 
lenségét, próbáljuk meg egy fogorvosi diagnosztikai rendszer szabályait meghatározni 
elsőrendű logika segítségével. Tekintsük a következő szabályokat: 


Vp Tünekp, Fogfájás) — Betegség(p, Lyuk) 


A gond az, hogy ez a szabály rossz. Nincs minden fogfájós betegnek lyukas foga; né- 
hányuknak lehet ínysorvadása vagy tályoga, vagy valamilyen más problémája. 


Vp Tünekp, Fogfájás) 
Betegség(p, Lyuk) V Betegség(p, Ínysorvadás) V Betegség(p, Tályog)... 


Sajnos, ahhoz. hogy igazzá tegyük a szabályt. közel végtelen sok okot kellene hozzá- 
tennünk. Megpróbálhatjuk a szabályt ok-okozati szabállyá formálni: 


Vp Betegségí(p, Lyuk) 5 Tünetíp, Fogfájás) 


De még ez a szabály sem lesz helyes, hiszen nem minden lyukas fog okoz fájdalmat. 
Az egyetlen módja, hogy kijavítsuk a szabályt, az az, hogy logikailag teljessé tesszük: 
a bal oldalt ki kell bővíteni minden olyan lehetséges okkal, amely lyukas fogak esetén 
fogfájást okoz. De még ebben az esetben is figyelembe kell venni a diagnózis megálla- 
pításánál annak lehetőségét, hogy a betegnek egymástól teljesen függetlenül is lehet 
fogfájása és lyukas foga. 
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Próbálkozásaink az elsőrendű logika alkalmazására olyan területeken, mint az orvosi 
diagnosztika, három fő okból is kudarcot vallanak: 


s Lustaság (laziness): túl nagy munkát jelent az ok és okozatok teljes eseményhalma- 
zának felsorolása, amely elengedhetetlenül szükséges annak biztosítására, hogy egy 
szabály mindig érvényes legyen. Ezenkívül túl körülményes az eredményül kapott 
hatalmas méretű szabályok használata. 

s Az elméleti tudatlanság (theoretical ignorance): az orvosi tudományterület elmé- 
lete nem teljes. 

s A gyakorlati tudatlanság (practical ignorance): még ha ismerjük is a teljes sza- 
bályrendszert, egy bizonyos beteggel kapcsolatban akkor is lehetünk bizonytalanok, 
mert előfordulhat, hogy még nem fejeződött be, vagy egyáltalán nem végezhető el 
az összes szükséges vizsgálat. 


Arról van szó, hogy a fogfájás és a lyuk közötti kapcsolat egyik irányban sem feltétlen 
logikai következmény. Ez jellemző az orvosi területekre, valamint más szakértői terüle- 
"tekre (jog, üzlet, tervezés, autójavítás, kertészkedés, időpontok összeegyeztetése stb.). 
Az ágens tudása legjobb esetben ís csak egy bizonyos mértékű meggyőződést vagy 
hiedelmet (degree of belief) nyújthat az adott kijelentésekkel kapcsolatban. A meggyő- 
ződési értékek kezelésére az elsődleges eszközünk a valószínűség-számítás (proba- 
bility theory) lesz, amely egy 0 és 1 közötti számszerű meggyőződési mértéket rendel 
az egyes mondatokhoz. (A bizonytalan következtetésre alkalmas néhány más lehetséges 
módszerről a 14.7. alfejezetben olvashatunk.) 

A valószínűség lehetőséget nyújt a lustaságunkból vagy tudáshiányunkból fakadó bizony- 
talanság kifejezésére (összegzésére). Nem lehetünk biztosak abban, hogy mi kínoz egy 
bizonyos beteget, ugyanakkor hihetjük, hogy mondjuk 8095 az esély arra — azaz 0.8 a való- 
színűsége annak -, hogy a betegnek van lyukas foga, ha fogfájásra panaszkodik. Azaz, vára- 
kozásaink szerint az összes, az ágens tudása alapján a jelenlegi szituációtól megkülönböz- 
tethetetlen eset 8046-ában a páciensnek van lyukas foga. Ezt a valószínűséget statisztikai 
adatokból vonhatjuk le — az eddig vizsgált fogfájós betegek 8090-ának lyukas volt a foga —, 
vagy valamilyen általános szabályból, illetve tények kombinációjából származtathatjuk. 
A 8096 azokat az eseteket foglalja magában. amikor minden olyan tényező jelen van, amely 
hatására a lyuk fogfájással jár, valamint amikor a betegeknek teljesen függetlenül van fog- 
fájása és lyukas foga is. A hiányzó 2096-ban pedig a fogfájás összes többi lehetséges oka 
található, amelyek megerősítéséhez vagy tagadásához túl lusták vagy tudatlanok vagyunk. 

Egy adott kijelentéshez rendelt 0 valószínűség annak az egyértelmű meggyőződés- 
nek felel meg, hogy a mondat állítása hamis, míg az 1 valószínűség egyenértékű azzal 
a határozott meggyőződéssel, hogy a mondat állítása igaz. A 0 és 1 közötti valószí- 
nűségek a mondat igazságtartalmában való hit közbenső mértékeinek feleinek meg. 
Az állítás valójában persze vagy igaz, vagy hamis. Fontos tehát megjegyeznünk, hogy 
a meggyőződés mértéke és az igazságtartalom mértéke különböző fogalmak. A 0,8 va- 
lószínűség nem jelent , 8090-ban igaz"-at, hanem egy 8099-os mértékű meggyőződést 
— vagyis egy igen erős elvárást (reményt) az állítás igazságával szemben. Következés- 
képpen a valószínűség-számítás a logikával azonos lételméleti állásfoglalást hordoz — 
nevezetesen, hogy a világban a tények vagy érvényesek, vagy nem. Az igazság mérté- 
ke, mint a meggyőződés mértékének az ellentéte, a fuzzy logika (fuzzy logic) tárgya, 
amelyet a 14.7. alfejezetben tárgyalunk. 
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A logikában egy olyan állítás, mint , a páciensnek van lyukas foga" az interpretáció- 
jától és a világtól függően vagy igaz. vagy hamis; csak akkor igaz, ha az a tény, amely- 
re hivatkozik, megfelel a tényállásnak. A valószínűség-számításban egy olyan mondat, 
mint ,0,8 annak a valószínűsége, hogy a betegnek lyukas a foga" az ágens meggyőző- 
dését fejezi ki, és nem közvetlenül a valóságra vonatkozik. Ez a meggyőződés az ágens 
addigi észleléseitől függ. Az észlelések alkotják azt a tényt vagy tényállást (evidence), 
amelyen a valószínűségi kijelentések alapulnak. Tegyük fel például, hogy az ágens kihúz 
egy lapot egy megkevert kártyapakliból. Mielőtt ránéz a lapra, 1/52 valószínűséget kell 
rendelnie a mellé az állítás mellé, hogy a kihúzott lap a pikk ász. Megnézés után ugyan- 
ennek a valószínűsége vagy 0, vagy 1. Vagyis, egy kijelentéshez rendelt valószínűség 
inkább annak felel meg, hogy egy logikai állítás (vagy annak tagadása) következik-e 
a tudásbázisból, mint annak, hogy igaz-e vagy sem. Ahogy a tudásbázishoz hozzáadott 
állítások megváltoztatják az abból levonható következtetéseket, ugyanúgy a valószínű- 
ség is megváltozik, amikor több tény birtokába jutunk. 

Ebből következően minden valószínűségi kijelentésnek hivatkoznia kell azokra a 
tényekre, amelyek alapján az adott valószínűség az állításhoz lett rendelve. Amint egy 
ágens új észlelések birtokába jut, ezek figyelembevételével módosítja a valószínűségek 
becslését. Mielőtt tények birtokába jutunk, előzetes, illetve a priori (prior) vagy fel- 
tétel nélküli (unconditional) valószínűségről beszélünk, a tények birtokában pedig 
utólagos, illetve a posteriori (posterior) vagy feltételes (conditional) valószínűség- 
ről. Az ágens a legtöbb esetben rendelkezni fog bizonyos tényekkel az érzékelései ha- 
tására, és érdekelt lesz az általa felügyelt kimenetelek a posteriori valószínűségeinek 
kiszámításában. 


Bizonytalanság és racionális döntések 


A bizonytalanság megjelenése gyökeresen megváltoztatja azt a módot. ahogy az ágens a 
döntéseit meghozza. Egy logikai ágensnek általában van valamilyen célja, és bármely ter- 
vet végrehajt, amely biztosítja a cél elérését. Azon az alapon választ ki vagy utasít vissza 
egy cselekvést, hogy az eléri a célt vagy sem, függetlenül attól, hogy más cselekvések 
mire vezetnek. Más lesz a helyzet azonban, amint a bizonytalanság belép a képbe. Gon- 
doljuk végig újra az Agg tervet a repülőtérre . jutás szempontjából. Tegyük fel, hogy ez 
9599-os valószínűséggel biztosítja a sikert. Ésszerű döntést jelent ez? Nem feltétlenül: 
lehetnek más tervek, például az Aj2o, amelynek nagyobb esélye van a sikerre. Ha életbe- 
vágó az, hogy ne késsük le a járatot, akkor célszerűbb megkockáztatni egy hosszabb vára- 
kozást a repülőtéren. Mi a helyzet például az A 1440 tervvel, amely a felszállás előtt 24 órá- 
val való indulást javasolja. A legtöbb esetben ez nem jó választás, mert bár majdnem 
biztosra vehetjük az időben való érkezést, sajnos a tűrhetetlenül hosszú várakozást is. 
Ilyen típusú döntések meghozatala előtt az ágensnek fel kell állítania egy preferencia- 
sorrendet (preferences) a különböző tervek lehetséges kimenetelei (outcome) között. 





! Ez teljesen eltér attól. hogy a világ megváltozása következtében egy állítás igazzá vagy hamissá válik. Ha 
valószínűségeket akarunk használni egy változó világ kezelésére, akkor ugyanolyan mechanizmusokra — ál- 
lapot, távolság és események — lesz szükségünk, mint amelyet a 10. fejezetben használtunk a logikai reprezen- 
tációban. Ezeket a mechanizmusokat a 15. fejezetben tárgyaljuk. 
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Egy adott kimenetel teljesen határozott állapotot jelent, magában foglalva, hogy az ágens 
időben érkezik a repülőtérre vagy sem, és hogy milyen hosszú lesz a repülőtéri várako- 
Zás. A preferenciák figyelembevételével történő leírásra és következtetésre a hasznos- 
ságelméletet (utility theory) fogjuk használni. (A hasznosság — utility — fogalmán a 
továbbiakban az értendő, hogy , milyen a haszon minősége". és nem valamifajta köz- 
hasznúság, mint az elektromos művek vagy vízművek esetében.) A hasznosságelmélet 
szerint minden állapotnak van egy hasznavehetőségi mértéke vagy haszna az ágens szá- 
mára, és az a számára több hasznot hozó állapotokat fogja előnyben részesíteni. 

Egy állapot hasznossága viszonylagos az ágens számára, akinek preferencia-sorrend- 
jét a hasznosságfüggvény hivatott képviselni. A 6. fejezet játszmáiban szereplő jutal- 
mak például hasznosságfüggvények. Sakkozás közben annak az állapotnak a hasznos- 
sága, amelyben Fehér játszmát nyer, nyilvánvalóan igen magas a fehér bábukkal játszó 
ágens számára, ugyanakkor igen alacsony a feketével játszó számára. Vagy bizonyos já- 
tékosok (beleértve a szerzőket is) igen elégedettek lehetnek egy világbajnok elleni dön- 
tetlennel, ugyanakkor más játékosok (beleértve a korábbi világbajnokot) nem. Az ízlést 
vagy a személyes választási nem lehet megindokolni: azt gondolhatjuk, hogy egy 
ágens, aki a műfagyit előnyben részesíti a csokireszelékkel szemben különös, sőt félre 
van vezetve, de azt nem mondhatjuk, hogy irracionális. A hasznosságelmélet még az 
önzetlenséget is megengedi, egyszerűen azáltal, hogy az ágens a saját hasznosságát nö- 
velő tényezők közé beleveszi mások jólétét. 

A preferenciák sorrendje, amit a hasznossággal fejezhetünk ki, az ésszerű döntések 
általános elméletében valószínűségekkel van kombinálva. Ezt hívjuk döntéselméletnek 
(decision theory): 


döntéselmélet — valószínűség-elmélet -- hasznosságelmélet 


A döntéselmélet alapgondolata szerint egy ágens akkor és csak akkor racionális, ha 
olyan cselekvést választ, amely az adott cselekvés összes lehetséges kimenetelére átla- 
golt legmagasabb várható hasznot hozza. Ezt hívják a Maximális Várható Haszon 
(MVH, Maximum Expected Utility, MEU) elvének. Az elv működését a 6. fejezetben 
láthattuk, amikor az ostáblajáték optimális lépését vizsgáltuk röviden. A későbbiekben 
látni fogjuk, hogy ez az elv teljesen általános érvényű. 


Egy döntéselméleti ágens tervezése 


A 13.1. ábra egy, a cselekvései kiválasztásához döntéselméleti módszereket alkalmazó 
ágens felépítését mutatja. Egy absztrakt szinten az ágens megegyezik a 7. fejezetben 
leírt logikai ágens felépítésével. Az elsődleges különbség közöttük az, hogy a döntésel- 
méleti ágens pillanatnyi állapotra vonatkozó tudása bizonytalan; az ágens meggyőződési 
vagy hiedelemállapota (belief state) a világ összes lehetséges aktuális állapotainak a 
valószínűségeit megjeleníti. Az idő előrehaladtával az ágens egyre több tényt gyűjt 





ágens valószínűségi becsléseket tud adni az egyes cselekedetek kimeneteleire vonatko- 
zóan, következésképpen ki tudja választani a legnagyobb várható hasznossággal bíró 
lépést. Ez és a következő fejezet a valószínűségi információ általános megjelenítésére 
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function DE-ÁGEns(észfelés) returns egy cselekvés 
static: meggyőződési állapot. a világ állapotára vonatkozó valószínűségi meggyőződések halmaza 
cselekvés, az ágens cselekvése 


a meggyőződési állapot aktualizálása cselekvés és érzékelés alapján 
cselekvések kimenetelcihez tartozó valószínűségek kiszámítása, 

adott műveletek leírása és pillanatnyi meggyőződési állapot 
a legmagasabb várható haszonnal járó cselekvés kiválasztása 

adott kimenetelekhez tartozó valószínűségek és a hasznosságra vonatkozó információ 
return cselekvés 











13.1. ábra. Döntéselméleti ágens, amely racionális cselekvéseket választ ki. A lépéseket a következő öt 
fejezetben részletezzük. 


reprezentálásának és aktualizálásának, valamint a környezet becslésének speciális mód- 
szereivel foglalkozik. A 16. fejezet a hasznosságelméletet taglalja mélységeiben, míg 
a 17. fejezetben a komplex döntések módszereit építjük fel. 
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Miután felállítottuk a racionális ágens általános keretét, szükségünk lesz egy formális 
nyelvre a bizonytalan tudás leírásához és a következtetéshez. Minden olyan jelölésnek, 
amely a meggyőződésünk fokának leírására szolgál, képesnek kel! lennie két fő dolog 
kezelésére: az egyik a kijelentések jellege, amelyekhez meggyőződési mértéket aka- 
runk rendelni, a másik pedig a meggyőződés mértékének az ágens tapasztalatától való 
függése. A valószínűség-elmélet itt bemutatott változata az ítéletlogika egy kiterjesztését 
használja állításaihoz. A tapasztalattól való függés az a priori valószínűségi kijelentések 
és a feltételes valószínűségi állítások szintaktikai megkülönböztetésében tükröződik. 
Az a priori valószínűségi kijelentéseket akkor alkalmazzuk, mielőtt még tények birtokába 
jutnánk, míg a feltételes valószínűségi kijelentések explicit módon tartalmazzák a meg- 
szerzett tényeket. 


Állítások 


A hiedelmi mértékeket mindig állításokhoz (propositions) rendeljük — amelyek ez és 
ez a helyzet típusú kijelentések. Az állítások leírására eddig két formális nyelvet — az 
ítéletlogikát és az elsőrendű logikát — használtuk. Ez az alfejezet egy olyan nyelvet ír 
le, amelyet a valószínűség-elmélet jellegzetesen használ, és amely valamelyest kifeje- 
zőbb az ítéletlogikánál. (A 14.6. alfejezet azokat a módszereket taglalja, amelyek meg- 
adják, hogy milyen hiedelmi mértékek tulajdoníthatók az elsőrendű logika egyes kije- 
lentéseinek.) 

A nyelv alapeleme a valószínűségi vagy véletlen változó (random variable), ami 
úgy tekinthető, mint ami egy kezdetben ismeretlen , állapotú" világ egy , részére" 
vonatkozik. Például a Lyuk a bal alsó bölcsességfogam esetleges lyukasságát mutat- 
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ja. A véletlen változók a kényszerkielégítési problémáknál megismert CSP-változók- 
hoz és az ítéletlogikánál használt ítéletszimbólumhoz hasonló szerepet játszanak. 
A véletlen változókat mindig nagybetűvel kezdjük. (Ugyanakkor az ismeretlen vélet- 
len változókat változatlanul kis- és egybetűs nevekkel fogjuk jelölni, például: P(a) — 
1—- P(-a).) 

Minden valószínűségi változóhoz tartozik egy értéktartomány (domain), amely- 
ből az értékeit veheti. Például a Lyuk tartománya az (igaz, hamis) lehetne.? (Az érté- 
keket kisbetűs nevekkel fogjuk jelölni.) Az állítások legegyszerűbb fajtája azt jelenti 
ki, hogy a valószínűségi változó valamilyen konkrét értéket vesz fel a tartományon 
belül. Például a Lyuk — igaz azt reprezentálja, hogy nekem valóban lyukas a bal alsó 
bölcsességfogam. 

A véletlen változók — a CSP-változókhoz hasonlóan — tipikusan három csoportba 
sorolhatók a tartomány fajtájától függően: 


s (Boole-típusú) logikai véletlen változók (Boolean random variables), mint a Lyuk, 
amelyeknek az (igaz, hamis) a tartománya. Az olyan állításokat, mint a Lyuk — igaz 
gyakran rövidítve, csak a kis kezdőbetűs nevével — fyuk — fogjuk jelölni. míg a Lyuk 
— hamis állítás rövidített jelölése: —4yuk. 

" Diszkrét véletlen változók (discrete random variables), amelyek speciális esetben 
logikai változók is lehetnek, egy megszámlálható tartományból vesznek fel értéket. 
Például az Időjárás tartománya a (napos, esős, felhős, havazik) lehet. A tartomány 
értékeinek egymást kizáróknak és összességében kimerítőknek (teljeseknek) kell 
lenniük. Ha ez nem okozhat félreértést, akkor a havazik rövidítés fogja jelölni pél- 
dául az Időjárás — havazik állítást. 

s Folytonos véletlen változók (continuous random variables), amelyek valós érté- 
ket vehetnek fel. A tartomány lehet akár a teljes valós tengely, akár annak egy rész- 
halmaza, mint a [0, 1] intervallum. Például az az állítás, hogy X — 4,02 azt jelenti 
ki, hogy az X véletlen változó értéke pontosan 4,02. A véletlen változókra vonatko- 
zó állítások egyenlőtlenségek is lehetnek, mint például X £ 4,02. 


Néhány kivételtől eltekintve, mi a diszkrét esetre fogunk koncentrálni. 

Az összetett állítások létrehozásához az olyan elemi állítások, mint a Lyuk — igaz vagy 
a Fogfájás — hamis, bármely szokásos logikai kapcsolat felhasználásával kombinálhatók. 
Például a Lyuk — igaz A Fogfájás — hamis egy olyan állítás, amelyhez valamilyen hi- 
hetőségi (hihetetlenségi) mértéket rendelhetünk. Ahogy az előző bekezdésben leírtuk, a 
fenti állítást úgy is jelölhetjük, hogy fogszuvasodás A -fogfájás. 


Elemi események 


Az elemi esemény (atomic event) jelölés hasznos a valószínűség-elmélet alapjainak 
megértésében. Egy elemi esemény a világ — amely tekintetében az ágens bizonytalan — 
állapotának egy teljes leírását jelenti. Úgy is tekinthetjük, mint a világot alkotó összes 
változóhoz való konkrét érték hozzárendelését. Például, ha a világomat csak a Lyuk és a 


? Egyesek elvárása szerint a tartományt halmazként kellene megadni: (igaz, hamis). Mi állítások n-eseként 
írjuk le, mivel a későbbiekben ez megkönnyíti egy rendezés hozzárendelését. 
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Fogfájás logikai változók alkotják, akkor pontosan négy különböző elemi esemény léte- 
zik; amelyek közül a Lyuk — hamis A Fogfájás — igaz egy esemény. 


Az elemi eseményeknek van néhány fontos tulajdonsága: 


s Az elemi események egymást kölcsönösen kizáró események — legfeljebb egyikük 
lehet igaz. Például. nem lehet egyszerre igaz a Iyuk A fogfájás. valamint a fyuk 
A -fogfájás. 

s. Az összes elemi esemény halmaza kimerítő — legalább az egyiknek igaznak kell lennie. 
Azaz az összes elemi esemény egyesítése logikailag egyenértékű az igaz állítással. 

s . Minden egyes elemi esemény maga után vonja következményként az összes állítás 
igazságát vagy hamisságát függetlenül attól, hogy azok egyszerűek vagy összetettek. 
Ez a logikai kapcsolatok szokásos szemantikájának alkalmazása révén mutatható 
meg (lásd 7. fejezet). Például a fyuk A -fogfájás elemi esemény következménye a 
fogszuvasodás igaz volta és a lyuk — fogfájás hamissága. 

" Bármely állítás logikailag egyenértékű azon elemi események diszjunkciójával, ame- 
lyekből az állítás következik. Például a /yuk állítás ekvivalens a fyuk A fogfájás és 
a lyuk A fogfájás elemi események egyesítésével. 


A 13.4. feladat a fenti tulajdonságok bizonyítását célozza. 


A priori valószínűség 


Az a állításhoz tartozó feltétel nélküli (unconditional) vagy a priori valószínűség 
(prior probability) azt a meggyőződési mértéket jelenti, amely bármely más informá- 
ció hiányában az állításhoz kapcsolható; jelölése P(a). Például ha 0,1 annak az a priori 
valószínűsége, hogy van lyukas fogam, akkor 


P(Lyuk — igaz) — 0,1 vagy P(lyuk) — 0,1-et írhatunk. 


Fontos megjegyeznünk, hogy P(a) csak akkor használható, ha nincs semmilyen más 
információ a birtokunkban. Amint ismertté válik valamilyen új információ, a továb- 
biakban már a adott új információ melletti feltételes valószínűségével kell következtet- 
nünk. A feltételes valószínűségekkel a következő alfejezet foglalkozik. 

Bizonyos esetekben előfordulhat, hogy beszélni szeretnénk egy véletlen változó 
összes lehetséges értékének valószínűségéről. Ilyen esetekben a P(/dőjárás) kifejezés 
kekből képzett vektort jelöli. Következésképpen, ahelyett hogy az alábbi négy egyen- 
letet írnánk le 





ís — napos) — 0,7 
írás — esős) — 02 
Piidőjárás — felhő: 0.08 








3 A valószínűség-elmélet számos formája az elemi eseményt, más néven mintát (sample point) egy primi- 
tívnek tekinti. A véletlen változót pedig, mint egy függvényt definiálja. amelynek bemenete egy elemi esemény, 
kimenetként pedig a megfelelő tartomány egy értékét adja. Ez a megközelítés talán általánosabb, de ugyanakkor 
kevésbé intuitív. 
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P(időjárás — havazik) — 0.02 
elegendő egyszerűen azt írnunk, hogy 
Pddőjárás) — (0,7, 0,2, 0,08, 0,02) 


Az ilyen kijelentés az [dőjárás véletlen változó előzetes valószínűség-eloszlását (pro- 
bability distribution) definiálja. 

Olyan kifejezéseket is használni fogunk, mint a P(időjárás, Lyuk), hogy egy véletlen 
változóhalmaz összes lehetséges kombinációjának valószínűségeit jelölni tudjuk.! Ek- 
kor a P(/dőjárás, Lyuk) egy 4 x 2-es valószínűségi táblázatot jelent. Ez az Időjárás és 
Lyuk együttes valószínűség-eloszlása (joint probability distribution). 

Hasznos lehet az is, ha világot leíró véletlen változók teljes halmazáról gondolko- 
zunk. Az olyan együttes valószínűség-eloszlást, amely lefedi a teljes halmazt teljes 
együttes valószínűség-eloszlásnak (full joint probability distribution) nevezzük. 
Például, ha a világ csak a Lyuk, a Fogfájás és az Időjárás változókból áll, akkor a tel- 
jes együttes valószínűség-eloszlást a 


P(Lyuk, Fogfájás, Időjárás) 


adja meg. Ez az együttes valószínűség-eloszlás egy 16 elemű, 2 x 2 x 4-es táblázattal 
reprezentálható. A teljes együttes valószínűség-eloszlás minden egyes elemi esemény 
valószínűségét, és így a kérdéses világgal kapcsolatos összes bizonytalanságot megha- 
tározza, A 13.4. alfejezetben látni fogjuk, hogy a teljes együttes valószínűség-eloszlás 
alapján bármely valószínűségi kérdés megválaszolható. 

Folytonos változók esetén az eloszlás nem foglalható össze táblázatos formában, mi- 
vel a lehetséges értékek száma végtelen. Ehelyett annak valószínűsége, hogy egy való- 
színűségi változó egy adott x értéket vesz fel, általában x egy paraméterezett függvé- 
nyeként definiálható. Például az X véletlen változó jelölje a holnapi hőmérséklet maxi- 
mumát Berkeleyben. Ezzel a 


P(X — x) — UI18, 261) 


kijelentés azt a hiedelmet fejezi ki, hogy X egyenletes eloszlást mutat 18 és 26 "C kö- 
zött. (Néhány hasznos folytonos valószínűségi változó definícióját az A) függelékben 
találjuk meg.) A folytonos valószínűségi változókra vonatkozó valószínűségi eloszlást 
valószínűség-sűrűségfüggvénynek (probability density function) nevezzük. A sűrű- 
ségfüggvények jelentése különbözik a diszkrét eloszlásokétól. Például a korábbiakban 
megadott hőmérsékleteloszlásból kiindulva P(X — 20,5) — U[18, 26(20,5) — 0,125/7C 
adódik. Ez nem azt jelenti, hogy annak az esélye, hogy a holnapi maximális hőmérsék- 
let pontosan 20.5 "€ lesz 12.590; ennek a valószínűsége természetesen 0. Technikailag 
ez azt jelenti. hogy annak a valószínűsége, hogy a kérdéses hőmérséklet a 20,5 "C egy 
kicsiny környezetébe fog esni, határértékét tekintve egyenlő azzal, hogy a 0,125-öt 
elosztjuk a szakasz "C-ban megadott szélességével: 


$ P(20,5 £ dx £ X £ 20.5 t- dx) /dx — 0.125/7C 
h— 








$ Az általános jelölési szabály szent az eloszlás a nagybetűs változók összes értékét tartalmazza. Azaz. a 
Pidőjárás, lyuk) a valószínűségek egy olyan négyelemű vektorát jelenti, amelyben minden egyes időjárás-állapot 
valószínűsége szerepel Lyuk — igaz mellen. 
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Néhány szerző a diszkrét eloszlások és a sűrűségfüggvények jelölésére más szimbólu- 
mot használ; mi P-vel fogjuk jelölni mindkettőt, mivel ritkán lehet ezeket összekever- 
ni, és az egyenletek általában azonos formájúak. Jegyezzük meg ugyanakkor, hogy míg 
a valószínűségek mértékegység nélküli számok, a sűrűségfüggvényeknek van mérték- 
egysége, a fenti példában 1/7€. 


Feltételes valószínűség 


Amint az ágens bizonyos tények birtokába jut a korábban ismeretlen, a tartományra 
jellemző véletlen változóra vonatkozóan, az a priori valószínűségek többé nem hasz- 
nálhatók. Ehelyett a feltételes (conditional) vagy a posteriori (posterior) valószínű- 
ségeket használhatjuk. Jelölése P(a]b), ahol a és b tetszőleges állítás lehet.5 Értelme- 
zése: a valószínűsége, ha b-t és csak b-t tudjuk. Például, 


P(LyuklFogfájás) — 0,8 
azt jelenti, hogy ha egy betegnél megfigyeltük, hogy fogfájása van, és semmilyen más 
információnk nincs vele kapcsolatban, akkor annak a valószínűsége, hogy szuvas a foga 
0.8. Egy P(lyuk) típusú a priori valószínűség tekinthető a P(lyuki) feltételes valószínűség 
speciális esetének, ahol a feltételt a , semmi bizonyíték" jelenti. 

A feltételes valószínűségek megadhatók feltétel nélküliek segítségével. A definíció 
P(a A b) 

Pb) 
minden P(b) 5 0 esetén igaz. Az egyenletet írhatjuk 

P(aA b) — P(alb)P(b) 
alakban is, amelyet szorzatszabálynak (product rule) hívunk. A szorzatszabályt talán 
könnyebb megjegyezni: ez abból következik, hogy a és b együttes teljesüléséhez, szük- 
séges, hogy b igaz legyen, valamint hogy a is igaz legyen b feltétele mellett. A szabályt 
megadhatjuk fordítva is: 

P(aA b)— P(bla)P(a) 
Bizonyos esetekben könnyebb a konjunkciók feltéte! nélküli (a priori) valószínűségeit 
használni, azonban mi az esetek többségében feltételes valószínűségeket fogunk alkal- 





P(alb) — (13.D 


A P jelölést használhatjuk feltételes eloszlásokra is. P(XIY) a P(X — xlY — y;) értékeit 
adja meg minden lehetséges i-re, j-re. Annak példájaként, hogy ez mennyivel tömörebbé te- 
szi a jelölést, képzeljük el a szorzatszabály alkalmazását minden olyan esetre, ahol az a és 
b állítások X és Y bizonyos értékeit veszik fel. A következő egyenleteket fogjuk kapni: 


PX-xAY-y)-PRX-xlY-y)-PRY—y) 
PX-x NY) PX— ily) — Ph y 





5 A ,]7 operátor a lehető legkevesebb előzményt jelenti, azaz a Pa A ble V d) Pl(a A b)l(c v 4)-vel egyen- 
értékű. 
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Mindezt összefoglalhatjuk egyetlen egyenletben is: 
PGX,YY—PR(XINP(Y) 


Ne felejtsük, hogy ez egy olyan egyenlethalmaz jelölésére szolgál, amely kapcsolatba 
hozza a táblázatok megfelelő elemeit. és sem a táblázatok mátrix szorzásáról van szó. 
Csábító, de helytelen a feltételes valószínűségeket bizonytalansággal kiegészített logi- 
kai implikációkként tekinteni, Például a P(alb) — 0,8 állítást nem lehet úgy értelmezni, 
hogy amikor csak igaz b, P(a) 0,8-del egyenlő. Ez két okból is téves: először is P(a) 
mindig a előzetes valószínűségét, és nem a valamilyen tény megléte esetén alkalmazan- 
dó utólagos valószínűségét jelöli; másrészről pedig a P(alb) — 0.8 csak akkor alkalmaz- 
ható, ha b az egyetlen tény, amelynek birtokában vagyunk. Ha ismerünk egy további c 
információt is, akkor a hihetőségi mértékét P(alb A c) fogja adni, amely akár független 
is lehet P(alb)-tól. Például c megadhatja közvetlenül azt is, hogy a igaz vagy hamis. Ha 
megvizsgálunk egy beteget, aki fogfájásra panaszkodik, és találunk egy lyukas fogat, 
akkor a további, /yuk információnak jutottunk birtokába, és így természetesen, arra a 
következtetésre fogunk jutni, hogy P(lyukl fogfájás A tyuk) — 1.0. 
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Az eddigiekben az állításokra, az a priori, valamint a feltételes valószínűségi kijelenté- 
sekre vonatkozó szintaxist definiáltunk. A továbbiakban meg kell fogalmaznunk a való- 
színűségi kijelentések valamilyen szemantikáját is. Ezt azokkal az alapvető axiómákkal 
kezdjük, amelyek a valószínűségi skálát és annak végpontjait határozzák meg: 


1. Minden valószínűség 0 és 1 közé esik. Bármely a kijelentésre 
OS P(a) 1 


2. A biztosan igaz (azaz érvényes) állítások valószínűsége I, a biztosan hamis (azaz ki- 
elégíthetetlen) állításoké pedig 0. 


P(igaz)— 1 P(hamis) — 0 


Ezután egy olyan axiómára van szükségünk, amely a logikailag összefüggő állításo- 
kat kapcsolja össze. A legegyszerűbb, ha a diszjunkcióra vonatkozó valószínűséget 
az alábbiak szerint definiáljuk: 

3. A diszjunkció valószínűsége 


P(av b) — P(a) 4 P(b)—P(a nb) 


Ez utóbbi szabályt könnyű megjegyezni arról, hogy azok az esetek, ahol a igaz és azok 
az esetek, ahol b igaz, együtt természetesen lefedik azokat az eseteket, ahol a V b igaz; 
ugyanakkor a két halmazba eső eseteket összeadva kétszer számoljuk azokat. amelyek 
a halmazok közös részébe esnek, így ki kell vonnunk P(a A b)-t. 

Ezt a három axiómát gyakran nevezik Kolmogorov-axiómáknak (Kolmogorovs axi- 
-oms) az orosz matematikus Andrei Kolmogurov emlékére, akinek a nevéhez fűződik az ezen 
alapaxiómákból kiinduló valószínűség-elméket felépítése. Vegyük észre, hogy az axiómák 
csak az a priori valószínűségekkel, és nem a feltételes valószínűségekkel foglalkoznak; 
ennek oka, hogy az utóbbiakat már a korábbiakban definiáltuk a (13.1) egyenlet szerint. 
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Honnan származnak a valószínűségek? 


Vég nélküli viták folytak a valószínűségi számok forrása és értelme körül. A frekvencionista 
(freguentist) álláspont szerint ezek az értékek csak kísértetekből származhatnak: ha 109 ember 
vizsgálata során az derül ki, hogy 10-nek szuvas a foga, akkor azt mondhatjuk, hogy a szuvas fog 
valószínűsége körülbelül 0,1. E szemlélet szerint az az állítás. miszerint , a lyuk valószínűsége 0,17 
azt jelenti, hogy ha végtelen sok mintát megvizsgálnánk, határértékét tekintve 0,! lenne annak a rész- 
nek a hányada, ahol ezt tapasztalnánk. Tetszőleges, de véges számú minta esetén pedig megbecsül- 
hetjük a valós arányt, valamint kiszámíthatjuk azt is, hogy várhatóan mekkora lesz a becslésünk 
pontossága. 

Az objektivista tobjectívist) megközelítés szerint a valószínűségek inkább az univerzum valósá- 
gos jellemzőinek tekinthetők — ahol egy jellemző a dolgok hajlama bizonyos típusú viselkedésre —, 
mint egy megfigyelő meggyőződési foka leírásának. Például az, hogy egy nem hamis pénzdarab fel- 
dobásánál 0,5-es valószínűséggel fej jön ki, magának a pénzdarabnak a hajtandósága. E szemlélet 
szerint a frekvencionista mérések ezen hajlandóságok megfigyelésére tett kísérletek. A legtöbb fizi- 
kus egyetért abban, hogy a kvantumjelenségek valójában valószínűségiek, de makroszkopikus szin- 
ten — például a pénzfeldobásnál - a bizonytalanság a kezdeti feltételek elhanyagolása miatt lép fel, 
ami látszólag nem konzisztens a hajlandóságalapú szemlélettel. 

A szubjektivista (subjectivist) szemlélet szerint a valószínűségek inkább az ágens meggyőző- 
désének jellemzésére szolgálnak, és nincs külső fizikai jelentőségük. E szerint az orvos vagy az 
elemző aszerint találhatja ki a számokat, hogy mondhassa véleményem szerint a lyuk valószínűsége 
01 körül várható. Kifejlesztettek olyan további, még megbízhatóbb módszereket is - mint például az 
557-558. oldalon részletezett fogadási rendszereket —, amelyekkel az emberek valószínűség-hozzá- 
rendelését szerették volna kiismerni. A vonatkoztatási osztály (reference class) probléma jól 
illusztrálja a szubjektivitás jelenlétét. Képzeljünk el egy frekvencionista orvost, aki meg akarja álla- 
ítani annak az esélyeit, hogy egy páciens egy bizonyos betegségben szenved. Ehhez az orvos más, 
de fontos szempontokból (kor, tünet, esetleg nem tekintetében) azonos betegeket akar figyelembe 
venni, majd megnézni közöttük az ilyen betegségben szenvedők arányát, Azonban, ha az orvos min- 
dent figyelembe vesz, amit ismer a beteggel kapcsolatban — a grammra pontos testsúlyát, a haja 
színét, az anyja leánykori nevét stb. — arra az eredményre fog jutni. hogy nincs még egy olyan em- 
ber, aki pontosan megegyezne a beteggel, és így nincs olyan vonatkoztatási osztály sem, amelyről 
kísérleti eredményeket lehetne gyűjteni. Mindez nyugtalanító kérdése a tudományfilozófiának. 

Laplace közömbösségi elve (principle of indifference) (Laplace, 1816) szerint a tény tekinteté- 
ben szintaktikailag , szimmetrikus" állításokhoz azonos valószínűséget kell rendelni. Erre vonatko- 
zóan történtek különböző finomítási javaslatok, amelyek Carnap és más filozófusok azon törekvé- 
seiben csúcsosodtak ki, hogy egy olyan precíz induktív logikát (inductive logic) fejlesszenek ki, 
amely képes bármely állítás helyes valószínűségét tetszőleges megfigyelések alapján meghatározni. 
Jelenlegi felfogásunk szerint nem létezik különálló induktív logika; inkább úgy gondoljuk, hogy 
minden ilyen logika egy szubjektív a priori valószínűségi eloszláson alapszik, amelynek hatása 
a megfigyelések számának növekedésével csökken. 














A valószínűségi axiómák használata 


A valószínűségi axiómákból nagyon sok hasznos tény vezethető le. Például a tagadásra vo- 
natkozó jól ismert szabály következik, ha —a-val helyettesítjük b-t a harmadik axiómában; 


P(av a) — P(a)-P(-a)—P(aA—a) (a 3. axiómából, b — —a helyettesítéssel) 
P(igaz) — P(a) 4 P(-a) - P(hamis) — (logikai ekvivalencia alapján) 
17 P(a)P(-a) (a 2. axiómából) 
P(-a)—1—P(a) (algebrai műveletekkel) 
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A következtetés harmadik sora önmagában is hasznos tény és kiterjeszthető a Boole- 
típusú logikai esetből az általános diszkrét esetre. Legyen (dj, .... d,.) a D diszkrét vál- 
tozó értelmezési tartománya. Könnyű megmutatni (13.2. feladat), hogy 


n 
JP(D-dp)-1 
ízt 
Azaz, egyetlen változó tetszőleges valószínűségi eloszlása összegzésének 1-et kell 
adnia. Igaz az is, hogy változók tetszőleges halmazának bármely együttes valószínű- 
ségi eloszlását összegezve, eredményül szintén 1-et kapunk: ennek belátására elegendő 
egyetlen többdimenziós, az eredeti változók értelmezési tartományai Descartes-szorza- 
taként létrehozott tartomány felett értelmezett változót létrehoznunk. 

Emlékezzünk, hogy bármely a állítás egyenértékű minden olyan elemi esemény 
diszjunkciójával, ahol a igaz; nevezzük az események ezen halmazát e(a)-nak. Emlé- 
kezzünk arra is, hogy az elemi események egymást kölcsönösen kizárják, így a 2. axióma 
szerint az ilyen események konjunkciója nulla. Következésképpen a 3. axiómából a kö- 
vetkező egyszerű összefüggésre juthatunk: Egy állítás valószínűsége megegyezik azon 
elemi események valószínűségeinek összegével, ahol az állítás igaz, azaz 


P(a) — pa P(e;) (13.2) 
e€€ela) 
Ez az egyenlet egyszerű módszert kínál bármilyen állítás valószínűségének meghatáro- 
zására, ha adott az összes elemi esemény valószínűségét meghatározó teljes együttes 
valószínűség-eloszlás (lásd 13.4. alfejezet). A következő alfejezetekben a valószínűségek 
kezelésének további szabályait fogjuk származtatni. Mindenekelőtt azonban az axiómák 
megalapozottságát vizsgáljuk meg. 


Ami a valószínűségi axiómákat indokolja 


A valószínűségi axiómák tekinthetők az ágens által elhihető valószínűségi hiedelmek 
korlátainak. Ez valamennyire hasonlít a logikai esethez, amikor például egy logikai 
ágens nem hihet egyszerre A-ban, B-ben és -(A A 8)-ben. De van itt egy további 
bonyodalom is. A logikai esetben az együttes bekövetkezés definíciójának jelentése 
szerint a fenti állítások közül legalább egynek hamisnak kell lennie a valóságban, 
vagyis egy ágens számára ésszerűtlen mindháromban hinni. A valószínűségeket tekint- 
ve azonban a kijelentések nem közvetlenül a valóságra vonatkoznak, hanem az ágens 
saját ismereteire. Akkor miért nem hihet egy ágens a meggyőződések következő — a har- 
madik axiómát egyértelműen megsértő valószínűség-hozzárendelések - halmazában? 


P(a)— 04 P(raAb)-—00 

P(b)— 03 P(la Ab) — 08 (13.3) 
Az effajta kérdés évtizedekig vita tárgya volt azok között, akik a valószínűségek hasz- 
nálatát tartották egyedül jogosnak a meggyőződési mértékek kifejezésére. és azok kö- 
zött, akik más megközelítési módokat javasoltak. Itt most egy olyan érvelést mutatunk 


6 Folytonos változóknál az összegzést integrállal kell helyettesíteni: fZFe-ndrmi 


558 13. BIZONYTALANSÁG 
be a valószínűségi axiómákkal kapcsolatban, amelyet először Bruno de Finetti fejtett ki 
1931-ben. 

De Finetti érvelésének kulcsa a meggyőződési fok és a cselekvések közötti összefüg- 
gés. A gondolat lényege, hogy ha egy ágensnek van valamilyen szintű meggyőződése 
egy a állítással kapcsolatban, akkor képesnek kell lennie olyan téteket megadni, ame- 
lyek mellett mindegy, hogy az a állításra, vagy ellene fogad. Képzeljük el úgy, mint egy 
játszmát két ágens között: az 1. ágens szerint az én hiedelmem az a eseményben 0.4. 
A 2. ágens ezután szabadon dönthet, hogy a mellett vagy ellen fogad akkora téttel, 
amely a nyilatkozott hiedelemfokkal konzisztens. Vagyis a 2. ágens választhatja azt, 
hogy arra fogad, hogy a esemény bekövetkezik, 4 dollárt téve az 1. ágens 6 dollárjával 
szemben, vagy tehet 6 dollárt az 1. ágens 4 dollárja ellenében arra fogadva, hogy a nem 
fog bekövetkezni." Ha egy ágens meggyőződésében nem tükröződik pontosan a világ 
ismerete, akkor számíthatunk arra, hogy hosszú távon veszíteni fog a szemben álló 
ágenssel szemben, akinek a hiedelmei pontosabb képet mutatnak a világ állapotáról. 

De Finetti ennél sokkal erősebb állítást is bizonyított: ha az 1. ágens olyan meggyő- 
ződési mértékekben hisz, amelyek megsértik a valószínűség-számítás axiómáit, akkor 
létezik olyan stratégia a 2. ágens számára, amely biztosítja, hogy az I. ágens minden 
alkalommal veszíteni fog. Tehát ha elfogadjuk. hogy egy ágensnek a valószínűségeknek 
megfelelően kell feltennie a pénzét, akkor azt is el kell fogadnunk, hogy ésszerűtlen 
olyan meggyőződéseket vallani, amelyek megsértik a valószínűségi axiómákat. 

Azt gondolhatjuk, hogy ez a fogadósdi nagyon körmönfont. Mi van például, ha valaki 
megtagadja, hogy fogadjon? Elrontja-e ez az egész érvelést? Minderre az a válasz, hogy 
a fogadásos játék elvont modellje annak a döntési helyzetnek, amelyben minden ágens 
minden pillanatban elkerülhetetlenül részt vesz. Minden cselekvés (beleértve a tétlensé- 
get is) egyfajta fogadás, és a következmény tekinthető a fogadás nyereményének. Épp 
úgy nem utasíthatjuk vissza a fogadást, mint ahogy nem állíthatjuk meg az idő múlását. 

Nem mutatjuk be de Finetti elméletének bizonyítását, de mutatunk rá egy példát. Te- 
gyük fel, hogy az I. ágens meggyőződése megfelel a (13.3) egyenlernek. A 13.2. ábra 
azt mutatja, hogy ha a 2. ágens azt választja, hogy 4 dollárt tesz a-ra, 3 dollárt b-re és 
2 dollárt -(a V b)-re, akkor az 1. ágens mindig veszíteni fog, függetlenül attól, hogy a 
vagy b fog bekövetkezni. 














1. ágens 2. ágens Kimenetel az 1. ágens számára 
Állítás Meggyőződés ] Fogadás Tét ahb — ah-b -aAb 2aA-b 
a 04 a — 4A-6között[ -6 -6 4 4 
b 03 bo 3-Tközöt[ -7 3 -7 3 
avb 0.8 o(avb) 2-8között[ 2 2 2 -8 
-1I -1 -1 -I 

















13.2. ábra. Mivel az I. ágens meggyőződése nem következetes, ezért a 2. ágens tud úgy téteket tenni, 
amely a és b kimenetelétől függetlenül biztosítja, hogy az 1. ágens veszítsen 


7 Érvethetünk azzal, hogy az ágens döntését a bankviszonyok fogják meghatározni. azaz 1 dollár elvesztése 
nincs kiegyensúlyozva 1 dollár azonos valószínűség mellett való megnyerésével. Kellően kicsire választva 
azonban a tétet, ez a probléma elkerülhető. Savage (Savage, 1954) analízise az egész problémát elkerüli. 
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Más, erősen filozofikus érveléseket is előterjesztettek a valószínűségek használata 
mellett, amelyek közül a legnevezetesebb Cox és Carnap nevéhez fűződik (Cox, 1946; 
Carnap, 1950). Lévén a világ olyan, amilyen, a gyakorlati példák sokszor minden bizo- 
nyítéknál erősebbek. Így a valószínűség-számításon alapuló következtető rendszerek 
sikere minden érvelésnél hatékonyabb volt a hitetlenek megtérítésében. A következők- 
ben azt vizsgáljuk meg, hogy az axiómák hogyan használhatók a következtetésben. 


13.4. TELJES EGYÜTTES VALÓSZÍNŰSÉG-ELOSZLÁSON 
ALAPULÓ KÖVETKEZTETÉS 


Ebben az alfejezetben a valószínűségi következtetés (probabilistic inference) egy 
egyszerű módszerét fogjuk leírni — hogy hogyan határozhatók meg az állítások a 
posteriori valószínűségekre vonatkozó megfigyelt bizonyítékok alapján. , Tudásbázis- 
ként", a teljes együttes valószínűség-eloszlást fogjuk használni, amelyből az összes kér- 
désre adandó válasz levezethető. Menet közben számos hasznos, a valószínűségeket 
tartalmazó egyenletek kezelésére alkalmas módszert is bevezetünk. 

Kezdjük egy egészen egyszerű példával, egy olyan tartománnyal, amely mindössze 
három logikai változóból áll. Ezek: Fogfájás, Lyuk, Beakadás (a fogorvos kellemetlen 
acélszondája beleakad a fogamba). A teljes együttes eloszlás a 13.3. ábra szerinti 2 x 
2 x 2-es táblázatból fog állni. 









fogfájás 
beakadás 


"fogfájás 
"—beakadás 




















13.3. ábra. A Fogfájás, Lyuk. Beakadás világ egy teljes együttes valószínűség-eloszlása 


Vegyük észre, hogy az együttes valószínűíség-eloszlásban — a valószínűségi axió- 
máknak megfelelően - a valószínűségek összege 1. Hasonlóképpen, a (13.2) egyenlet 
közvetlen módot nyújt bármely, egyszerű vagy összetett állítás valószínűségének a meg- 
határozására: egyszerűen azokat az elemi eseményeket kell meghatároznunk, amelyek- 
ben az állítás igaz, majd összegeznünk kell a hozzájuk rendelt valószínűségeket. Például, 
hat olyan elemi esemény van, amelyben a fyuk V fogfájás igaz: 

Pt(lyuk V fogfájás) — 0,108 -- 0,012 4 0,072 -£ 0,008 

-4- 0.016 4- 0,064 — 0,28 
Az egyik általános feladat a változók egy részhalmaza vagy egyetlen változó fölötti 
valószínűségi eloszlás kifejezése. Például az első sor bejegyzéseinek összege a lyuk fel- 
tétel nélküli vagy peremeloszlásátő (marginal probability) adja: 

P(tyuk) — 0,108 -- 0,012 -t- 0,072 -t- 0,008 — 0,2 


§ Azért hívják így, mert a biztosítási matematikusokistatisztikusok általános gyakorlata szerint a megfigyelt 
gyakoriságokat a biztosítási táblázatok szélére (margójára) szokták írni. 
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Ezt a folyamatot marginalizálásnak (marginalization) vagy kiátlagolásnak (sum- 
ming out) hívjuk, mivel a Lyuk-on kívüli változókat , kiátlagoljuk". A következő álta- 
lános behatárolási szabályt fogalmazhatjuk meg a változók tetszőleges Y és Z halmaza 
esetén: 


PY)Y— 9 P(Y,2) (134) 
2 
Azaz, egy Y feletti eloszlás megkapható, ha az összes többi változót kiátlagoljuk az Y-t 
tartalmazó együttes eloszlásokból a szorzat szabályban 


P(Y)-D PV Iz) Píz) (13.5) 
: 


Ezt a szabályt feltételfeloldásnak (conditioning) hívjuk. A marginalizálás és a feltétel- 
feloldás szabályai előnyöseknek fognak bizonyulni mindenfajta valószínűségi kifejezé- 
seket tartalmazó következtetésben. 

A legtöbb esetben valamely változó, bizonyos másokra vonatkozó tények esetén 
fennálló, feltételes valószínűségének kiszámítása fog bennünket érdekelni. A feltételes 
valószínűségek meghatározásához, először is alkalmazzuk a (13.1) egyenletet, hogy 
egy feltétel nélküli valószínűségen alapuló kifejezésre jussunk, majd ezen kifejezés érté- 
két meghatározzuk a teljes együttes eloszlásból. Például a lyuk valószínűségét a fogfájás 
tény fennállása esetére az alábbiak szerint határozhatjuk meg: 


Pltyuk A fogfájás) 0,108 -- 0,012 


7 0.6 
Pt fogfájás) ——— 0108 0,012 4 0,016 -- 0,064 


P(lyuklfogfájás ) — 





Ellenőrzésképpen kiszámíthatjuk annak valószínűségét, hogy nincs lyuk, de tudjuk. 
hogy fogfájás igen: 
P(civuklfogfájás) — P(-lyuk N fogfájás) 0,016 -- 0,064 


P( fogfájás) ——— 01084 0.012 4 0,016 4 0,064 


"Vegyük észre, hogy a fenti két számításban az 1/P(fogfájás) konstans értékű marad füg- 
getlenül attól, hogy a Lyuk mely értékét számítjuk. Valójában ez egy, a P(Lyuklfogfájás)-t 
álás (normalization) konstansnak tekinthető, amely biztosítja, hogy a feltételes 
:gek összege I lesz. A valószínűségekkel foglalkozó fejezetekben az ilyen kons- 
tansokat a-val fogjuk jelölni. E jelölés segítségével a két előző kifejezés egybefoglalható: 


P(Lyuklfogfájás) — aP(LLyuk, fogfájás) 
s alP(Lyuk, fogfájás, beakadás) -- P(Lyuk. fogfájás. -beakadás)] 
— al(0,108. 0.016) -- (0.012. 0.064) — a(0.12. 0.08) — (0.6. 0.4) 


A normalizálás sok valószínűségi számításnál hasznos rövidítésnek bizonyul. 

A példából levezethető egy általános következtetési eljárás. Ragaszkodjunk ahhoz az 
esethez, ahol a keresés egy változót érint. A következő jelölésekre lesz még szüksé- 
günk: jelölje X a keresés változóját (a példában ez a Lyuk), E jelentse a tény változók 
halmazát (a példában a Fogfájás az egyetlen ilyen), e ezek megfigyelt értékét mutatja 
és a többi, meg nem figyelt változót Y foglalja magában (a példa esetében csak a 
Beakadás tartozik ide). P(XJe)-t keressük, és a következőképpen számíthatjuk ki: 


z 04 
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P(XIe) — aP(X.e) a) P(X,e,y) (13.6) 
y 


ahol az összegzést az összes lehetséges y fölött végezzük (azaz az Y meg nem figyelt 
változók értékeinek összes lehetséges kombinációja esetén). Vegyük észre, hogy az X, 
EésY változó együttesen a változók teljes halmazát alkotja az adott tárgytartomány- 


maza. Az algoritmust a 13.4. ábra mutatja. 





function FELSOROL-EGYÜTTES-KÉRDEZÉS(X. e, P) returns egy X feletti valószínűségi eloszlás 
inputs: X, a lekérdezés változója 
e, az E-ben levő változók megfigyelt értékei 
P. az (X) U EU Y változók együttes eloszlása /sY — rejtett változók 1 


O(X) — X fölötti valószínűség-eloszlás, kezdetben üres 
for each X x; értékére do 

O(x) — FELSOROL-EGYÜTTES(Xx;, e, Y, (, P). 
return NORMALIZÁL(OKX)) 





function FELSOROL-EGYÜTTES(x, e, változók, értékek, P) returns egy valós szám 
if ÜRES Xváltozók) then return P(x, e. értékek) 
Y — ELső(változók) 
return E, FELSOROL-EGYÜTTES(x, e, MARADÉK (változók), (ylértékek], P) 





13.4. ábra. A valószínűségi következtetés egy olyan algoritmusa, amely valamely teljes együttes való- 
színűségi eloszlás bejegyzéseit veszi számba 


Az eljárás ciklusa mind X, mind Y összes értéke fölött fut, számba véve minden olyan 
elemi eseményt, amely e rögzített értéke mellett lehetséges, az együttes valószínűségi 
tábla alapján összegzi ezek valószínűségeit, és normalizálja az eredményeket. 

Ha adott a teljes együttes valószínűségi eloszlás, akkor a FELSOROL-EGYÜTTES- 
KÉRDEZÉS egy teljes algoritmus, amely alkalmas minden diszkrét változóra vonatkozó 
valószínűségi lekérdezés megválaszolására. Azonban nem minősíthető jónak: egy n db 
Boole-típusú logikai változó által leírt tartományban 0(2") méretű bemeneti táblára van 
szüksége, és a tábla feldolgozása is 0(2") időt igényel. Valós problémák esetén nem 
csupán három, hanem több száz vagy több ezer véletlen változó figyelembevételére van 
szükség. Nagyon hamar teljesen kivitelezhetetlenné válik a szükséges hatalmas számú 
valószínűség definiálása - nem létezik ugyanis olyan tapasztalat, amellyel a táblázat 
egyes bejegyzései külön-külön becsülhetők lennének. 

Ezért a táblázatos formában megadott teljes együttes valószínűségi eloszlás a gyakorlat- 
ban nem használható eszköz következtető rendszerek felépítésére (mindemellett a fejezet 
végén található történeti megjegyzésekben találkozhatunk egy ilyen módszeren alapuló 
valós alkalmazással). E technikát úgy kell tekintenünk, mint egy elméleti alapot, amelyre 
a hatékonyabb módszerek épülhetnek. A fejezet további részeiben bemutatjuk azokat az 
alapötleteket, amelyekre szükségünk lesz a 14. fejezet valós rendszereinek kifejlesztéséhez. 
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13.5. FÜGGETLENSÉG 


Bővítsük ki a 13.3. ábrán látható teljes együttes valószínűségi eloszlást egy negyedik, 
Időjárás változóval. Ezzel a teljes együttes valószínűségi eloszlás P(Fogfájás, 
Beakadás, Lyuk, Időjárás) lesz 32 bejegyzéssel (mivel az Időjárás változónak négy 
értéke lehet). A teljes eloszlás a 13.3. ábrán mutatott táblázat négy . példányát" — min- 
den egyes időjárástípusra egyet - fogja magában foglalni. Természetes kérdésnek 
tűnik, hogy vajon ezeknek a táblázatpéldányoknak mi az egymáshoz és az eredeti 
háromváltozós táblához való viszonyuk? Hogyan függ össze például a P(fogfájás, be- 
akadás, lyuk, Időjárás — felhős) a P(fogfájás, beakadás, lyuk)-kal? 
A megválaszolás egyik lehetséges módja a szorzatszabály alkalmazása: 


P(fogfájás, beakadás, lyuk, Időjárás — felhős) 
— P(időjárás — felhőslfogfájás, beakadás, Iyuk)P(fogfájás, beakadás, lyuk) 


Amennyiben eltekintünk az isteni hatalommal bíró páciensektől, nem gondolhatjuk 
komolyan, hogy valakinek a fogászati problémái befolyásolják az időjárást. Ezért ész- 
szerűnek tűnik a következő kijelentés: 


Piidójárás — felhőslfogfájás, beakadás, lyuk) — P(Időjárás — felhős) (13.79) 
Ebből a következőre következtethetünk: 

P(fogfájás, beakadás, lyuk, Időjárás — felhős) — P(Időjárás — felhős)P(fogfájás, 

beakadás, lyuk) 
Hasonló egyenlet írható fel a P(Fogfájás, Beakadás. Lyuk, Időjárás) eloszlás minden 
egyes bejegyzéséhez. Az általános egyenletet pedig a következőképpen írhatjuk fel: 


P(Fogfájás, Beakadás, Lyuk, Időjárás) 
5 P(Fogfájás, Beakadás. Lyuk)P(Időjárás) 
Ebből következően a négyváltozós, 32 elemes táblázat létrehozható egy 8 és egy 4 ele- 
mes táblázatból. A dekompozíció sematikus vázlatát a 13.5. (a) ábra mutatja. 

Azt a tulajdonságot. ami alapján a (13.7) egyenletet felírtuk függetlenségnek (más 
szóval marginális függetlenségnek vagy abszolút függetlenségnek) (independence, 
marginal independence, absolute independence) nevezzük. Esetünkben az időjárás 
független bárkinek a fogászati problémáitól. Az a és b állítások függetlensége felír- 
ható: 


P(alb) — P(a) vagy P(bla) — P(b) vagy P(a A b) — P(a)P(b) (13.8) 


A fenti képletek egymással ekvivalensek (13.7. feladat). Az X és Y változók közötti füg- 
getlenség a következőképpen fejezhető ki (még egyszer felhívjuk a figyelmet, hogy 
ezek ekvivalensek): 


P(XIY) - PCO vagy P(YIX) — P(F) vagy P(X, Y) — POOP(Y) 


A függetlenségi állítások általában a tartománnyal kapcsolatos ismereteken alapul- 
nak. Mint korábban láthattuk, ezek jelentősen lecsökkenthetik a teljes együttes eloszlás 
meghatározásához szükséges információ mennyiségét. Ha a változók teljes halmaza 
szétbontható független részhalmazokra, akkor a teljes együttes eloszlás felbontható 
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13.5. ábra, Két példa nagyméretű együttes eloszlások kisebb eloszlásokra való felbontására az abszolút füg- 
getlenség alapján. (a) Az időjárás és a fogászati problémák függetlenek. (b) A pénzfeldobások függetlenek. 


ezen részhalmazok felett értelmezett, egymástól független együttes eloszlásokra. 
Például n független pénzfeldobás eredményének együttes eloszlása P(C), .... C,.) felír- 
ható n egyváltozós P(C;) eloszlás szorzataként. Még kézzelfoghatóbban: a fogászat és 
a meteorológia függetlensége jó dolog, különben a fogászati gyakorlat mély meteoro- 
lógiai ismereteket igényelne, és fordítva. 

Amennyiben rendelkezésre állnak, akkor a függetlenségi állítások segíthetnek le- 
csökkenteni a tartományleírások méretét, valamint a következtetési feladat bonyolult- 
ságát. Sajnos azonban a változók teljes halmazait csak nagyon ritkán lehet függetlenség 
alapján egyértelműen szétválasztani. A függetlenség nem lesz igaz az olyan esetekben, 
amikor bármilyen, akár indirekt kapcsolat is, de fennáll két változó között. Ezen kívül, 
a független részhalmazok mérete is lehet egészen nagy — például a fogászat probléma- 
köre egymással összefüggő betegségek tucatjait és tünetek százait takarhatja. Az ilyen 
típusú problémák kezelésére a függetlenség közvetlen kimondásánál kifinomultabb 
módszerekre lesz szükségünk. 
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Az 554. oldalon definiáltuk a szorzatszabályt (product rule), és rámutattunk, hogy ez 
a konjunkció kommutativitása miatt két alakban írható: 


P(aAb) — Pialb)Ptb) 
P(aAb)— P(blapP(a) 
A jobb oldalak egyenlőségéből P(a)-val való osztás után következik, hogy 


P(alb)P(b) 
P(a) 


P(bla)— (13.9) 
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Ezt az egyenletet Bayes-szabályként (Bayes" rule) ismerjük (nevezik Bayes-törvény- 
nek vagy Bayes-tételnek is).? Ez az egyszerű egyenlet az alapja az összes korszerű 
valószínűségi következtetést alkalmazó MI-rendszernek. A többéntékű változókat tartal- 
mazó általánosabb eset a P jelölésekkel a következő átírással adható meg: 
P(XIDPO) 

PO) 
amelyet ismételten úgy kell értelmezni, hogy egy egyenlethalmazt képvisel, amely 
egyenletek mindegyike a változók meghatározott értékeire vonatkozik. Lesznek olyan 
esetek, amikor egy még általánosabb felírást használhatunk, valamilyen e háttértény 
feltételével: 


P(TIX,e) — 


P(YIX) — 


POIFOPT) (13.10) 
PR(Xk) 


Bayes tételének alkalmazása: egyszerű eset 


A Bayes-tétel első pillantásra nem tűnik túl használhatónak. Egyetlen feltételes valószí- 
nűség kiszámításához három kifejezés — egy feltételes és két feltétel nélküli valószínű- 
ség — megadása szükséges. 

A gyakorlatban a Bayes-tétel jól használható, mivel gyakran rendelkezünk a fenti 
három kifejezésre vonatkozó jó valószínűségi becsléssel, miközben a negyediket kell 
kiszámítanunk. Olyan feladatoknál, mint az orvosi diagnosztika, gyakran ismerjük az 
ok-okozati kapcsolatok feltételes valószínűségeit, miközben egy diagnózist szeretnénk 
felállítani. Az orvos tudja azt, hogy az agyhártyagyulladás az esetek mondjuk 5099- 
ában nyakmerevedést okoz a betegeknél. Az orvos ezenfelül ismer néhány feltétel nél- 
küli tényt is: annak előzetes valószínűsége, hogy egy beteg agyhártyagyulladást kap, 
1/50 000, míg annak előzetes valószínűsége, hogy egy betegnek merev a nyaka 1/20. 
Jelölje s azt az állítást, hogy a betegnek megmerevedett a nyaka, valamint m azt az ál- 
lítást, hogy a betegnek agyhártyagyulladása van. Ekkor 


P(slmy—0,5 
P(m) —1/50000 
P(s) —1/20 
Pt — PEjTDPEN 0.571/50000 0002 
P(5) 1/20 


Vagyis a nyakmerevedésről panaszkodó 5000 beteg közül várhatóan csak egynek lesz 
agyhártyagyulladása. Vegyük észre, hogy annak ellenére, hogy az agyhártyagyulladás- 


nak igen gyakori tünete (0,5 valószínűséggel) a nyakmerevedés, annak valószínűsége, 
hogy egy nyakmerevedéses betegnek ténylegesen agyhártyagyulladása van, mégis 


9 Az angol irodalomban Bayes" nile az elnevezése. Strunk és White The Elements of Sty 
oldalán található 1. szabály értelmében a Bayes" helyett inkább a Bayes"s lenne a helyes 
előbbit elterjedtebben használják. (Szerencsére ilyen probléma a magyarban nincs. A szerk.) 






könyvének 1. 
lölés, azonban az 
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csekély. Ez abból következik, hogy a nyakmerevedés a priori valószínűsége sokkal 
nagyobb, mint az agyhártyagyulladásé. 

A 13.4. alfejezetben bemutattunk egy eljárást, amely segítségével elkerülhető a tény 
valószínűségének (példánkban P(s)) megbecsülése, úgy. hogy a lekérdezett változó 
minden egyes értékéhez (itt s és —ni) egy utólagos valószínűséget számítunk ki, majd 
az eredményeket normalizáljuk. Hasonló eljárás alkalmazható, ha a Bayes-tételt hasz- 
náljuk. Ismert, hogy 


P(MIs) — a(P(slm)P(m), P(sI-m)P(-m)) 


Következésképpen ahhoz, hogy ezt a megközelítést használni tudjuk, P(s) helyett 
P(sl-m)-et kell tudnunk becsülni. Nincs ingyenebéd — van. hogy ez könnyebb és van, 
hogy nehezebb. A normalizált Bayes-tétel általános alakja 


P(Y]X)— aP(XIPJP(Y) (13.10 
ahol a a normalizáló konstanst jelöli, amely segítségével a P(YIX) elemeinek összegét 
1-gyé tudjuk tenni. 

A Bayes-tétellel kapcsolatban magától értetődő kérdés, hogy miért ismerhetjük a fel- 
tételes valószínűséget az egyik irányból, a másik irányból pedig nem. Az agyhártya- 
gyulladás tartományban a doktor tudhatja, hogy a nyakmerevedésből csak minden 
5000-dik esetben következik agyhártyagyulladás, vagyis a doktor a tünetektől a kivál- 
tó ok felé, azaz diagnosztikai (diagnostic) irányban rendelkezik mennyiségi infor- 
mációval. Egy ilyen orvosnak nincs szüksége a Bayes-tétel alkalmazására. Sajnálatos 
módon azonban a diagnosztikai tudás gyakran sokkal törékenyebbnek bizonyul az ok- 
okozati összefüggéseknél. Ha például hirtelen agyhártyagyulladás-járvány tör ki, akkor 
az agyhártyagyulladás előzetes valószínűsége, P(mn) megnő. Az az orvos, aki a járványt 
megelőző statisztikai adatok alapján számította ki P(ml5)-t, nem fogja tudni, hogyan 
változtassa meg az agyhártyagyulladásra vonatkozó értéket, míg az a doktor, aki a má- 
sik három érték segítségével számítja P(ml5)-t, látni fogja, hogy ennek értéke P(m)-mel 
arányosan meg fog nőni. Még fontosabb azonban, hogy a P(sIm) okozati információ 
értékét a járvány nem befolyásolja, hiszen ez kizárólag az agyhártyagyulladás lefolyá- 
sától függ. Ez a fajta közvetlen ok-okozati és modellalapú tudás alkalmazása teszi a 
valószínűségi rendszereket döntően robusztussá, amely a valódi világban való felhasz- 
nálhatósághoz szükséges. 


A Bayes-tétel alkalmazása: több együttes tény 
figyelembevétele 


Láttuk, hogy a Bayes-tétel hasznos lehet az egyetlen tény — például nyakmerevedés — fel- 
tételezése melletti valószínűségi kérdések megválaszolásánál. Nevezetesen, megmutat- 
tuk, hogy a valószínűségi információ gyakran P(okozatlok) formában áll rendelkezésre. 
Mi történik azonban akkor, ha kettő vagy több tény van a birtokunkban? Például milyen 
következtetésre juthat a fogorvos, ha az az undok acélszondája lyukra akad a beteg fájó 
fogában? Ha ismerjük a teljes együttes etoszlást (lásd 13.3. ábra), a válasz kiolvasható: 


P(1yuk [fogfájás A beakadás )—a(0,108, 0,016) az (0,871, 0,129) 
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Azt is tudjuk ugyanakkor, hogy ez a megközelítés nagyszámú változó esetén nem hasz- 
nálható. 

Megpróbálkozhatunk a Bayes-tétel alkalmazásával is, átfogalmazva a kérdést: 

P(Lyuklfogfájás A beakadás) — aP(fogfájás A beakadáslLyuk)P(LLyuk) (13.12) 
Ahhoz, hogy ez az átfogalmazás működjön, a Lyuk minden értékére ismernünk kell a 
fogfájás A beakadás együttes bekövetkezésének feltételes valószínűségét. Noha ez két 
tényváltozó esetén használható lehet, nagyszámú változó esetén már nem alkalmazható. 
Han figyelembe veendő tényváltozónk van (röntgen, diéta, szájhigiénia stb.), akkor a meg- 
figyelt értékek lehetséges kombinációinak száma 2", amely esetek mindegyikénél ismer- 
nünk kell a feltételes valószínűséget. Ennyi erővel akár vissza is térhetünk a teljes együttes 
valószínűség-eloszlás használatához. Ez vezetett arra, hogy a kutatók a valószínűség- 
számítás helyett közelítő módszereket kezdtek el használni több tény együttes figyelembe- 
vételénél, mert bár az így kapott válaszok pontatlanok, de kevesebb számolást igényelnek. 

A fenti út követése helyett inkább további állításokat kell keresnünk a tárgytarto- 
mányról, amelyek lehetővé teszik a kifejezések egyszerűsítését. A 13.5. alfejezetben 
bevezetett függetlenség (independence) fogalma kínálja a megoldás kulcsát, azonban 
finomítást igényel. Kellemes lenne, ha a Fogfájás és a Beakadás függetlenek lennének, 
de nem azok: ha a szonda megakad a fogban, akkor az valószínűleg lyukas, ami várha- 
tóan fájdalmat okoz. Mindemellett, ezek a változók függetlenek, amennyiben a lyuk 
megléte vagy hiánya adott tény. Mindkettő a lyuk közvetlen következménye, azonban 
egyiknek sincs közvetlen hatása a másikra: a fogfájás a fogidegek állapotától függ, míg 
a szonda pontosságát a fogorvos szakértelme határozza meg, amelyben nincs szerepe a 
fogfájásnak. !9 Ezt a tulajdonságot matematikailag a következőképpen írhatjuk le 


P(fogfájás A beakadásltyuk) — P(fogfájáslLyuk)PtbeakadáslLyuk) (13.13) 
Ez az egyenlet a Lyuk ténye esetén a fogfájás és beakadás között fennálló feltételes 
függetlenséget (conditional independence) fejezi ki. (13.13)-at (13.129-be behelyette- 
sítve megkapjuk a lyuk valószínűségét: 

P(Lyuklfogfájás A beakadás) — aP(fogfájáslLyuk)P(beakadás)ILyuk)P(LLyuk) 

Ezzel ugyanarra az információigényre jutottunk, mint a minden egyes tényt külön hasz- 
náló következtetésnél: a keresés változójának P(L.vuk) a priori valószínűségét, valamint 
minden egyes okozat saját okának fennállása esetén igaz feltételes valószínűségét kell 
ismernünk. 

Két változó, X és Y egy adott Z harmadik melletti feltételes függetlenségének általá- 
nos definíciójáta következő egyenlet adja: 


P(X, YI2) — P(XIDP(YI2) 


A fogorvostartományban, például, logikusnak tűnik a Fogfájás és Beakadás között fel- 
tételes függetlenséget feltételezni a Lyuk ténye esetén: 


P(Fogfájás, Beakadásltyuk) — P(FogfájáslLyuk)P(Beakadásltyuk) (13.14) 


Vegyük észre, hogy ez a kijelentés valamelyest erősebb, mint amit a (13.13) egyenlet 
fejez ki. Ez utóbbi csak a Fogfájás és Beakadás bizonyos értékeihez rendel független- 


10 Feltételezve, hogy a beteg és a fogorvos két különböző személy. 
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séget. Éppúgy, mint a (13.8) egyenletben az abszolút függetlenségnél, a következő ek- 
vivalens kifejezések is használhatók: 


P(XIY.2)-P(XIZ) és P(YIX,2)—P(YIZ) 


A 13.5. alfejezetben megmutattuk, hogy a teljes függetlenség bizonyíthatósága ese- 
tén a teljes együttes valószínűségi eloszlás szétbontható sokkal kisebb részekre. Ugyan- 
ez lesz igaz feltételes függetlenség esetén is. Példának okáért, a (13.14) szerinti kijelen- 
tés fennállása esetén, a felbontás a következőt jelentheti: 


P(Fogfájás , Beakadás Lyuk ) 
— P(Fogfájás, BeakadáslLyuk )P(Lyuk ) (szorzatszabály) 
 P(FogfájásjLyuk )P(BeakadásíLyuk )P(Lyuk ) (13.14)-et felhasználva 


Ezzel a módszerrel az eredeti nagy táblázat felbontható három kisebbre. Az eredeti táb- 
lázat hét független számot tartalmaz (22-1, mivel a számok összegének 1-et kell adnia). 
A kisebb táblázatokban öt független szám található (mindegyik feltételes valószínűsé- 
gi eloszlásra 2 x (2-1), valamint 21-I a Lyuk előzetes valószínűségi eloszlására). Ez 
nem tűnik túl nagy győzelemnek, azonban, ha a Lyuk ténye mellett n tünet bizonyul 
függetlennek, akkor a reprezentáció O(n) nagyságrendben növekszik 0(2") helyett. Kö- 
vetkezésképpen a feltételes függetlenségi kijelentések lehetővé teszik nagy valószínűsé- 
gi rendszerek kezelhetőségét, sőt, a feltételes függetlenségi kijelentések gyakrabban 
rendelkezésre is állnak, mint az abszolút függetlenségre vonatkozók. A Lyuk fogalmilag 
szétválasztja (separate) a Fogfájás-t és a Beakadás-t, mivel mindkettőnek közvetlen 
következménye. Nagy valószínűségi tartományok feltételes függetlenségen keresztül 
lazán kapcsolódó részhalmazokra történő szétbontása a modern MI történetének leg- 
nagyobb eredményei közé tartozik. 

A fogorvosi eset jó példa az olyan, rendszeresen bekövetkező mintára, ahol egyetlen 
ok közvetlenül befolyásol számos olyan okozatot, amelyek az ok fennállása esetén 
feltételesen függetlenek. A teljes valószínűségi eloszlás az alábbiak szerint írható fel: 


P(Ok.Okozat ,....Okozat , ) — P(Ok)J IPrOkozar Ok ) 
i 

Az ilyen valószínűségi eloszlásokat naiv Bayes-modellnek hívjuk — , naiv", mert gyak- 
ran használják (egyszerűsítésként) olyan esetekben is, ahol az , okozati" változók valójá- 
ban nem függetlenek az , ok" fennállása esetén. (A naiv Bayes-modellt néha Bayes-osztá- 
lyozónak (Bayes classifier) is hívják némileg meggondolatlanul, ami arra sarkallta az igazi 
Bayes-következtetést alkalmazókat, hogy a naiv Bayes-modellt együgyű Bayes- (idiot 
Bayes) modellnek hívják.) A naiv Bayes-modellek a gyakorlatban akkor is meglepően jól 
működnek, ha a valószínűségi feltételezés nem igaz. A 20. fejezetben olyan módszereket 
írunk le, amelyekkel a naiv Bayes-eloszlások megtanulhatók a megfigyelésekből. 
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E fejezet gondolatai közül sok eredményesen kombinálható a wumpus világ valószínű- 
ségi következtetési problémáinak megoldására. (A wumpus világ teljes leírása a 7. 
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fejezetben található.) A wumpus világban fellépő bizonytalanságot az ágens érzékelésé- 
nek a világra vonatkozóan a csak helyi információt szolgáltató részlegessége okozza. 
Például a 13.6. ábra egy olyan szituációt ábrázol, amelyben mindhárom elérhető négy- 
zet — [1, 3], (2. 2] és (3, 1] — tartalmazhat csapdát. Egyszerű logikai következtetéssel 
nem dönthető el, hogy melyik a legvalószínűbben biztonságos négyzet, így a logikai 
ágens kénytelen véletlenszerűen választani. Látni fogjuk ugyanakkor, hogy egy való- 
színűségi ágens sokkal sikeresebb, mint egy logikai ágens. 

A célunk az lesz, hogy mindhárom négyzetre kiszámítsuk a csapda valószínűségét. 
(A példa erejéig elfelejtjük a wumpust és az aranyat.) A wumpus világ idevágó tulaj- 
donságai a következők: (1) egy csapda szellőt okoz a szomszédos négyzetekben, és (2) 
az [1,1]-en kívül minden négyzet 0,2 valószínűséggel tartalmaz csapdát. Első lépésként 
a számításhoz szükséges véletlen változókat kell meghatároznunk: 


" Az ítéletlogikához hasonlóan, itt is minden négyzethez egy (C;j) logikai változóra 
van szükségünk, amelynek értéke akkor és csak akkor igaz, ha az [ij] négyzet tar- 
talmaz csapdát. 

s Vannak továbbá S; ij logikai változóink is, amelyek igaz értéke egyértelműen az [ij] 
négyzetben tapasztalható szellőre utal; példánkban csak a megfigyelt — esetünkben 
az (1, 3], [2. 2] és [3, 1) négyzetekre — vonatkozó változókat használjuk. 


A következő lépés a P(C) 4,....Ca 4.511. 512. 521) teljes valószínűségi eloszlás megha- 
tározása. A szorzatszabály alkalmazásával 


PC. Cg4r 511 512952) F PCSu 52. Sza IG 


adódik. 

A dekompozíció nagyon könnyűvé teszi az együttes valószínűségi értékek megha- 
tározását. Az első rész a szellő feltételes valószínűség konfigurációját adja adott csap- 
da konfigurációnál; ennek értéke I, ahol a szellő szomszédos egy csapdával, minden 





44) PG. C44) 
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13.6. ábra. (a) Az ágens beragad, miután "I, 2]-ben és [2, IJ-ben is szellőt észlel - nincs feltárható biztonságos 





hely. (b) A négyzetek szétosztása Ismert, Perem és Egyéb csoportokba az (1, 3]-ra vonatkozó lekérdezéshez. 
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más esetben 0. A második tag a csapdakonfiguráció előzetes valószínűsége. A négy- 
zetek a többi négyzettől függetlenül 0,2 valószínűséggel tartalmaznak csapdát; követ- 
kezésképpen 

44 


P(CiuCag)- II Pc) (13.15) 


ij—1 
Egy n csapdát tartalmazó konfigurációnát ennek értéke 02" x öles 

A 13.6. (a) ábra szerinti helyzetnél a bizonyíték magában foglalja minden megláto- 
gatott négyzetre az ott megfigyelt szellőt (vagy annak hiányát) azzal a ténnyel együtt, 
hogy a meglátogatott négyzetek nem tartalmaznak csapdát. Ezeket az 5——5sj p A S42 A 
521 és ismert — —cjg A 7612 A 7€2.1 rövidítésekkel fogjuk jelölni. A mi számunkra a 
P(C) alismert, 5) típusú lekérdezések megválaszolása érdekes: adott megfigyelések mel- 
lett mennyire valószínű, hogy az [1, 3] csapdát tartalmaz? 

A válaszhoz követhetjük a (13.6) egyenlet szerinti szabványos megközelítést, amelyet 
a FELSOROL-EGYÜTTES-KÉRDEZÉS eljárás valósít meg, azaz a teljes együttes valószínű- 
ségi eloszlás bejegyzései szerinti összegzést. Jelölje Ismeretlen azt az összetett változót, 
amelyet a nem Ismert csoportba tartozó négyzetek és a lekérdezett [1, 3] négyzet C;j 
változói alkotnak. Ezzel a (13.6) egyenletből 


P(C 3 lismert,5)—a pan P(C) 3.ismeretlen , ismert, 5) 
ismeretlen 
A teljes együttes valószínűségeket korábban már meghatároztuk, így készen is vagyunk 
— kivéve, ha a számítási bonyolultság kérdésével is törődünk. 12 ismeretlen négyzetünk 
van; így az összegzés 2? — 4096 tagból fog állni. Általánosságban, az összegzés expo- 
nenciálisan nő a négyzetek számával. 

Az intuíció azt súgja, hogy itt valamit még figyelmen kívül hagyunk. És tényleg, bár- 
ki megkérdezheti, hogy a többi négyzet nem lényegtelen-e? A (4, 4] tartalma nincs 
hatással arra, hogy az [1, 3] tartalmaz-e csapdát! Ez az intuíció valóban helyes. Jelölje 
Perem azokat a — lekérdezés változójától különböző — változókat. amelyek a meglá- 
togatott négyzetekkel szomszédosak, esetünkben a [2, 2] és a (3, 1]. Továbbá Egyéb 
legyen a többi ismeretlen négyzet változója; példánkban — ahogy a 13.6. (b) ábra is mu- 
tatja — 10 ilyen négyzet van. A kulcs meglátás az, hogy megfigyelt szellők feltételesen 
függetlenek a többi változótól, ha adottak az ismert, a perem és a lekérdezés változók. 
A többi, ahogy mondják, már csak egy kis algebra. 

A fenti meglátás használatához a lekérdezést olyan alakra hozzuk, amelyben a szellő 
az összes többi változó feltétele mellett van megadva, majd az egészet egyszerűsítjük 
a feltételes függetlenség alapján: 

PC zlismert,5) 

za 37 P(SCiz.ismert, ismeretlen, )P(Ci 3, ismert, ismeretlen) 

ismeretlen 
(szorzószabály) 

ma bak 92 P(slismert, Ci 3, perem, egyéb)P(C) 3, ismert, perem, egyéb) 

perem egyéb 


za 97 2 P(dismert,Cg3,perem)P(Ci a, ismert, perem, egyéb) 
perem egyéb 


570 13. BIZONYTALANSÁG 


ahol az utolsó lépés használja ki a feltételes függetlenséget. E kifejezés első tagja nem 
függ a többi változótól, így az összegzés belülre vihető: 

PiCizlismert,59— a bi P(slismert ,C) 3.perem) x RXC 3. ismert, perem, egyéb) 

perem egyéb 

Függetlenség esetén a (13.15) egyenlethez hasonlóan az előző kifejezés tényezőkre 
bontható, majd a tényezők sorrendje átrendezhető: 

P(Cizlismert,s) 

ss xy P(slismert,C) 3,perem) pa P(Cp 3)C(ismert) C(perem)C (egyéb) 


perem egyéb 
- aC(ismert)P(Ci3) 97 Pislismert.Ci3,perem)C(perem) 3" Ctegyéb) — 
perem egyéb 
—a/P(Ci3) X7 Pilismert, Ca perem) C(perem) 
perem 


ahol az utolsó lépésben C(ismert)-et belefoglaltuk a normalizáló konstansba, és kihasz- 
náltuk, hogy2 ? C(egyéb) értéke 1. 
egyéb 

Most már csak négy tag van a C; ; és Cz , peremváltozók feletti összegzésben. A füg- 
getlenség és feltételes függetlenség miatt egyáltalán nem szükséges figyelembe vennünk 
a többi négyzetet. Vegyük észre, hogy a P(slismert, C 3, perem) kifejezés értéke 1, ha 
a határ megegyezik a szellő érzékelésekkel és minden más esetben 0. Azaz, C) 3 minden 
értékére azon határváltozók logikai modelljei fölött végezzük az összegzést, amelyek az 
megfelelnek az ismert tényeknek. (Érdemes ezt összehasonlítani a 7.5. ábra modelljei 
szerinti számítással.) A modelleket és a hozzájuk kapcsolódó C(perem) a priori való- 
színűségeket a 13.7. ábra mutatja. Ezzel 


P(C 3lismert, 5) — a/(0,2(0,04 -k 0,16 -t 0.16), 0,8(0,04 4. 0,16)) a (0.31, 0, 69) 


Azaz, az [1, 3] (és a szimmetria miatt a [3, ID nagyjából 3196 valószínűséggel tartal- 
maz csapdát. Hasonló számításokból (amelyet az olvasó könnyen elvégezher) a [2, 2]-re 


Tg zza 129 zt 129 22 Ty 
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13.7. ábra. C2 2 és Cz.1 peremváltozók, az egyes modellek €(perem) értékét mutató konzisztens modell- 
jei: (a) három, két vagy három csapdát jelző modell C) 3 — igaz mellett, és (b) két, egy vagy két csapdát 
jelző modell C) a — hamis mellett. 
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869--os valószínűséggel adódik csapda. A wumpus ágensnek határozottan e! kell ke- 
rülnie a [2, 2]-1! 

Ebben az alfejezetben azt mutattuk meg, hogy még a látszólag bonyolult problémák 
is pontosan megfogalmazhatók valószínűség-elméleti alapokon, és meg is oldhatók 
egyszerű algoritmusok segítségével. Hogy hatékony megoldásokat kapjunk, a szüksé- 
ges összegzéseket a függetlenségekre és feltételes függetlenségekre alapozva egyszerű- 
sítjük. Ezek az összefüggések gyakran egybeesnek a probléma részproblémákra való 
felbontására vonatkozó természetes felfogásunkkal. A következő fejezetben ilyen ösz- 
szefüggések formális megjelenítésére alkalmazunk módszereket, valamint olyan algo- 
ritmusokat fejlesztünk ki, amelyek hatékonyan használhatók e reprezentációk alapján 
elvégzett valószínűségi következtetések végrehajtására. 
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Ez a fejezet arra mutat rá, hogy a valószínűség megfelelő módja a bizonytalanságra 
vonatkozó következtetéseknek. 


" Bizonytalanság következik mind a lustaságból, mind pedig a tudatlanságból. Össze- 
tett, dinamikus vagy hozzáférhetetlen világok esetén mindez elkerülhetetlen. 

, A bizonytalanság azt jelenti, hogy a továbbiakban sok olyan egyszerűsítés, amely 
deduktív következtetés során megengedhető, hamis eredményre vezet. 

s A bizonytalanság az ágens képtelenségét fejezi ki arra, hogy egyértelmű döntést 
hozzon egy állítás igazságát illetően. A valószínűségek az ágens meggyőződésének 
fokát fejezik ki. 

s Az alapvető valószínűségi állítások magukban foglalják az egyszerű és az összetett 
állításokra vonatkozó a priori és feltételes valószínűségeket (prior and condítional 
probabilities). 

. A teljes együttes valószínűség-eloszlás (full joint probability distribution) való- 
színűséget rendel a véletlen változó minden teljes körű érték-hozzárendeléséhez. A tel- 
jes együttes valószínűség-eloszlás általában sokkal nagyobb méretű annál, semhogy 
létrehozzuk vagy használjuk. 

s A valószínűségi axiómák kényszereket jelentenek az állításokhoz ésszerűen hozzá- 
rendelt valószínűségek értékére vonatkozóan. Az axiómákat megsértő ágens bizo- 
nyos körülmények között ésszerűtlenül fog viselkedni. 

s Ha rendelkezésre áll a teljes valószínűségi eloszlás, akkor a lekérdezések megvá- 
laszolását egyszerűen a lekérdezések állításához tartozó elemi események bejegy- 
zéseinek összeadásával elvégezhetjük. 

"s A véletlen változók részhalmazai között fennálló abszolút függetlenség (absolute inde- 
pendence) maga után vonja a teljes együttes valószínűségi eloszlás kisebb együttes való- 
színűségi eloszlásokból álló szorzattényezőkre bontásának lehetőségét. Ez nagymérték- 
ben csökkentheti a bonyolultságot, azonban a gyakorlatban ritkán fordul elő. 

. A Bayes-tétel (Bayes" rule) lehetővé teszi, hogy ismert feltételes valószínűségekből 
számítsunk ki ismeretleneket, általában az okozat irányába következtetve. Nagy 
mennyiségű tény rendelkezésre állása esetén a Bayes-tétel alkalmazása ugyanolyan 
számításigény-robbanáshoz vezet, mint a teljes együttes valószínűségi eloszlás. 
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s" A tartományon belüli közvetlen oksági kapcsolatok okozta feltételes függetlenség 
(condítional independence) lehetővé teszi, hogy a teljes valószínűségi eloszlást 
kisebb, feltételes valószínűségi eloszlások szorzataként írhassuk fel. A naiv Bayes- 
(naive Bayes) modell adott okváltozó mellett feltételezi az okozati változók feltéte- 
les függetlenségét, a modell mérete pedig az okozati változók számával lineárisan nő. 

" A wumpous világ ágense ki tudja számítani a világ meg nem figyelt eseményeinek 
valószínűségét is, és azokat használva jobb következtetésekre tud jutni, mint egy 
egyszetű logikai ágens. 





Irodalmi és történeti megjegyzések 


Bár a szerencsejátékok már i. e. 300 körül is ismertek voltak, az esélyek és a valószí- 
nűségek matematikai analízise jóval későbbre tehető. Mahaviracarya Indiában nagyjából 
azi. e. 9. században kezdte meg a téma vizsgálatát. Európában az első kísérletek csak 
az olasz reneszánsz idejére, kb. 1500-ra tehetők. Az első jelentős következetes elemzés 
Girolamo Cardano nevéhez fűződik ( 1565), amely azonban 1663-ig nem került nyilvá- 
nosságra. Ekkorra Blaise Pascalnak a valószínűségek szisztematikus kiszámítására 
vonatkozó felfedezése (Pierre Fermat-val levelezve 1654-ben) megalapozta a való- 
színűség-számítást, mint a matematika széles körben és eredményesen vizsgált ágát. 
Az első valószínűségekkel kapcsolatos tankönyv a De Ratiociniis in Ludo Aleae volt 
(Huygens, 1657). Pascal bevezette a feltételes valószínűség fogalmát is. amelyről szin- 
tén szó van Huygens könyvében. Thomas Bayes anglikán lelkész (1702-1761) nevéhez 
fűződik a később róla elnevezett szabály, amely feltételes valószínűségek számítására 
alkalmas. Eredménye csak halála után jelent meg nyomtatásban (Bayes, 1763). Kolmo- 
gorov volt az első (Kolmogorov, 1950; első megjelenés németül 1933), aki a valószínű- 
ség-számítást szigorúan axiomatikus keretek között tárgyalta. Rényi (Rényi, 1970) olyan 
axiómarendszert vezetett be, amely nem a feltétel nélküli, hanem a feltételes valószínű- 
ség fogalmára épül. 

Pascal többféleképpen használta a valószínűség fogalmát, így igényelte mind az 
objektivista értelmezést — amely szerint a valószínűség a világhoz tartozó, szimmetrián 
vagy relatív gyakoriságon alapuló sajátság —, mind pedig a valószínűség meggyőződési 
mértéken alapuló szubjektív megközelítését: előbbit a szerencsejátékokra vonatkozó 
valószínűség elemzéseiben, míg az utóbbit a híres pascali fogadás érvelésében Isten 
létezése vagy nemléte kapcsán. Mindemellett, Pascal nem látta világosan a két megkö- 
zelítés közötti különbséget. Ezt jól érthetően először James Bernoulli (1654—1705) fogal- 
mazta meg. 

Leibniz nevéhez fűződik a valószínűség klasszikus fogalmának — mint a számba vett 
azonos esélyű esetek arányának — leírása. Ugyanezt a fogalmat használta Bernoulli is, 
bár igazából Laplace (1749-1827) vezette be a gyakorlatba. A fogalom azonban a 
frekvencionista, illetve a szubjektív értelmezési mód között nem tud különbséget tenni. 
Az esetek tekinthetők azonos esélyűeknek akár a természetes fizikai szimmetriák miatt, 
akár pedig egyszerűen azért, mert nincs olyan információnk, amely arra mutatna, hogy 
az egyik bekövetkezésének nagyobb az esélye, mint a másikénak. Ez utóbbit, amikor 
egyéni megfontolások alapján igazoljuk az egyenlő valószínűségek hozzárendelését, 
a pártatlanság elvének (principle of indifference) hívjuk (Keynes, 1921). 
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A valószínűség objektivista és szubjektivista értelmezése közötti vita a 20. század- 
ban kiélesedett. A relatív gyakoriság szószólói Kolmogorov (Kolmogorov, 1963), R. A. 
Fisher (Fisher, 1922) és Richard von Mises (von Mises, 1928) voltak. Karl Popper 
(Popper, 1959; első megjelenés németül 1934) hajlam (propensity) értelmezése a mö- 
göttes fizikai szimmetriát látja a relatív gyakoriságban. Frank Ramsey, Bruno de 
Finetti, R. T. Cox, Leonard Savage és Richard Jeffrey úgy értelmezték a valószínűséget, 
mint meghatározott egyének meggyőződésének mértékét (Ramsey, 1931; de Finetti, 
1937; Cox, 1946; Savage, 1954; Jeffrey, 1983). A hiedelem mértékére vonatkozó elem- 
zésük szorosan kötődött a hasznossághoz és a viselkedéshez, különösen ahhoz a szán- 
dékhoz, hogy fogadásokat kössünk. Rudolf Carnap, Leibnizet és Laplace-t követve, a 
szubjektív valószínűség egy másfajta értelmezését javasolta: nem mint az adott egyén 
meggyőződését, hanem mint azt a hiedelemfokot, amelyet egy eszményi személynek 
kell hinnie egy adott a állításról e tény fennállása esetén. Carnap megpróbált Leibniz- 
nél és Laplace-nál tovább menni, és ezt a megerősítési (confirmation) mérték fogal- 
mat, mint a és e között fennálló logikai kapcsolatot, matematikailag ís pontosan leírni. 
A kapcsolat tanulmányozása révén akarta a megszokott deduktív logika (Carnap, 1948; 
1950) mintájára, a matematika egy induktív logikának (inductive logic) nevezett 
diszciplináját megalapítani, Carnap képtelen volt az induktív logikát lényegesen kiter- 
jeszteni az ítéletkalkuluson túlra, és Putnam mutatta meg, hogy alapvető nehézségek 
biúsítják meg az aritmetikát is kifejezni képes nyelvek irányába történő szabatos kiter- 
jesztést (Putnam, 1963). 

A vonatkoztatási osztály kérdése szorosan kötődik az induktív logika megtalálására 
tett törekvésekhez. Az elégséges méretű legjobban specifikus vonatkoztatási osztály ki- 
választására való törekvést Reichenbach javasolta (Reichenbach, 1949). Erőfeszítések 
történtek kifinomultabb irányelvek kialakítására, amelyekkel el lehet kerülni a Reichen- 
bach-szabályból következő, Henry Kyburg által észlelt ellentmondásokat (Kyburg, 1977; 
1983), azonban ezek a törekvések leginkább ad hoc jellegűek maradtak. Egy újabb, 
Bacchus, Grove, Halpern és Koller nevéhez fűződő munka (Bacchus és társai, 1992) 
Carnap módszereit kiterjeszti az elsőrendű elméletekre, kiküszöbölve ezáltal sok, a vo- 
natkoztatási osztályokkal kapcsolatos nehézséget. 

A bayesi valószínűségi következtető rendszereket a hatvanas évek óta használják az 
MI-ben, különösen az orvosi diagnosztikában. Nemcsak azért, hogy meglevő tényekből 
következtetéseket vonjanak le, hanem azért is, hogy az információérték-elmélet (ásd 
16.6. alfejezet) segítségével további kérdéseket és vizsgálatokat válasszanak, amikor a 
meglevő tények nem meggyőzők (Gorry, 1968; Gorry és társai, 1973). Az egyik rendszer 
felül is múlta az emberi szakértőket a heveny hasi megbetegedések diagnózisában (de 
Dombal és társai. 1974). Mindemellett azonban ezekkel a korai bayesi rendszerekkel igen 
sok gond is volt. Lévén, semmilyen elméleti modellel nem rendelkeztek azokról a körül- 
ményekről, amelyeket diagnosztizáltak, sebezhetők voltak mindazon esetekben, amikor 
olyan helyzetekre jellemző adatok tűntek fel, amelyeket csak kisszámú mintahalmaz kép- 
viselt (de Dombal és társai, 1981). Még ennél is alapvetőbb, hogy mivel nem volt tömör 
leíró módszerük (mint amilyet a 14. fejezetben ismertetünk) a feltételes függetlenség 
megjelenítésére és használatára, erősen függtek a hatalmas mennyiségű valószínűségi 
adat gyűjtésétől, tárolásától és feldolgozásától. E nehézségek miatt 1970-től a nyolcvanas 
évek közepéig a bizonytalanságkezelés valószínűségi módszerei kegyvesztettek lettek az 
Mi-ten. A nyolcvanas évek vége óta bekö fejlődést a következő fejezet írja le. 
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Az együttes eloszlások naiv bayesi megközelítését az alakfelismeréssel foglalkozó 
irodalom alaposan tanulmányozta az 1950-es évektől kezdve (Duda és Hart, 1973). 
A megközelítést Maron munkájának megjelenése (Maron, 1961) óta gyakran használ- 
ták — sokszor akaratlanul — az adatbányászat területén is. A módszer valószínűségi meg- 
alapozását, amelyet részletesen a 13.18. feladat ír le, Robertson és Sparck Jones tisztázta 
(Robertson és Jones, 1976). A naiv Bayes-következtetésnek a még olyan tartományokban 
is jelentkező meglepő sikerére, ahol a függetlenségi feltételezés egyértelműen sérül, 
Domingos és Pazzani ad magyarázatot (Domingos és Pazzani, 1977). 

A valószínűség-számítás témakörében nagyon sok kiváló tankönyv létezik, beleértve 
a Chung és Ross által írtakat (Chung, 1979; Ross, 1988). Morris DeGroot két könyve 
közül az egyik (DeGroot, 1989) a bayesi álláspont felől közelítve ad közös bevezetést a 
valószínűség-számításba és a statisztikába, a másik pedig mélyebb ismereteket tartalmaz 
(DeGroot, 1970). Richard Hamming tankönyve matematikailag megalapozott bevezetést 
nyújt a valószínűség-számítás elméletébe a fizikai szimmetrián alapuló hajlammeg- 
közelítés felől (Hamming, 1991). Hacking és Hald a valószínűség fogalmának korai 
történetét tárják elénk (Hacking, 1975; Hald, 1990), Bernstein pedig szórakoztató nép- 
szerűsítő áttekintést ad a kockázatelemzés történetéről (Bernstein, 1996). 


Feladatok 
13.1. Mutassa meg az alapelvek segítségével, hogy 
P(albAa)— 1 


13.2. A valószínűség-számítás axiómáit használva bizonyítsa be, hogy diszkrét vélet- 
len változók tetszőleges valószínűségi eloszlása összegének 1-et kell adnia. 


13.3. Ésszerű lehet-e egy ágens számára a következő három meggyőződésben hinni: 
P(A) — 04, P(B) — 03 és P(A V B) — 0,5? Ha igen, milyen valószínűségsávot 
tart ésszerűnek A A B-re vonatkozóan? Készítsen a 13.2. ábrához hasonló táblá- 
zatot, és mutassa meg, hogyan támasztja ez alá az Ön érvelését. Ezután készítsen 
egy másik változatot, amelynél P(A V B) — 0,7. Magyarázza el. miért racionális 
egy ekkora valószínűség hozzárendelése, mindamellett hogy a táblázat mutat egy 
olyan esetet, ami veszteség, és három olyat, ami ki van egyenlítve. (Segítség: 
milyen valószínűségi hozzárendelés mellett kötelezte el magát az 1. ágens a 
négy esetben, de különösen a veszteség esetén?) 


13.4. Ez a kérdés az 551—552. oldalon tárgyaltaknak megfelelően, az elemi esemé- 
nyek tulajdonságaival foglalkozik. 

(a) Bizonyítsa be, hogy az összes lehetséges elemi esemény egyesítése logikai- 
lag megegyezik az igaz állítással. (Segítség: bizonyítékként alkalmazzon 
indukciót a véletlen változók számára vonatkozóan.) 

(b) Bizonyítsa be, hogy bármely állítás logikailag ekvivalens azon elemi esemé- 
nyek diszjunkciójával, amelyek maguk után vonják annak igazságát. 
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13.5. 


13.6. 


13.7. 


13.8. 


13.9. 


13.10. 


13.11. 


Képzeljük el a szokványos 52 lapos kártyacsomagból osztott ötlapos póker 

játszmák tartományát, annak feltevésével, hogy az osztó becsületes. 

(a) Hány elemi eseményt tartalmaz az együttes valószínűség-eloszlás (azaz 
hányféle 5 lapos leosztás létezik egy kézben)? 

(b) Mekkora a valószínűsége az egyes elemi eseményeknek? 

(c) Mekkora a valószínűsége a felül ászos színsornak (royal flush, egyszínű ász, 
király, dáma, bubi és tízes)? És négy egyforma lapnak? 


Számítsa ki az alábbiakat, ha adott a 13.3. ábra szerinti teljes együttes valószí- 
nűségi eloszlás. 

(a) P(fogfájás) 

(b) P(Lyuk) 

(c) P(Fogfájásllyuk) 

(d) P(Lyuklfogfájás v beakadás) 


Mutassa meg, hogy a függetlenség (13.8) egyenlet szerinti három felírási mód- 
ja ekvivalens egymással. 


Az évenként esedékes orvosi ellenőrzése után a doktor rossz és jó híreket mond. 
A rossz hír az, hogy komoly betegséget mutattak ki önnél, és a teszt 9990-ban meg- 
bízható (azaz, annak a valószínűsége, hogy a teszt kimutatja a meglevő betegséget. 
0.99, és ugyanígy, annak a valószínűsége, hogy a teszt negatív lesz, amennyiben 
nem áll fenn a betegség, szintén 0,99). A jó hír az, hogy ez a betegség nagyon rit- 
ka, amelyet az Ön korában minden 10 000 emberből csak egy kap meg. Miért jó 
hír az, hogy a betegség ritka? Mekkora az esélye annak. hogy Ön tényleg beteg? 


Sokszor célszerűbb adott állítások hatását bizonyos rögzítettnek feltételezett ál- 
talános háttértények feltételezésével végiggondolni, mint az információ teljes 
hiányában. Az alábbi kérdések a szorzatszabály és a Bayes-tétel általános alak- 
jainak bizonyítását célozzák, valamely e háttértény feltételezése mellett. 
(a) Bizonyítsa be az általános szorzatszabály valamely feltétel fennállása ese- 
tén felírható alakját: 
P(X, Fe) — P(XIY,e)P(rle) 


(b) Bizonyítsa be a Bayes-tétel (13.10) egyenlet szerinti, valamilyen feltétel 
fennállása esetére felírt változatát. 

Mutassa meg, hogy a 
P(A, BIC) — P(AJOP(BIC) 

állítás mindkét alábbi állítással egyenértékű 
P(AIB,C) — P(AIC) és P(BJA,C) — P(BIC) 


Tegyük fel. hogy kapott egy n darab egyforma pénzérmét tartalmazó zsákot. 
Azt is tudjuk, a pénzek közül n-1 szabályos, azaz egyik oldalán fej, a má- 
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13.12. 


13.13. 


13.14. 


13.15. 


13. BIZONYTALANSÁG 


sikon írás található, ugyanakkor van egy darab hamis, amelynek mindkét ol- 

dala fej. 

(a) Tegyük fel, hogy benyúl a zsákba. majd véletlenszerűen kiemel egy pénz- 
darabot. Ezt feldobva fejet kap eredményül. Mekkora a (feltételes) valószí- 
nűsége annak, hogy a kivett pénzdarab a hamis? 

(b) Tegyük fel, hogy £-szor folytatva a pénz feldobását, ezután is minden alka- 
lommal fejet kap. Most mennyi lesz a feltételes valószínűsége annak, hogy 
a kivett pénzdarab a hamis? 

(c) Tegyük fel, hogy a k-szori feldobással akarta eldönteni, hogy a hamis vagy 
egy jó pénzérmét emelt ki a zsákból. A döntési eljárás HAMIS-at ad, ha mind 
ak feldobás alkalmával a fej van fölül, egyébként pedig JÓ-t. Mekkora an- 
nak a (feltétel nélküli) valószínűsége, hogy az eljárás tévedni fog? 


Ebben a feladatban befejezheti az agyhártyagyulladásra vonatkozó példa nor- 
malizálását. Először is vegyen fel egy megfelelő értéket P(SI-M)-re, és ennek 
segítségével számítsa ki P(MIS) és P(-MIS) normalizálatlan értékeit (azaz ne ve- 
gye figyelembe P(S)-t a Bayes-tétel kifejezésében), majd normalizálja az érté- 
keket úgy. hogy összegük 1 legyen. 


Ez a feladat azt vizsgálja, hogy a feltételes függetlenség fennállása hogyan be- 

folyásolja a valószínűségi becslésekhez szükséges információ mennyiségét. 

(a) Tegyük fel, hogy P(ftlej,e2)-t szeretnénk kiszámítani úgy, hogy nincs felté- 
teles függetlenségre vonatkozó információnk. Az alábbiak közül melyik az 
az adathalmaz, amelyikre a számításokhoz szükségünk van? 


(1) P(E, E), PG), PE), P(E2]H) 
(ii) P(E), E), PC), P(E,, ExlFD) 
(iii) P(A), PCEJl7), PCE2lD) 


(b) Tegyük fel, hogy tudjuk, hogy P(E,IH. E.) — P(ElH), H, E, E, minden 
értékére. Hogyan változik az előbbi kérdésre adott válasz? 


X, Y és Z legyenek logikai véletlen változók. A P(X, Y, Z) együttes eloszlás 
nyolc lehetséges esetét jelöljük a, ..., h-val. Fejezze ki az ,X és Y adott Z mel- 
lett feltételesen függetlenek" állítást az a, ..., h-t összekapcsoló egyenletek se- 
gítségével. Hány lesz ezek közül redundanciamentes? 


(A (Pearl, 1988)-ból átvéve.) Képzeljük el, hogy Ön egy éjszakai taxis cserben- 
hagyásos baleset tanúja Athénban. Athénban minden taxi kék vagy zöld. Ön azt 
vallja eskü alatt, hogy a taxi kék volt. Egy széles körű vizsgálat azt mutatja, 
hogy ilyen gyenge fényben a kék és zöld szín közötti tévesztés valószínűsége 
7599. Kiszámítható-e, hogy milyen színű taxi volt a legvalószínűbb? ( Segítség: 
gondosan különböztessük meg azt az állítást. hogy a taxi kék, és azt, hogy a taxi 
kéknek tűnik.) 
Mi van akkor, ha minden 10 athéni taxiból 9 zöld? 


13.8. ÖSSZEFOGLALÁS begő 


13.16. (A (Pearl, 1988)-ból átvéve.) Három fegyenc, A, B és C celláikba vannak zárva. 
Közismert, hogy egyiküket másnap ki fogják végezni, míg a másik kettő kegyel- 
met kap. Azt, hogy kit végeznek ki, csak a börtönigazgató tudja. A fegyenc egy 
kéréssel fordul a börtönőrhöz: , Legyen szíves, kérdezze meg az igazgatótól, 
hogy kit fognak holnap kivégezni, és a barátaim közül az egyiknek, B-nek vagy 
C-nek árulja el, hogy reggel kegyelmet fog kapni." Az őr beleegyezik, majd 
később azzal jön vissza, hogy 8-nek szólt a kegyelemről. 

Mekkorák A esélyei a kivégzésre a történtek után? (Ne csak erőteljes kézle- 
gyintéssel. hanem matematikailag megalapozottan válaszoljon.) 


13.17. Írja meg azt az általános, naiv Bayes-eloszlást használó algoritmust, amely alkal- 
mas P(Okle) alakú keresések megválaszolására. Fel kell tételeznie azt is, hogy az 
€ bizonyíték az érintett változók tetszőleges részhalmazához rendel értékeket. 


13.18. A szövegosztályozás olyan feladat, amely egy adott dokumentumot — a benne levő 
szöveg alapján — előre rögzített kategóriák valamelyikébe sorol be. Erre gyakran 
használnak naiv Bayes-modellt. Ezekben a modellekben a lekérdezés változója a 
dokumentumkategória és az , okozati" változók a nyelv egyes szavainak megléte 
vagy hiánya. Feltételezzük azt is, hogy a szavak egymástól függetlenül, a doku- 
mentumkategóriára jellemző sűrűséggel jelennek meg a szövegekben. 

(a) Magyarázza el pontosan, hogyan lehet egy ilyen modellt létrehozni, ha 
tanító mintaként" adott egy, már osztályozott dokumentumhalmaz. 

(b) Magyarázza el pontosan, hogyan történik egy új dokumentum besorolása, 

(c) Elfogadható-e a függetlenség feltételezése? Részletezze. 


13.19. A wumpus világ vizsgálatánál abból a tényből indultunk ki, hogy a négyzetek 
a többi négyzet tartalmától függetlenül 0,2 valószínűséggel tartalmaznak csap- 
dát. Ehelyett most tegyük fel, hogy az [1, 1]-en kívüli A négyzetben pontosan 
N/5 csapda van egyenletes eloszlásban véletlenszerűen elhelyezve. Függetle- 
nek-e továbbra is a C; j és a Cx y változók? Hogyan fog most kinézni a P(Ci 4, 
..x Cg 4) együttes eloszlás? Számolja újra az [1, 3] és a (2, 2] négyzetekben ta- 
lálható csapda valószínűségét. 


14. VALÓSZÍNŰSÉGI KÖVETKEZTETÉS 


Ebben a fejezetben ismertetjük, hogyan építhetők olyan következtető rendszerek, 
amelyek hálós modelleket használnak a bizonytalanságnak a valószínűség-számítás 
törvényeinek megfelelő kezelésére. 


A 13. fejezetben bemutattuk a valószínűség-számítás szintaxisát és szemantikáját. Kü- 
lön hangsúlyoztuk a függetlens. a feltételes függetlenségi kapcsolatok fontosságát 
a világ valószínűségi reprezentációjának az egyszerűsítésében. Ez a fejezet egy sziszte- 
matikus módszert vezet be az ilyen relációk explicit reprezentálására, a Bayes-hálók 
formájában. Ezeknek a hálózatoknak definiáljuk a szintaxisát és szemantikáját, és meg- 
mutatjuk, hogyan használhatók fel bizonytalan tudás megragadására természetes és ha- 
tékony módon. Ezt követően ismertetjük, hogyan végezhető el a valószínűségi követ- 
keztetés, ami bár legrosszabb esetben exponenciális komplexitású, a gyakorlatban sok 
esetben hatékonyan alkalmazható. Leírunk továbbá különböző közelítő következtető 
algoritmusokat, amelyek gyakran akkor is alkalmazhatók, amikor egzakt következtetés 
nem lehetséges. Megvizsgálunk olyan módszereket is, hogy hogyan alkalmazható a való- 
színűség-számítás egy objektumokat és relációkat is tartalmazó világra — azaz az ítéletlo- 
gikával szemben az elsőrendű reprezentációkra. Végül áttekintjük a bizonytalan követ- 
keztetés egyéb alternatív megközelítéseit. 





14.1. A TUDÁS REPREZENTÁLÁSA 
BIZONYTALANSÁG ESETÉN 


A 13. fejezetben láttuk, hogy az együttes valószínűség-eloszlás függvény alapján minden 
kérdés megválaszolható a modellezett tárgytartománnyal kapcsolatban, de a változók szá- 
mának növekedésével ez általában kivitelezhetetlenné válik. Továbbá az elemi ese- 
mények valószínűségének megadása is igen mesterkélt és nehéz is lehet. hacsak nem áll 
rendelkezésre nagy mennyiségű adat a valószínűségek statisztikai becsléséhez. 

A változók közötti függetlenségi és feltételes függetlenségi relációkkal kapcsolatban 
azt is láttuk, hogy ezek nagyban csökkenthetik az együttes valószínűség-eloszlás függ- 
vény megadásához szükséges valószínűségek számát. Ez a fejezet bevezet egy Bayes- 
hálónak (Bayesian network! ) nevezett adatstruktúrát a változók közötti függőség leírá- 
sához, és bármely együttes valószínűség-eloszlás függvény tömör megadásához. 


1 Az angol nyelvű szakirodalomban a Bayes-háló a legelterjedtebb megnevezés, de számos más is létezik: 
bizonyosságháló (belief network), valószínűségi háló (probabilistic network), okozati háló (causal 
network), tudásháló (knowledge map). A statisztikában a gráfos modell (graphical model) bővebb modell- 
osztályt jelent, ami a Bayes-hálót is magában foglalja. A Bayes-hálók egy kiterjesztésének neve a döntési háló 
(decision network) vagy hatásdiagram (infiuence diagram) — lásd 16. fejezet. 
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A Bayes-háló egy irányított gráf, amelyben minden csomóponthoz számszerű való- 
színűségi információk vannak csatolva. A teljes megadás a következő: 


1. A háló csomópontjait valószínűségi változók egy halmaza alkotja. A változók lehet- 
nek diszkrétek vagy folytonosak. 

2. Irányított élek (nyilak) egy halmaza összeköt bizonyos csomópontpárokat. Ha léte- 
zik nyíl az X csomóponttól az Y csomópontig, azt mondjuk, hogy az X a szülője az 
Y-nak. 

3. Minden X; csomóponthoz tartozik egy P(X./Szülők(XI)) feltételes valószínűség- 
eloszlás, ami számszerűen megadja a szülők hatását a csomóponti változóra. 

4. A gráf nem tartalmaz irányított kört (azaz irányított, körmentes gráf — Directed, 
Acyclic Graph, DAG). 


A háló topológiája — a csomópontok és élek halmaza — megadja a tárgyterületen fenn- 
álló feltételes függetlenségi kapcsolatokat, hogy mily módon, azt hamarosan pontosan 
kifejtjük. Egy helyesen létrehozott hálóban az X csomópontot az Y csomóponttal össze- 
kötő nyíl intuitív jelentése rendszerint az, hogy az X-nek közvetlen befolyása van az 
Y-ra, A tárgyterület szakértője számára általában könnyű eldönteni, hogy milyen köz- 
vetlen befolyások teljesülnek egy adott területen - valójában sokkal könnyebb, mint a 
megfelelő valószínűségeket megadni. Ha pedig a Bayes-báló topológiája kész, már csak 
az egyes változókhoz tartozó feltételes valószínűség-eloszlásokat kell megbatározni a 
szülőkkel mint feltételekkel. Látni fogjuk, hogy a topológia és a feltételes eloszlások 
együttese elegendő, hogy megadja (implicit módon) az összes változó feletti együttes 
valószínűség-eloszlás függvényt. 

Idézzük fel a 13. fejezetben leírt egyszerű világot, amely a Fogfájás, a Lyuk, a Be- 
akadás és az Időjárás változót tartalmazza. Úgy érveltünk, hogy az Időjárás függet- 
len az összes többi változótól; továbbá, hogy a Fogfájás és a Beakadás feltételesen 
függetlenek a Lyuk ismeretében. Ezeket a viszonyokat a 14.1. ábrán bemutatott 
Bayes-háló reprezentálja. Formálisan, a Fogfájás és a Beakadás feltételes független- 
ségét a Lyuk ismeretében a Fogfájás és a Beakadás közötti nyíl hiánya jelzi. Szemlé- 
letesen, a háló azt a tényt fejezi ki, hogy a Lyuk közvetlen oka a Fogfájás-nak és a 
Beakadás-nak, további közvetlen okozati kapcsolat azonban nem létezik a Fogfájás 
és a Beakadás között. 

Most vizsgáljuk meg a közvetkező példát, ami csak egy árnyalatnyival 
öszetettebb. Otthonunkban egy új betörésjelzőt szereltek fel. Ez megbízhatóan ész- 
leli a betöréseket, de időnként kisebb földrengések esetén is jelez. (Ez a példa Judea 
Pearltől származik, aki Los Angeles-i lakos: innen ered a földrengések iránti külö- 


Időjárás 


14.1. ábra. Egy egyszerű Bayes-háló, amelyben az [dőjárás független a többi három változótól, a Fog- 
ájás és a Beakadás pedig feltételesen függetlenek a Lyuk ismeretében 
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nös érdeklődése.)? Két szomszédunk is van, János és Mária, akik megígérték, hogy 
felhívnak a munkahelyünkön, ha meghallják a riasztónkat. János mindig felhív min- 
ket, ha meghallja a riasztást, de néha összekeveri a telefoncsörgést a riasztó csengé- 
sével, és ekkor is telefonál. Mária viszont, mivel szereti hangosan hallgatni a zenét, 
néha meg sem hallja a riasztót. Mi tehát a hívások bekövetkezte vagy hiánya alap- 
ján szeretnénk megbecsülni a betörés valószínűségét. Ezt az egyszerű problémát a 
14.2. ábrán látható Bayes-háló írja le. 








fe. 





JánosTelefonál 


14.2. ábra. Egy típikus Bayes-háló, amely a topológiát és a feltételes valószínűségi táblákat (FVT) is 
mutatja. Az FVT-kben 8, F, R. J és M szerepel Betörés, Földrengés, Riasztás, JánosTelefonál és 
MáriaTelefonál helyett, 











Egyelőre hagyjuk figyelmen kívül az ábrán szereplő feltételes eloszlásokat, és össz- 
pontosítsunk a háló topológiájára. A betörés háló esetén a topológia azt mutatja, hogy a 
betörés és a földrengés közvetlenül befolyásolja a riasztó megszólalásának valószínűísé- 
gét, ellenben János vagy Mária hívásának bekövetkezése csak magán a riasztón múlik. 
A báló így tartalmazza azon feltevéseinket, hogy ők közvetlenül nem vesznek észre be- 
töréseket, nem vesznek észre kisebb földrengéseket, és nem egyeztetnek hívás előtt. 

Megfigyelhető, hogy a hálóban nincsenek olyan csomópontok, amelyek azt írnák le, 
hogy Mária éppen hangos zenét hallgat, vagy hogy a telefon cseng, és megzavarja Já- 
nost. Ezeket a tényezőket a Riasztás csomóponttól a JánosTelefonál és MáriaTelefonál 
csomópontíg tartó élekhez rendelt bizonytalanság foglalja magában. Ebben mind a 1us- 
taság, mind pedig a tudatlanság tetten érhető: rengeteg munka volna olyan tényezők 
meghatározása, amelyek valószínűbbé vagy kevésbé valószínűvé válnának adott ese- 
tekben, és nincs semmilyen ésszerű módszerünk, hogy ezekre vonatkozóan érdemi 
információt szerezzünk. A valószínűségek valójában a lehetséges körülmények egy 
potenciálisan végtelen halmazát összegzik, amikor is a riasztó elmulaszt megszólalni 


2 fudea Pearl meghatározó szerepet játszott a Bayes-hálók egzakt matematikai hátterének és gyakorlati 
alkalmazhatóságának a vizsgálatában. (A ford.) 
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(magas páratartalom, elektromos hálózat hibája, lemerült elem, elvágott drót, döglött 
egér beragadva a csengőbe...), vagy, hogy János és Mária elmulaszt értesíteni minket 
(ebédelni mentek, szabadságon vannak, időlegesen megsüketültek, egy áthaladó heli- 
kopter...). Ezen a módon egy kis ágens is képes megbirkózni egy igen bonyolult világ- 
gal, legalábbis közelítőleg. A közelítés mértéke tetszőlegesen javítható további releváns 
információk bevezetésével. 

Most folytassuk a 14.2. ábrán mutatott feltételes eloszlásokkal. Az ábrán minden el- 
oszlás mint feltételes valószínűségi táblázat — FVT (conditional probability table, 
CPT) van feltüntetve. (A táblázatos formát diszkrét változók esetén lehet használni; 
más reprezentációkat, amelyek már folytonos változóknál is használhatók, a 14.2. 
alfejezetben írunk le.) Az FVT-táblázatban minden sor az egyes csomóponti értékek fel- 
tételes valószínűségét tartalmazza az adott sorhoz tartozó szülői feltétel (conditioning 
case) esetén. A szülői feltétel a szülő csomópontok értékeinek egy lehetséges kombi- 
nációja (egyfajta elemi esemény, ha úgy tetszik). Az egyes sorokban szereplő számok 
összegének 1-et kell adnia, mivel az adott változó összes lehetséges értéke szerepel 
a bejegyzésekben. Bináris változók esetén, ha ismerjük, hogy az igaz érték valószínű- 
sége p, a hamis érték valószínűségének 1 — p-nek kell lennie, így gyakran a második 
számot elhagyjuk, ahogyan ezt a 14.2. ábrán is tettük. Általánosabban, egy k bináris 
szülővel rendelkező bináris változó esetén 2 valószínűség adható meg tetszés szerint. 
Szülő nélküli csomópontok esetén a táblázat csak egyetlen sort tartalmaz, a változó 
egyes értékeinek a priori valószínűségeit. 
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Az előző alfejezetben bemutattuk a hálót, de annak jelentését nem. A Bayes-hálók 
szemantikáját kétféle módon lehet megérteni. Az első szerint a háló az együttes való- 
színűség-eloszlás függvény egy leírása. A második szerint a háló feltételes független- 
ségekről szóló állítások együttesét írja le. A két szemlélet ekvivalens, de az első inkább 
abban segít, hogyan hozzunk létre egy hálót. míg a második a következtetési eljárások 
tervezését segíti. 


Az együttes valószínűség-eloszlás függvény leírása 


A Bayes-háló a tárgytartomány teljes leírását adja meg. A benne található információk 
segítségével az együttes valószínűség-eloszlás függvény bármely bejegyzése kiszámít- 
ható.) Az együttes valószínűség-eloszlás függvény egy általános bejegyzése egy teljes 
— minden egyes változóhoz történő — hozzárendelés konjunkciójának a valószínűsége, 
úgymint P(Xj — xy A ... A X,, — x). Erre a továbbiakban a P(x, ..., xn) rövidítést fog- 
juk használni. Egy bejegyzés értékét a következő egyenlőség adja meg: 


PC... Xn) — JT [POAAuzhor (14.1) 


í—I 


3 A diszkrét változókra utaló szóhasználat ellenére az állítások analógjai folytonos változók esetén is fenn- 
állnak. (A ford.) 
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ahol a szülők(X;) a Szülők(X)-ben szereplő változók adott értékeinek együttesét jelöli. 
Így az együttes valószínűség-eloszlás függvényt leíró táblázat minden bejegyzése a Bayes- 
hálóban szereplő, feltételes valószínűségi táblák (FVT) megfelelő elemeinek a szorzata. 
Ezzel az FVT-k valójában az együttes valószínűség-eloszlás függvény dekomponált le- 
írását adják meg. Ennek illusztrálására kiszámítjuk annak az eseménynek a valószínű- 
ségét, hogy a riasztó megszólal, de nem volt sem betörés, sem földrengés, azonban Já- 
nos és Mária is telefonál. A kezdőbetűkkel jelölve a változókat: 


PfjAmAaN-bA-e) 
— P(jlaP(mla)P(al-b A -e)P(-—b)P(-e) 
— 090 x 0.70 x 0.001 x 0.999 x 0,998 — 0,00062 


A 13.4. alfejezetben bemutattuk, hogy az együttes valószínűség-eloszlás függvény 
alapján a tárgytartománnyal kapcsolatos bármely kérdés megválaszolható. Ha egy 
Bayes-háló leírja az együttes valószínűség-eloszlás függvényt, akkor ez alapján bár- 
mely kérdés megválaszolható, összegezve a releváns együttes bejegyzéseket. A 14.4. 
alfejezet elmagyarázza, hogy ez hogyan végezhető el, azonban sokkal hatékonyabb 
módszereket is ismertet. 


Egy módszer Bayes-hálók építésére 


A (14.1) egyenlet definiálja, hogy mit is jelent egy adott Bayes-háló. Azonban arra 
nézve nem ad felvilágosítást, hogyan építhetünk olyan Bayes-hálót, hogy az általa 
meghatározott együttes valószínűség-eloszlás függvény az adott tárgytartomány meg- 
felelő leírása legyen. Most megmutatjuk, hogy a (14.1) egyenlet tartalmaz bizonyos 
feltételes függetlenségi relációkat, amelyeket a tudásmérnök felhasználhat a háló to- 
pológiájának meghatározásánál. Elsőként írjuk fel az együttes valószínűség-eloszlás 
függvényt feltételes valószínűségek szorzataként, felhasználva a szorzatszabályt (lásd 
13. fejezet: 


P(XIs sss XX) 7 POlxn-as sss XDPG-ts 30) 
Majd ismételten alkalmazzuk ezt a lépést, minden egyes együttes valószínűséget fel- 


bontva egy feltételes valószínűségre és egy kisebb együttes valószínűségre. Végezetül 
egyetlen hosszú szorzatot kapunk: 


P(x css Xn) — PCxplxnats hess XPCX n—alkn—25 heg) tt Peak Pia) 
n 


7II PClgars s 31) 


Ez a fáácssábálkékt (chain rule) ismert azonosság valószínűségi változók bármely 
halmazára fennáll. 

Összehasonlítva ezt a (14.1.) egyenlettel láthatjuk, hogy az együttes valószínűség-el- 
oszlás függvény megadása ekvivalens azzal az általános állítással, hogy a háló minden 
X; változójára 


P(XIIXI.1. ... X1) — PCXÁSZÜLÖR(XI)) (14.2) 
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feltéve, hogy Szüfők(X) C (X;.1, -..s X11. Ez utóbbi feltétel a csomópontok bármely 
olyan sorszámozásával teljesíthető, ami konzisztens a gráf struktúrájából adódó impli- 
cit részleges rendezéssel. 

A (14.2) egyenlet szerint, egy Bayes-háló csak abban az esetben lehet helyes reprezen- 
tációja a tárgytartománynak, ha az adott szülők mellett, minden csomópont feltételesen 
független a csomópontot sorrendezésben őt megelőzőktől. Így a tárgytartomány struk- 
túrájának megfelelő Bayes-háló megépítése során, minden egyes csomóponthoz úgy kell 
a szülőket megválasztanunk, hogy ez a feltétel teljesüljön. Szemléletesen ez azt jelenti, 
hogy az X; csomópont szülei halmazának tartalmaznia kell az (XI. ..., X.-1) közül mind- 
azokat a csomópontokat, amelyek közvetlenül befolyásolják X;-t. Például tételezzük fel, 
hogy a 14.2. ábrán látható hátót már teljesen befejeztük. csupán a MáriaTelefonál szüleit 
kell még megválasztanunk. A MáriaTelefonál-t egyértelműen befolyásolja, hogy történt- 
e Betörés vagy Földrengés, de nem közvetlenül. A helyzettel kapcsolatos ismereteink 
alapján tudhatjuk, hogy ezek az események csak a riasztó által befolyásolhatják Mária 
telefonálással kapcsolatos viselkedését. Hasonlóan, ha a riasztó állapota ismert, akkor 
János hívásának bekövetkezte vagy elmaradása már nincs hatással Mária telefonálására. 
Formálisan fogalmazva, úgy véljük, hogy a következő feltételes függetlenség teljesül: 


P(MáriaTelefonállJánosTelefonál, Riasztás, Földrengés, Betörés) 
— P(MáriaTelefonállíiasztás) 





Tömörség és a csomópontok sorrendje 


Amellett hogy egy teljes és nem redundáns reprezentációja a tárgytartománynak, egy 
Bayes-háló gyakran sokkal tömörebb, mint az együttes valószínűség-eloszlás függ- 
vény. Ez a tulajdonsága teszi használhatóvá a sokváltozós tárgyterületek kezelésében. 
A Bayes-háló tömörsége a lokálisan strukturált (locally structured) (vagy ritka — 
sparse) rendszerek egy igen általános tulajdonságának példája. Egy lokálisan struktu- 
rált rendszerben egy komponens csak korlátos számú más komponenssel van kapcso- 
latban közvetlenül, függetlenül a komponensek teljes számától. Lokális struktúrákhoz 
általában inkább a lineáris, mint az exponenciális komplexitásnövekedés kapcsolható. 
A Bayes-háló esetében jogos azt feltételezni, hogy a legtöbb tárgytartomány esetén 
egy valószínűségi változót csak k számú más változó befolyásol, ahol k konstans. Ha 
bináris változókat tételezünk fel az egyszerűség kedvéért, akkor az egy csomópont- 
hoz tartozó feltételes valószínűségi tábla megadásához legfeljebb 24 érték szükséges, 
így a teljes háló n2? értékkel megadható. Ezzel szemben az együttes valószínűség- 
eloszlás függvény 2" értéket tartalmaz. Egy konkrét példával élve, ha 30 csomópontunk 
van (n — 30), és mindegyiknek legfeljebb 5 szülője van (k — 5), akkor a Bayes-háló 
960 számot igényel, míg az együttes valószínűség-eloszlás függvény több mint egy 
milliárdot. 

Léteznek olyan tárgytartományok, ahol a változók mindegyikét közvetlenül befo- 
lyásolhatja az összes többi, így a háló teljesen összekötött. A feltételes valószínűségi 
táblák megadása ekkor ugyanakkora mennyiségű információt igényel, mint az együt- 
tes valószínűség-eloszlás függvény megadása. Bizonyos tárgytartományokban létez- 
nek olyan gyenge függőségek, amiket feltétlenül modellezni kell egy új kapcsolat 
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felvételével. De ha ezek a függőségek igen gyengék, akkor lehet, hogy nem éri meg a 
háló komplexitását megnövelni a pontosság kismértékű növelésének érdekében. Pél- 
dául a betöréses hálónkkal kapcsolatban kifogásolható az, hogyha földrengés van, ak- 
kor Mária és János akkor sem telefonálna, ha hallanák a riasztót, mivel feltételezik, 
hogy a földrengés okozta. Az, hogy hozzákapcsoljuk-e a Földrengés-t a MáriaTele- 
fonál-hoz és a JánosTelefonát-hoz (és így megnöveljük a táblákat) azon múlik, hogy 
mennyire fontos pontosabb valószínűségeket kapni, és mennyire költséges meghatá- 
rozni az extra információt. 

Azonban még egy lokálisan strukturált problémánál sem egyszerű lokálisan struktu- 
rált Bayes-hálót felépíteni. Ugyanis nemcsak azt követeljük meg, hogy minden egyes 
változót csak néhány másik befolyásoljon közvetlenül, hanem azt is, hogy a háló topo- 
lógiája valóban mutassa azokat a közvetlen hatásokat a szülők megfelelő megválasztá- 
sával. A konstrukciós eljárásunk működése miatt előbb a , közvetlen befolyásolókat" 
kell a hálóhoz adni, ha azt szeretnénk, hogy szülőknek tudjuk őket választani az általuk 
befolyásolt csomópontnál. Ezért a helyes sorrend a csomópontok hozzáadásánál az, 
hogy először az , alapvető okokat" adjuk a hálóhoz, majd a változókat, amelyeket be- 
folyásolnak, és ezt addig folytatjuk, amíg el nem érjük a , leveleket", amelyeknek már 
nincs közvetlen okozati hatása más változókra. 

Mi történik, ha történetesen rossz sorrendet választunk? Vizsgáljuk meg újra a betö- 
réses példát. Tételezzük fel, hogy a változókat a következő sorrendben adjuk a hálóhoz: 
MáriaTelefonál, JánosTelefonál, Riasztás, Betörés, Földrengés. Ekkor egy kicsit bo- 
nyolultabb hálót kapunk (14.3. (a) ábrán). Az eljárás a következő: 


s  MáriaTelefonál hozzáadása: szülők nincsenek. 

,  JánosTelefonál hozzáadása: ha Mária telefonál, az valószínűleg azt jelenti, hogy a 
riasztó megszólalt, ami természetesen valószínűbbé teszi, hogy János telefonáljon. 
Így a JánosTelefonál-nak szükségszerűen szülője a MáriaTelefonál. 








MáriaTelefonál 






MáriaTelefonál 


JánosTelefonál 


Földrengés 


Betörés 





Földrengés 


(a (b) 


14.3. ábra. A háló struktúrája függ a hozzáadás sorrendjétől. A csomópontokat mindegyik hálóhoz fe- 
lülről lefelé haladva adtuk hozzá. 
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" Riasztás hozzáadása: nyilvánvaló, ha mindketten telefonálnak, akkor valószínűbb, 
hogy a riasztó megszólalt, mintha csak egyikük, vagy egyikük sem. Így mind a 
JánosTelefonál. mind a MáriaTelefonál szükséges mint szülő. 

.  Betörés hozzáadása: ha ismerjük a riasztó állapotát, akkor a Jánostól vagy Máriától 
jövő telefonhívások léte vagy hiánya csupán azt jelezhetik, hogy cseng-e a telefo- 
nunk, vagy hogy Mária zenéje hangosra van-e állítva, de a betörésről nem nyújtanak 
további információt. Azaz 


P(BetöréslRiasztás, JánosTelefonál, MáriaTelefonál) — P(BetöréslRiasztás) 


Így csak a Riasztás szükséges mint szülő. 

" Földrengés hozzáadása: ha a riasztó bekapcsolt, akkor valószínűbb, hogy bekövet- 
kezett egy földrengés (mivel a riasztó valamiféle földrengésészlelő). De ha tudjuk, 
hogy betörés történt, akkor ez megmagyarázza a riasztást, és a földrengés valószínű- 
sége csak picit nagyobb a normálisnál. Így a Betörés és a Riasztás is szükséges mint 
szülő. 


A kiadódó hálónak kettővel több éle van, mint az eredetinek a 14.2. ábrán, és há- 
rommal több valószínűség meghatározását igényli. Ami még rosszabb, hogy néhány 
kapcsolódás megfoghatatlan viszonyt reprezentál, ami nehéz és nem természetes való- 
színűségi ítéleteket igényel, például a Földrengés feltételes valószínűségének a meg- 
becslését, a Betörés és a Riasztás feltételekkel. Ez a jelenség igen általános, és kap- 
csolódik az okozati és diagnosztikai modelleknek a 8. fejezetben bevezetett megkü- 
lönböztetéséhez. Ha úgy próbálunk meg egy diagnosztikai modellt megépíteni, hogy a 
kapcsolatok okozat-ok irányúak (mint például a MáriaTelefonál-tól a Riasztás-ig vagy 
a Riasztás-tól a Betörés-ig kapcsolat), akkor végül egyébként független okok között 
kell függést meghatároznunk (és gyakran a különállóan bekövetkező okozatok között 
is). Ha ragaszkodunk az okozati modellhez, akkor kevesebb értéket kell megadnunk, és 
az értékeket általában könnyebb meghatározni. Orvosi tárgytartrományon például 
Tversky és Kahneman demonstrálta, hogy orvos szakértők szívesebben hoznak való- 
színűségi ítéleteket okozati, mint diagnosztikai összefüggések esetén (Tversky és 
Kahneman, 1982). 

A 14.3. (b) ábra a változók igazán szerencsétlen sorrendjét mutatja: MáriaTelefonál, 
dJánosTelefonál, Földrengés, Betörés, Riasztás. Ez a háló 31 önálló valószínűség meg- 
határozását igényli — pontosan annyit, amennyi a teljes együttes valószínűség-eloszlás 
függvény megadása. Azonban fontos felismerni, hogy a három háló bármelyike képes 
pontosan ugyanannak az együttes valószínűség-eloszlás függvénynek a reprezentálásá- 
ra. A két utóbbi egyszerűen csak nem reprezentálja az összes feltételes függetlenségi re- 
lációt, és így rengeteg szükségtelen érték meghatározására kényszerül. 


Feltételes függetlenségi relációk Bayes-hálókban 


A Bayes-hálókra egy , numerikus" szemantikát adtunk meg a teljes együttes eloszlás 
reprezentációjának a szempontjából, mint a (14.1) egyenletben. Ezt a szemantikát alkal- 
mazva a Bayes-hálók konstrukciós módszereinek a származtatásánál azt a következményt 
kaptuk, hogy egy csomópont feltételesen független az őt megelőzőktől, ha a csomópont 
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szülői adottak. Kiderül, hogy más módon is eljárhatunk. Elindulhatunk egy , topoló- 
giai" szemantikától, ami a gráf által kódolt feltételes függetlenségi relációkat adja meg, 
és ezekből származtatjuk a , numerikus" szemantikát. A topológiai szemantikát a követ- 
kező két egymással ekvivalens meghatározás bármelyike rögzíti: 


1. Egy csomópont feltételesen független a nem leszármazottaitól (non-descendants), 
feltéve, hogy a szülei adottak. Például a 14.2. ábrán JánosTelefonál független a 
Betörés-től és a Földrengés-től, ismerve a Riasztás értékét. 

2. Egy csomópont feltételesen független az összes többi csomóponttól a hálózatban, 
a szülei, gyermekei és gyermeki szüleinek az ismeretében — azaz a Markov-takarójá- 
nak (Markov blanket) ismeretében. Például, a Betörés független JánosTelefonál-tól 
és MáriaTelefonál-tól, a Betörés-t és Földrengés-t ismerve. 


Ezeket a meghatározásokat mulatja be a 14.4. ábra. Ezekből a feltételes függetlenségi ál- 
lításokból és az FVT-kből a teljes együttes eloszlást rekonstruálni lehet: így a . numeri- 
kus" szemantika és a , topológiai" szemantika ekvivalens. 





(a) b 


14.4. ábra. (a) Az X csomópont feltételesen független a nem leszármazottaitól (Zy-ktől) a szülei (a szür- 
ke területen látható U/-k) ismeretében. (b) Az X csomópont feltételesen független a háló összes többi cso- 
mópontjától a Markov-takarójának ismeretében (a szürke terület). 


9 Létezik egy további általános topológiai kritérium a d-elválasztás (d-separation) annak eldöntésére, hogy 
a csomópontok egy X halmaza független-e egy másik Y halmaztól egy harmadik Z halmaz feltétel esetén. 
A kritérium elég bonyolult, és nem szükséges a fejezetben az algoritmusok származtatásánál, ezért nem tárgyal- 
juk. A részletek megtalálhatók Russell és Norvig, valamint Pearl munkáiban (Russell és Norvig, 1995; Pearl, 
1988). Shachter egy sokkal szemléletesebb módszert ad a d-elválasztások meghatározásához (Shachter, 1998). 
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14.3. FELTÉTELES ELOSZLÁSOK HATÉKONY 
REPREZENTÁCIÓJA 


Még ha a szülők maximális száma, k meglehetősen kicsi is, egy csomópont feltételes 
valószínűségi táblájának kitöltése akár 0(2") számú értéket és az összes lehetséges fel- 
tételes esetet figyelembe véve is nagy szakértelmet igényelhet. Valójában azonban az a 
legrosszabb eset, amikor a kapcsolat a szülők és a gyermek között teljesen önkényes. 
Általában az ilyen kapcsolatok egy kanonikus eloszlással (canonical distribution) írha- 
tók le, amelyek valamilyen szabványos mintát követnek. Ilyen esetekben a teljes tábla 
megadható a mintázat és esetleg néhány paraméter meghatározásával — sokkal köny- 
nyebben, mint exponenciális számú paraméter megadásával. 

A legegyszerűbb példát a determinisztikus csomópontok (deterministic nodes) 
szolgáltatják. Egy determinisztikus csomópont értékét a szüleinek az értéke teljesen 
meghatározza, mindenfajta bizonytalanságtól mentesen. A reláció lehet egy logikai 
kapcsolat — például ha a szülőcsomópontok azt jelentik, hogy Kanadai, Egyesült Álla- 
mokbeli és Mexikói, a gyermekcsomópont pedig azt, hogy Észak-Amerikai, akkor a közöt- 
tük lévő kapcsolat egyszerűen a szülők diszjunkciója. A reláció lehet numerikus is — pél- 
dául ha a szülőcsomópontok egy gépkocsi különböző árai különböző forgalmazóknál, 
a gyermekcsomópont pedig az az ár, amit egy legolcsóbbat kereső vevő végezetül fizetne, 
akkor a gyermekcsomópont értéke a szülők értékeinek a minimuma. Másik példa, ha 
a szülőcsomópontok az egy tóba bejövő vízmennyiségek (folyók, vízlevezetők, csapa- 
dék) és az onnan eltávozó vízmennyiségek (folyók, párolgás, elszivárgás), a gyermek 
pedig a tó szintjének a megváltozása, akkor a gyermek értéke a kifolyó és befolyó szü- 
lők értékeinek a különbsége. 

Bizonytalan relációkat gyakran jellemezhetünk úgynevezett , zajos" logikai relációk- 
kal. A mintapélda erre az úgynevezett zajos-VAGY (noisy-OR) reláció, ami a logikai 
VAGY reláció általánosítása. ítéletlogikában kijelenthetjük, hogy a Láz akkor és csak 
akkor igaz, ha a Megfázás vagy az Influenza vagy a Malária igaz. A zajos-VAGY mo- 
dell megenged bizonytalanságot, hogy egyes szülők okozhatják-e a gyermekek igaz ér- 
tékét — az okozati kapcsolat a szülő és gyermek között gárolr lehet, és így lehet, hogy a 
páciens meg van fázva, de nincs láza. A modell két feltevésre épül. Elsőként feltételezi, 
hogy az összes lehetséges ok fel van sorolva. (Ez nem annyira szigorú megkötés, mint 
amilyennek tűnik, mivel mindig létrehozhatunk egy úgynevezett szivárgáscsomópontot 
(leak node), ami , vegyes okokat" fed le.) Másodikként felteszi, hogy bármely szülő gát- 
lása független a többi szülő gátlásától: például akármi is gátolja, hogy a Malária lázat 
okozzon, ez független attól, hogy mi gátolja az Influenzá-t, hogy lázat okozzon. Ezek- 
kel a feltevésekkel a Láz akkor és csak akkor hamis, ha az összes igaz értékű szülő gá- 
tolt, aminek a valószínűsége a gátlás-valószínűségek szorzata. Tételezzük fel, hogy 
ezek az önálló gátlási valószínűségek a következők: 


P(-lázlmegfázás, —influenza, -malária) — 0,6 

P(-lázl megfázás, influenza, -malária) — 0.21 

P(-lázl—megfázás, —influenza, malária) — 0,1 
Ekkor — ennyi információból és a zajos-VAGY feltevésből — a teljes FVT-t fel lehet 
építeni. A következő táblázat azt mutatja, hogy hogyan: 
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Általánosságban, a zajos logikai relációk, amelyekben egy változó k számú szülőtől 
függ, 0(K) paraméterrel írhatók le, a teljes feltételes valószínűség-eloszlás táblázathoz 
tartozó 0(2") helyett. Ez sokkat könnyebbé teszi a becslést és a tanulást. Például a 
CPSC-háló (Pradhan és társai, 1994) zajos-VAGY- és zajos-MAX-eloszlásokat hasz- 
nál a betegségek és tünetek közötti kapcsolatok modellezésére. 448 csomópont és 906 
él esetén ez csak 8254 értéket igényel a 133 931 430 helyett, ami egy teljes FVT-ket 
használó háló esetén lenne szükséges. 


Bayes-hálók folytonos változókkal 


Számos valós problémában fordulnak elő folytonos mennyiségek. mint a magasság, tö- 
meg, hőmérséklet és pénz; valójában a statisztika nagy része olyan valószínűségi válto- 
zókkal foglalkozik, amelyek értéktartománya folytonos. Definíció szerint, a folytonos 
változóknak végtelen számú értéke lehet, így lehetetlen feltételes valószínűségeket 
megadni minden egyes értékre. Egy lehetséges módszer a folytonos változók kezelésé- 
re, ha elkerüljük őket diszkretizálással (discretization) — azaz felosztjuk a lehetséges 
értékeket intervallumok adott halmaza szerint. Például, a hőmérsékletet feloszthatjuk 
(207€), (07€-1007€) és (2.1007€) intervallumokra. A diszkretizálás néha adekvát meg- 
oldás, de gyakran eredményezi a pontosság jelentős romlását, valamint nagyon nagy 
FVT-ket. Egy másik megoldás, ha a valószínűség sűrűségfüggvények alapvető család- 
jaiból választunk (lásd A) függelék), amelyek véges számú paraméterrel megadhatók. 
Például, a Gauss- (vagy normál) eloszláshoz N(j, 0?X3) a , átlag és 0? szórásnégyzet 
tartozik mint paraméterek. 

Egy diszkrét és folytonos változókat is tartalmazó hálót hibrid Bayes-hálónak 
(hybrid Bayesian network) nevezünk. Egy hibrid háló megadásához két újfajta elosz- 
lást kell megadnunk: feltételes eloszlást folytonos változóhoz diszkrét és/vagy folyto- 
nos szülők esetén; továbbá feltételes eloszlást diszkrét változókhoz folytonos szülők 
esetén. Fontoljuk meg a 14.5. ábra egyszerű példáját, amelyben a vásárló valamilyen 
gyümölcsöt vásárol az ára függvényében, ami viszont a termés mennyiségétől függ És 
attól, hogy éppen van-e állami támogatás. Az Ár változó folytonos, a szülei pedig foly- 
tonosak és diszkrétek; a Vásárol változó diszkrét, és van egy folytonos szülője. 

Az Ár változóhoz meg kell adnunk a P(ÁrlTermés, Támogatás) eloszlást. A diszk- 
rét szülőt explicit felsorolással kezeljük — azaz megadjuk mind a P(ÁrlTermés, támo- 
gatás), mind a P(ÁriTermés, —rámogatás) valószínűségeket. A Termés kezeléséhez 
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Gönz B 
Cr 


Cssárob 


14.5. ábra. Egy egyszerű háló diszkrét (Támogatás és Vásárol) és folytonos (Termés és Ár) változókkal 


megadjuk, hogy a c ár feletti eloszlása hogyan függ a t Termés folytonos értékétől. 
Máshogy fogalmazva, az ár eloszlásának a paramétereit a termés t értékének függvé- 
nyében adjuk meg. 

A leggyakoribb választás a lineáris Gauss-eloszlás (linear Gaussian), amelyben a 
gyermek Gauss-eloszlású, ahol a ,z várható érték lineárisan változik a szülő értékével, 
és ahol a ő szórás rögzített. Két eloszlásra van szükségünk, a támogatás és a -támoga- 
tás esetére különböző paraméterekkel: 

-4eerrb)jz 
1 FERT 


P(elt támogatás) — N(ajt b ,oP)(c)—— —e 

telntámogatás) — Ntazt ro s 
1 (ESR 1,t-tb, 2) 
Ptelt, támogatás) — N(ajt t-bp,op)tc)- —— e 

(el GYE NA EB ETVE E ee 
Ebben a példában ekkor, az Ár feltételes eloszlását a lineáris normális eloszlás kiválasz- 
tásával és az a;, b;, 0, ap bp és c paraméterekkel adhatjuk meg. A 14.6. (a) és (b) ábra 
mutatják ezt a két kapcsolatot. Figyeljük meg, hogy mindegyik esetben a meredekség 
negatív, mivel az ár csökken a kínálat növekedésével. (Természetesen a linearitás fel- 
tevése azt is jelenti, hogy az ár egy bizonyos pontnál negatív lesz; a lineáris modell csak 
akkor ésszerű, ha a termés mennyiségét egy szűk tartományra korlátozzuk.) 
A 14.6. (c) ábra a P(cIt) eloszlást mutatja, átlagolva a Támogatás két lehetséges értéke 
felett feltételezve, hogy mindegyik a priori valószínűsége 0.5. Ez mutatja, hogy még 
igen egyszerű modellekkel is, elég érdekes eloszlások reprezentálhatók. 











Ptelh. támogatás) Pxcih. támogatás 

04 04 

03 03 

02 £. ev 

01 01 3 
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Árc "10 OTermésh Felis Termés h 
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14.6. ábra. Az (a) és (b) grafikonok az Ár valószínűség-eloszlását mutatják a Termés függvényében és a 
Támogatás igaz és hamis értéke mellett. A (c) diagram a P(ÁrjTermés) eloszlást mutatja, ami a két aleset 
összegzéseként adódik. 
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A lineáris normális feltételes eloszlásnak vannak bizonyos speciális tulajdonságai. 
Egy csak folytonos, lineáris normális feltételes eloszlású változókat tartalmazó háló 
együttes eloszlása egy többváltozós normális eloszlás az összes változó felett (lásd 
14.5. feladat). [A többváltozós normális eloszlás egy felület több mint egy dimenzió- 
ban, aminek van egy csúcsa az átlagnál (n dimenzióban), értéke pedig ettől távolodva 
minden irányban csökken.] Ha diszkrét változókat adunk a hálóhoz (feltéve, hogy 
egyetlen diszkrét változó sem gyermeke egy folytonos változónak), a háló egy feltéte- 
les Gauss- (conditional Gaussian) vagy FG-eloszlást definiál: bármilyen értéket is 
rendelünk a diszkrét változókhoz. a folytonos változók feletti eloszlás egy többváltozós 
Gauss-eloszlás lesz. 

Most a folytonos szülővel rendelkező diszkrét változók eloszlásával kezdünk foglal- 
kozni. Fontoljuk meg például a Vásárol csomópontot a 14.5. ábrán. Ésszerűnek tűnik 
azt feltételezni, hogy a vásárló vásárol, ha az ár alacsony, nem vásárol, ha magas, a 
vásárlás valószínűsége pedig folytonosan változik egy közbenső régióban. Máshogy 
fogalmazva, a feltételes eloszlás hasonló egy , elmosódott" (, soft") küszöbfüggvény- 
hez. Az elmosódott küszöbök létrehozására egy módszer a standard normális eloszlás 
integráljának a használata: 


x 
zz N(0,L b 
997 f// N0DGJdr 
Ekkor a Vásárlás valószínűsége az Ár ismeretében ez lehet 


P(vásárollár — c) — 8((- c 4 1)/o) 


ami azt jelenti, hogy az ár küszöbe ,r körül van. és a küszöbrégió szélessége arányos 
6-val, illetve, hogy a vásárlás valószínűsége csökken. ahogy az ár növekszik. 
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14.7. ábra. (a) A Vásárlás valószínűségének probit eloszlása az Ár ismeretében, zi — 6.0 és a — 1.0 
mellett. (b) Logit eloszlás hasonló paraméterekkel. 


5 Következésképpen lineáris normális hálókban a következtetés időigénye legrosszabb esetben is csak 
0(r), függetlenül a háló topológiájától. A 14.4. alfejezetben látni fogjuk, hogy diszkrét változós hálóban a kö- 
vetkeztetés NP-nehéz. 
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Ezt a probit eloszlást (probit distribution) a 14.7. (a) ábra illusztrálja. Alakja azzal 
az érveléssel igazolható. hogy az alapul szolgáló döntési folyamatnál létezik egy pontos 
küszöb, de ennek pontos helyét egy véletlen normális eloszlású zaj befolyásolja. 
A probit modell egy alternatívája a logit elosztás (logit distribution), amely a szigmoid 
függvényt (sigmoid function) használja egy elmosódott küszöb előállításához: 


P(wásárollár —c) — ! 





13-exp(—2—tE 





Ezt a 14.7. (b) ábra mutatja. A két eloszlás hasonlóan néz ki, de valójában a logit 
sokkal lassabban tart a határértékekhez. A probit gyakran jobban illeszkedik a valódi 
helyzetekhez, de a logit esetenként matematikailag könnyebben kezelhető, például 
széles körben használatos a neurális hálókban (lásd 20. fejezet). Mind a probit, mind 
a logit általánosítható több folytonos szülőre a szülők értékeinek lineáris kombináció- 
ját véve. Többértékű diszkrét gyermekre történő kiterjesztéseket a 14.6. feladatban 
taglalunk. 
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Az alapvető feladat bármely valószínűségi következtető rendszer számára az, hogy ki- 
számítsa a célváltozók (guery variables) egy halmazának a posteriori valószínűség- 
eloszlását egy adott megfigyelt esemény (event) esetén — azaz bizonyítékváltozók 
(evidence variables) egy halmazához történő érték-hozzárendelés esetén. A 13. fejezet- 
ben bevezetett jelölést fogjuk használni: X a célváltozót jelöli; E a bizonyítékváltozók 
Ej, ...s En halmazát, e pedig a megfigyelt eseményt; Y fogja jelölni az (olykor rejtett 
változóknak (hidden variables) nevezett) nem-bizonyítékváltozók Y4, .... Y4 halma- 
zát. Így a változók teljes halmaza X — (X) U E U Y. Egy jellemző lekérdezés a P(Xle) 
a posteriori elosztásra irányul.§ 

A riasztós hálóban például megfigyelhetnénk azt az eseményt, ahol JánosTelefonál 
igaz és MáriaTelefonál — igaz. Ekkor megkérdezhetnénk mondjuk a betörés megtör- 
téntének a valószínűségét: 


P(BetöréslJánosTelefonál — igaz, MáriaTelefonál — igaz) — (0,284, 0,716) 


Ebben a fejezetben az a posteriori valószínűségek kiszámítására szolgáló egzakt algo- 
ritmusokat tárgyalunk, és átgondoljuk ennek a feladatnak a komplexitását. Kiderül, 
hogy általános esetben ez kivitelezhetetlen, ezért a 14.5. alfejezet közelítő következtetési 
módszereket ismertet. 


$ Feltesszük, hogy a célváltozó nincs a bizonyítékváltozók között; amúgy X a posteriori eloszlása a meg- 
figyelt értékre 1 valószínűséget ad. Az egyszerűség kedvéért azt is feltettük, hogy a kérdés egyetlen változóra 
irányul. Az algoritmusaink könnyen kiterjeszthetők több változó együttesének lekérdezésére. 
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A 13. fejezet elmagyarázta, hogy bármely feltételes valószínűség kiszámítható a teljes 
együttes eloszlás tagjainak összegzésével. Pontosabban, egy P(XJe) lekérdezés meg- 
válaszolható a (13.6) egyenlet felhasználásával, amit a jobb követhetőség kedvéért itt 
megismétlünk: 


P(XIe) — aP(X,e) — ay P(X.e,y) 
E 
"Továbbá, mint ismeretes, a Bayes-háló a teljes együttes eloszlás egy teljes reprezentá- 
cióját nyújtja. Még pontosabban, a (14.1) egyenlet azt mutatja, hogy az együttes elosz- 
lás P(x, e, y) tagjai felírhatók a hálóból származó feltételes valószínűségek szorzatai- 
ként. Ezért egy lekérdezés megválaszolható a Bayes-háló felhasználásával, kiszámítva 
a hálóból származó feltételes valószínűségek szorzatainak az összegét. 

A 13.4. ábrán a FELSOROL-EGYÜTTES-KÉRDEZÉS algoritmust adtuk meg a teljes 
együttes eloszlásból felsorolással történő következtetésre. Az algoritmus bemenet- 
ként fogadja a P teljes együttes eloszlást, és értékeket néz meg benne. Egyszerű 
módosítással elérhető, hogy az algoritmus egy bn Bayes-hálót fogad bemenetként, és 
az együttes bejegyzéseket a bn megfelelő FVT-bejegyzéseinek összeszorzásával 
s nézi meg". 

Vegyük a P(BetöréslJánosTelefonál — igaz, MáriaTelefonál — igaz) lekérdezést. 
A rejtett változók ennél a kérdésnél a Földrengés és a Riasztás. A (13.6) ) egyenletből, a 
kifejezések rövidítése miatt a kezdőbetűket használva, azt kapjuk, hogy? 





P(BIj,m) — aP(B, jom) — a) 3 PB. ea, jam) 
e a 
A Bayes-hálók szemantikája - (14.1) egyenlet — pedig az FVT-bejegyzések felhasz- 
nálásával egy kifejezést ad. Az egyszerűség kedvéért ezt csak a Betörés — igaz esetére 
adjuk meg: 


P(blj.m—- a) P(byP(e)P(albee)P(jlaPcnla) 


Ennek a kifejezésnek a kiszámításához négy tagot kell összeadnunk, amelyek mind- 
egyikét öt szám összeszorzásával kapjuk. Legrosszabb esetben, amikor majdnem min- 
den változó felett összegezni kell, az algoritmus komplexitása egy n bináris változós 
háló esetén 0(n2"). 

A következő egyszerű megfigyeléssel egy javításhoz juthatunk: a P(b) tag állandó, 
és ki lehet vinni az a és e feletti összegzések elé, a P(e) tag pedig kivihető az a feletti 
összegzés elé. Így azt kapjuk, hogy 


P(blj.my— aP(by3" P(e) 3" Ptalb,e)P(jla)Punla) (14.3) 
fi a 


T Egy olyan kifejezés mint a, Pta, e) a PIA — a, E — ej-nek az összegzését jelenti minden lehetséges e ér- 
tékre. Ez többértelműséget rejt magában, mivel a P(e) jelölést használják mind a P(E — iga), mind a P(E — e) 
jelentés kifejezésére, azonban a szándékolt jelentésnek a szövegkörnyezetből ki kell derülnie; egy összegzés ese- 
tében az utóbbiról van szó. 
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P(e) 


P(-e) 
0002 


0,998 










P(-albse) —— P(alb-e) PCcalb—e) 
0.05 094 0,06 


PCjla) 
0, 


P(mla) 
0,70 


14.8. ábra. A (14.3) egyenletben szereplő kifejezés struktúrája. A kiértékelés fentről lefelé halad, össze- 
szorozva az értékeket az egyes útvonalak mentén, és összegezve a ,,4" csomópontoknál. Vegyük észre, 
a j-hez és az m-hez tartozó útvonalak megismétlődését. 


Ez a kifejezés egy ciklussal értékelhető ki, sorban végighaladva a változókon, miköz- 
ben összeszorozzuk az FVT-bejegyzéseket. Minden összegzésnél, a változó lehetséges 
értékei szerint is iterálnunk kell. A számítás struktúráját a 14.8. ábra mutatja. Fel- 
használva a 14.2. ábra értékeit, azt kapjuk hogy P(bljum) — a x 0,00059224. A -b-hez 
tartozó számítást átfutva az az x 0,0014919-et eredményez; így 








function FELSOROLÁS-KÉRDEZÉS(X, e, bri) returns egy X feletti eloszlás 
inputs: X, a lekérdezés változója 
e, az E változók megfigyelt értékei 
bn. egy valószínűségi háló (X) VE U Y /Y — rejtett változók" 


O(X) € egy eloszlás X felett, kezdetben üres 
for each x; értékére X-nek do 

terjeszd ki e-t X-nek az x, értékével 

04 §— FELSOROL-MINDET( VÁLTOZÓ[Da1), e) 
return NORMALIZÁL(CMX)) 





function FELSOROL-MINDET(változók, e) returns egy valós szám 
if ÜRES (változók) then return 1.0 
Y — ELsőíváltozók) 
út Y értéke y e-ben 
then return PéyIszülők(Y)) x FELSOROL-MINDET(MARADÉK(változók), e) 
else return 57, P(vlszülők()) x FELSOROL-MINDET(MARADÉK(változók), ey) 
ahol e, ki leít terjesztve Y — y-nal 











14.9. ábra. A felsoroló algoritmus Bayes-hálós lekérdezések megválaszolására 
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P(Bljm) — a (0,00059224, 0,9014919) sz (0,284, 0,716) 


Azaz a betörés valószínűsége, ha mindkét szomszéd telefonál körülbelül 2896. 

A 14.8. ábra a (14.3) egyenlet kiértékelési folyamatát mutatja, kifejezés fa alakban. 
A FELSOROL-KÉRDEZ algoritmus a 14.9. ábrán ilyen fákat mélységi rekurzióval értékel 
ki. Így a FELSOROL-KÉRDEZ tárkomplexitása csak lineáris a változók számában — az al- 
goritmus így hatékonyan, anélkül összegez a teljes együttes eloszlás felett, hogy azt 
explicit módon megkonstruálná. Sajnos az algoritmus időkomplexitása egy "n bináris 
változós hálónál minden esetben 0(2") — ami jobb, mint az egyszerű megközelítéshez 
tartozó 0(n2"), de még mindíg elég nyomasztó. Egy figyelemre méltó dolog a 14.8. 
ábra fájával kapcsolatban, hogy nyilvánvalóvá teszi a megismételt alkifejezéseket, ame- 
lyeket az algoritmus kiértékel. A P(jla) P(mla) és a PCjl-a) P(in]-a) szorzatok kétszer 
kerülnek kiszámításra, e minden értékénél. A következő fejezet egy általános módszert 
ír le, ami elkerüli az ilyen felesleges újraszámítások elvégzését. 





A változó eliminációs algoritmus 


A felsoroló algoritmus lényegesen javítható a 14.8. ábra által szemléltetett ismétlődő 
számítások kiküszöbölésével. Az ötlet egyszerű: egyszer végezzük el a számítást, és 
őrizzük meg az eredményeket későbbi használatra. Ez egyfajta dinamikus progra- 
mozás. Ennek a megközelítésnek több változata is létezik; mi a legegyszerűbbet, 
a változó etiminációs (variable elimination) algoritmust mutatjuk be. A változó eli- 
minálás a (14.3) egyenlet típusú kifejezéseket jobbról balra (azaz a 14.8. ábrán lent- 
ről felfelé) sorrendben értékeli ki. A köztes eredményeket eltároljuk, és bármely 
változó feletti összegzés a kifejezésnek csak azon része felett történik meg, amely 
függ ettől a változótól. 

Szemléltessük ezt a folyamatot a betörés háló esetén. Értékeljük ki a következő ki- 
fejezést: 


P(Bj.m)— a P(B)) 7 P(e) 2 P(alB,e) PCjla) Pra) 
B § E 8 A 4 Mm 










Vegyük észre, hogy a kifejezés minden részét megjelöltük a kapcsolódó változó nevé- 
vel; ezeket tényezőknek (factors) nevezzük. A lépések a következők: 


s AzM tényező, P(mla) nem igényel M feletti összegzést (mivel M értéke már rögzí- 
tett). Eltároljuk a valószínűséget a minden értékére egy kételemű vektorban, 


P(mja) 
teme dna] 
(Az Éy azt jelöli, hogy f létrehozásában M-et felhasználtuk.) 

Hasonlóan, tároljuk a J-hez tartozó tényezőt egy kételemű £AA) vektorban. 

Az A-hoz tartozó tényező, P(a)JB, e), ami egy 2 x 2 x 2-es mátrix lesz, f (A, B, E). 
Most ki kell összegeznünk A-t ennek a három tényezőnek a szorzatából. Ez egy 
2 x 2-es mátrixot eredményez, aminek indexei már csak B és E felett futnak. A mát- 
Tix nevében A-nál egy felülvonással jelezzük, hogy A már ki lett összegezve: 


14.4. EGZAKT KÖVETKEZTETÉS BAYES-HÁLÓKBAN 398 


fzm(B.E)— yta(a, BE) xf(a) xfu(a) 
a 
—f.(a,B.E)xfj(a)x fla) 
4f, (a, B,E)xf(-a)xfy(-a) 
Az itt használt szorzást pontonkénti szorzásnak (pointwise product) nevezik, és 
hamarosan ismertetjük. 
s . Hasonló módon dolgozzuk fel E-t: kiösszegezzük E-t f(E) és fxAB, E) szorzatából: 


fex (B) — Ep(e) x fzgy (B.e) - fz(-0) x xy (B.-0). 


s Most pedig kiszámíthatjuk az eredményt egyszerűen összeszorozva B tényezőjét 
(azaz fp(B) — P(B)-t) az fFx ja (8) kiadódott mátrixszal: 
P(Bljm) — a £p(B) x fFxjm (B) 
A 14.7. (a) feladatban azt kérjük, hogy ellenőrizze, helyes eredményt ad-e ez a folyamat. 
A lépések sorozatát megvizsgálva láthatjuk, hogy két alapvető művelet szükséges: té- 
nyezőpárok pontonkénti összeszorzása és egy változó kiösszegzése tényezők szorzatából. 
A pontonkénti szorzás nem mátrixszorzás és nem is egy elemenkénti szorzás. Két, €j 
és f2 tényezőnek a pontonkénti szorzata egy új f tényezőt eredményez, amelynek vál- 
tozóit az fy és f) változóinak az uniója adja. Tételezzük fel. hogy a két tényezőben az 
Y, ... Yp változók közösek. Ekkor azt kapjuk, hogy 


(XI... X.Yr... Yp Zt.. ZD F(X. X.Y. XI) EY. X.Z1.. ZD 


Ha minden változó bináris, akkor fj-nek és £5-nek 2jtk és 244 eleme van, pontonkénti 
szorzatuknak pedig 27 ? kt 1. Például az f1(A.B) és az f2(B,C) tényezők esetén a lentebb 
mutatott valószínűség-eloszlással, az fj x f? pontonkénti szorzata f3(A, B, C)-vel adott: 














A B A B c [(A, B, C) 
T b 1 I T 03 x 02 
Lé H 1 1 H 0,3 x 0.8 
H 1 t H 1 0.7 x 06 
H H I H H 07 x 04 
H Lé T 0.9 x 02 
H 1 H 09 x08 
H H 1 0.1 x 06 
H H H 0.1 x 04 





























Egy változó kiösszegzése tényezők szorzataiból szintén egyértelmű számítás. Az egyet- 
len észreveendő trükk az, hogy bármely tényező, ami nem függ a kiösszegzendő válto- 
zótól, az az összegzésen kívülre mozgatható. Például: 


Ifr(o)xfa(A Bee) xf(A)xEu(A) — (A) x El Ax Fp(e) xFA(A, Be) 


A e 
Most a pontonkénti szorzat kerül kiszámításra az összegzésen belül, a változót pedig 
kiösszegezzük a kiadódó mátrixból: 
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E(AJx EY (A) XI Trz(e) x fa (AB) — [/(A)xE(A) x fiz 4 (A.B) 
Vegyük észre, hogy mátrixokat nem szorzunk, ameddig nem kell kiösszegeznünk egy 
változót a kiadódó szorzatból. Annál a pontnál csak azokat a mátrixokat szorozzuk Ösz- 
sze, amelyek magukban foglalják a kiösszegzendő változót. A pontonkénti szorzás és a 
kiösszegzés eljárások megléte esetén maga a változó eliminálás algoritmusa, amint azt 
a 14. 10. ábra mutatja, igen egyszerűen felírható. 

Nézzünk még egy lekérdezést: P(JánosTelefonállBetörés — igaz). Szokásos módon, 
az első lépés az egymásba ágyazott összegzések felírása: 


P(JIb)— aP(b)) P(e)3 P(alb.edP(Ila) 2 P(mla) 
e a m 


Ha ezt a kifejezést jobbról balra kiértékeljük, valami érdekeset veszünk észre: 
X,,P(mla) definíció szerint 1-gyel egyenlő. Így ezt eleve kihagyhattuk; a változó M a kér- 
désre irreleváns. Máshogy fogalmazva, a P(JánosTelefonállBetörés — igaz) lekérdezés 
eredményét nem változtatja meg a MáriaTelefonál eltávolítása a hálóból. Általában, bár- 
mely levélcsomópontot eltávolíthatunk, ami nem célváltozó vagy bizonyítékváltozó. El- 
távolítás után lehetnek újabb levélcsomópontok, amelyek szintén irrelevánsak lehetnek. 

Ezt az eljárást folytatva végül szükségszerűen arra jutunk, hogy minden változó, ami 
nem őse a célváltozónak vagy egy bizonyítékváltozónak, irreleváns a lekérdezésre. 
A változó elimináló algoritmus ezért az összes ilyen változót eltávolíthatja a lekérdezés 
kiértékelése előtt. 





function ELIMTNÁLÁS-KÉRDEZÉS(X, e, bn) returns egy X feletti eloszlás 
inputs: X, a lekérdezés változója 
€, a bizonyíték mint esemény 
bn, egy P(XI, ..., X,) együttes eloszlást megadó Bayes-háló 


tényezők 4— (]; változók §— FORDÍT(VÁLTOZÓKÍbn]) 
for each változó in változók do 

tényezők —— (TÉNYEZŐ-LÉTREHOZÓK változó, e)lváltozók] 

if változó rejtett then tényezők —— KiöSSZEGEZ(változó. tényezők) 
return NORMALIZÁL(PONTONKÉNT-SZORZAT(tényezők)) 





14.10. ábra. A változó eliminálás algoritmus Bayes-hálós lekérdezések megválaszolására 


Az egzakt következtetés komplexitása 


Megmutattuk, hogy a változóeltávolítás hatékonyabb, mint a felsorolás, mivel elkerüli 
a számítások megismétlését (ahogyan az irreleváns változókat is kiejti). A változó eli- 
minálás idő- és tárigényét az algoritmus működése alatt létrejövő legnagyobb tényező 
mérete befolyásolja a legerőteljesebben. Ezt viszont a változók eliminálásának sorrendje 
és a háló struktúrája határozza meg. 

A 14.2. ábra betörős hálója a hálóknak azon családjához tartozik, ahol a háló bármely 
két csomópontja között legfeljebb egyetlen irányítatlan út létezik. Ezeket egyszeresen 
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összekötött (singly connected) hálóknak vagy polifáknak (polytree) nevezzük, ame- 
lyeknek van egy különösen kellemes tulajdonságuk: az egzakt következtetés idő- és 
tárkomplexitása a polifákban a háló méretében lineáris. Itt a méret az FVT-bejegyzések 
számával van definiálva; ha minden egyes csomópont szüleinek a száma egy konstans- 
sal korlátozott, akkor a komplexitás a csomópontok számában is lineáris. Ezek az ered- 
mények bármely - a háló topológiai sorrendjével konzisztens — sorrendezés esetén 
fennállnak (lásd 14.7. feladat). 

A többszörösen összekötött (multiply connected) hálóban (lásd például 14.11. (a) 
ábra) a változó eliminálás legrosszabb esetben exponenciális idő- és tárkomplexitású 
lehet, még akkor ís, ha a csomópontonkénti szülők száma korlátos. Ez nem meglepő, 
figyelembe véve, hogy a Bayes-hálókban való következtetés NP-nehéz, mivel ez speciá- 
tis alesetként tartalmazza az ítéletlogikai következtetést is. Valójában megmutatható 
(lásd 14.8. feladat), hogy a probléma ugyanannyira nehéz, mint kiszámítani egy ítélet- 
logikai formula esetén a formulát kielégítő értékadások számát. Ez azt jelenti, hogy ez $P- 
nehéz (, számosság-P-nehéz"), azaz szigorúan nehezebb, mint az NP-teljes problémák. 

Szoros kapcsolat áll fenn a Bayes-hálókban történő következtetés komplexitása és 
a kényszerkielégítési problémák (CSP) komplexitása között. Amint az 5. fejezetben 
tárgyaltuk, egy diszkrét CSP megoldásának nehézsége ahhoz kapcsolódik, hogy a 
kényszergráf mennyire , faszerű". Olyan mértékek, mint a hiperfaszélesség (hypertree 
width), amelyek a CSP megoldási komplexitását határolják, közvetlenül alkalmazha- 
tók Bayes-hálóknál is. Ezenfelül a változó eliminálás algoritmusa általánosítható úgy, 
hogy kényszerkielégítési problémákat is és Bayes-hálókat is megoldjon. 


Csoportosító algoritmusok 


A változó eliminálás algoritmusa egyszerű és hatékony egyedi lekérdezések megvála- 
szolására. Azonban ha a háló összes változójának az a posteriori eloszlását szeretnénk 
kiszámítani, akkor kevésbé hatékony is lehet. Például egy polifa hálóban 0(n) egyenként 
0(n) költségű lekérdezést kell kiadni, összességében 0(rf) időköltséggel. Csoportosító 
(clustering) eljárásokkal (amit egyesítési fa — join tree — algoritmusnak is neveznek) ez 
az idő 0(n)-re csökkenthető. Emiatt ezeket az algoritmusokat gyakran használják keres- 
kedelmi Bayes-hálós eszközökben. 

A csoportosítás alapötlete, hogy a háló önálló csomópontjait egyesítjük, klasztercso- 
mópontokat formálva úgy, hogy a kiadódó háló polifa legyen. Például a 14.11. (a) ábrán 
mutatott, többszörösen összekötött háló egy polifává konvertálható a Locsoló és az Eső 
csomópontok egy Locsoló--Eső-nek nevezett klasztercsomópontba (cluster node) va- 
ló összevonásával, ahogy azt a 14.1I. (b) ábra mutatja. A két bináris csomópontot 
egyetlen megacsomópont váltotta fel, ami négy lehetséges értéket vesz fel: Ah, hi, ih, ü. 
A megacsomópontnak csak egy szülője van, a bináris Felhős változó, így két feltételes 
eset létezik. 

A háló polifává konvertálása után, egy speciális célú következtetési algorítmust alkal- 
mazunk. Alapvetően az algoritmus egyfajta kényszerterjesztés (lásd 5. fejezet), ahol a 
kényszerek biztosítják, hogy a szomszédos csoportokban megegyeznek a közös változók 
a posteriori eloszlásai. Gondos nyilvántartással ez az algoritmus képes 0(n) időben — 
ahol r most a módosított háló mérete — kiszámolni a háló összes nem bizonyíték csomó- 
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rösen összekötött háló csoportosított ekvivalense, 


pontjának a posteriori eloszlását. Azonban a probléma NP-nehéz volta nem tűnt el: ha a 
háló exponenciális idő- és tárigényű a változó eliminálás esetén, akkor a csoportosított 
hálóhoz tartozó FVT-k megkonstruálása exponenciális idő- és tárigényű lesz. 
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Az egzakt következtetés nagy, többszörösen összekötött hálókban való kezelhetetlensé- 
ge miatt, elengedhetetlen közelítő következtetési módszerek átgondolása. Ez a fejezet 
véletlen mintavételi, Monte Carlo-módszereknek is nevezett, eljárásokat ír le, amelyek 
közelítő válaszokat nyújtanak, ahol a pontosság a generált minták számától függ. 

Az utóbbi években a Monte Carlo-algoritmusok széles körben elterjedtek a számítás- 
tudományban olyan mennyiségek megbecslésére, amelyeket nehéz egzakt módon 
kiszámolni. Például a 4. fejezetben leírt szimulált lehűtés algoritmus egy Monte Carlo- 
eljárás optimalizációs problémákra. Ebben a fejezetben a mintavételezésnek az a 
posteriori valószínűségek kiszámításában történő alkalmazásában vagyunk érdekeltek. 
Algoritmusok két nagy családját írjuk le: a közvetlen mintavételezést és a Markov- 
láncos mintavételezést. Két másik megközelítést — a variációs módszert és a , hurkos" 
(. loopy") terjesztést — a fejezet végi megjegyzésekben említjük meg. 





Közvetlen mintavételezési módszerek 


Az alapelem minden mintavételi algoritmusban a minták generálása egy ismert valószí- 
nűség-eloszlásból. Például egy szabályos érme felfogható egy Érme valószínűségi vál- 
tozónak (fej, írás) értékekkel és P(Érme) — (0.5, 0,5) a priori eloszlással. A mintavétel 
ebből az eloszlásból pontosan megfelel egy érme dobálásának: 0.5 valószínűséggel fej-et 
ad, és 0,5 valószínűséggel írás-t. Ha rendelkezésre áll a [0, 1] tartományba eső véletlen 
számoknak egy forrása, akkor bármely egyváltozós eloszlásból egyszerű dolog minta- 
vételezni (lásd 14.9. feladat). 
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A véletlen mintavételezési folyamat legegyszerűbb fajtája Bayes-hálók esetén a há- 
lóbót generál olyan eseményeket, amelyekhez nem kapcsolódik bizonyíték. Az ötlet az, 
hogy mintavételezzünk minden változót egymás után, topológiai sorrendben. A való- 
színűség-eloszlás, amiből az értéket mintavételezzük, feltételesen függ a változó szüle- 
ihez már hozzárendelt értékektől. Ez az algoritmus látható a 14.12. ábrán. A működé- 
sét a 14.11. (a) ábrán látható hálón szemléltetjük, feltételezve egy IFelhős. Locsoló. 
Eső, VizesPázsit] sorrendezést: 


1. Sorsoljunk a P(Felhős) — (0.5, 0.5) eloszlásból; tegyük fel, hogy igaz-at kapunk, 

2. Sorsoljunk a P(LocsolójFelhős — igaz) — (0,1. 0.9) eloszlásból: tegyük fel, hogy 
hamis-at kapunk. 

3. Sorsoljunk a P(EsőlFelhős — igaz) — (0,8, 0,2) eloszlásból; tegyük fel, hogy igaz-at 
kapunk. 

4. Sorsoljunk a P(VizesPázsitl Locsoló — hamis, Felhős — igaz) — (0.9, 0,1) eloszlás- 
ból; tegyük fel, hogy igaz-at kapunk. 

Ebben az esetben a PRIOR-MINTA a következő eseményt adja [igaz, hamis, igaz, 

igaz]. 

Könnyen látható, hogy a PRIOR-MINTA a háló által meghatározott a priori együttes 
eloszlásból generál mintákat. Először, legyen Sps(xi. ..., xp) annak a valószínűsége, hogy 
egy adott eseményt legenerál a PRIOR-MINTA algoritmus. Pusztán a mintavételi folyamat 
alapján felírható, hogy 


n 
SpsC.xn) — [[DeAAshorrr])) 
izt 


mivel minden mintavételi lépés a szülő értékektől függ. 


fonction PRIOR-MINTA(bn) returns egy esemény a br által definiált a priori eloszlásból 
inputs: bn, egy P(XI, ..., X,) együttes eloszlást megadó Bayes-háló 


x — egy esemény n elemmel 
fori— 1 tondo 

Xx, — egy véletlen minta P(X.Iszülők(X)) szerint 
return x 








14.12. ábra. Egy mintavételező algoritmus, amely eseményeket generál egy Bayes-hálóból 


Ez a kifejezés ismerős. mivel — ahogy ezt a (14.1) egyenlet kimondja — ez egyben a 
valószínűsége is az együttes eloszlás Bayes-hálós reprezentációja szerinti eseménynek 
is. Arra jutottunk tehát, hogy 


Sps(1...x) — P(x. ..x) 
Ez az egyszerű tény nagyon könnyűvé teszi lekérdezések — minták felhasználásával tör- 
ténő - megválaszolását. 

Bármilyen mintavételi algoritmusban a válasz kiszámítása a generálás során előálló 
minták megszámlálása alapján történik. Tételezzük fel, hogy N teljes mintánk van, és 
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jelölje N(x, ..., Xn) az xy, ..., Xn esemény gyakoriságát. Azt várjuk, hogy ez a gyakori- 
ság határértékben konvergáljon a várható értékéhez a mintavételi valószínűség szerint: 


im N ps (xs Xn) 
Non N 


— Sps(x..-a Xn) 7 P(x Xn) (144) 


Például gondoljuk meg az előbb generált eseményt: [igaz, hamis, igaz, igaz). Ennek az 
eseménynek a mintavételi valószínűsége: 


Sps(igaz, hamis, igaz, igaz) — 0,5 x 09 x 0.8 x 09 — 0,324 


Így. N nagy értékeinél azt várjuk, hogy a minták 32,496-a ez az esemény legyen. 

A következőkben, amikor a közelítő egyenlőség jelet (,,5-") használjuk, pontosan 
ilyen értelemben használjuk — azaz a becsült valószínűség egzakttá válik a nagy minta- 
számú határesetben. Az ilyen becsléseket konzisztensnek (consistent) nevezzük. Pél- 
dául bármely részlegesen meghatározott xi, ..., xm esemény valószínűségének egy kon- 
zisztens becslése a következőképpen kapható meg, ha m £ n: 


P(1,...s Xm) Sz Nps(21.-s Xm)/N (14.5) 


Azaz, az esemény valószínűsége megbecsülhető a mintavételi folyamat által generált 
összes teljes esemény azon hányadával, amelyek illeszkednek a részlegesen meghatá- 
rozott eseményre. Például ha generálunk 1000 mintát a locsolós hálóból, és 511-ben 
közülük az Eső — igaz, akkor az eső becsült valószínűsége P(Eső — igaz) 0,511. 


Elutasító mintavételezés Bayes-hálókban 


Az elutasító mintavételezés (rejection sampling) általános módszer minták előállí- 
tására egy nehezen mintavételezhető eloszlásból, felhasználva egy könnyen minta- 
vételezhető eloszlást. Legegyszerűbb formájában feltételes valószínűségek kiszámítá- 
sára — azaz P(XIle) meghatározására használható fel. Az ELUTASÍTÓ-MINTAVÉTELEZÉS 
algoritmusa a 14.13. ábrán látható. Először a háló által megadott a priori eloszlásból 
generál mintákat, majd elutasítja azokat, amelyek nem illeszkednek a bizonyítékhoz. 
Végül, a P(X — xJe)becslés megkapható az X — x előfordulásainak megszámlálásával 
a megmaradt mintában. 

Legyen P(Xle) az algoritmus által kiadott becsült eloszlás. Az algoritmus definíciója 
szerini fennáll, hogy 


Nps(X, e) 
Nps(e) 
A 14.5 egyenletből kapjuk, hogy 


P(X.e) 
EP] 
Pe) (XIe) 


P(XIe) — aNps(X, e) — 


P(XIe) sz 


Azaz az elutasító mintavétel az igazi valószínűség konzisztens becslését adja. 
Folytatva a 14.11. (a) ábra szerinti példánkat, tételezzük fel, hogy meg szeretnénk be- 

csülni a P(EsőjLocsoló — igaz)-t, 100 minta felhasználásával. A 100 általunk generált 

mintából, tegyük fel, hogy 73-ban teljesül, hogy Locsoló — hamis, és így elutasított, 
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function ELUTASÍTÓ-MINTAVÉTELEZÉSÍX, e, bn, N) returns P(Xle) egy becslése 
inputs: X, a lekérdezés változója 
€, a bizonyíték mint esemény 
bn, egy Bayes-háló 
N, a generálandó minták száma 
local variables: N, X értékeihez tartozó számlálók vektora. kezdetben nulla 


forj -1toNdo 
X €— PRIOR-MINTA(bn) 
if x konzisztens e-vel then 
NE] — NIx) - I, ahol x az X értéke x-ben 
return NORMALIZÁL(NIX]) 








14.13. ábra. Az elutasító mintavétel algoritmusa, ami Bayes-hálós lekérdezéseket válaszol meg bízonyí- 
tékok esetén 


míg 27-ben fennáll, hogy Locsoló — igaz; a 27-ből 8-ban Eső — igaz, 19-ben pedig 
Eső — hamis. Így a 


P(EsőlLocsoló — igaz) sz NORMALIZÁL((8, 19)) — (0,296, 0,704) 


A helyes érték (0,3, 0,7). A begyűjtött minták szaporodásával a becslés konvergálni 
fog a helyes értékhez. A becslés szórása az egyes valószínűségekné! arányos lesz 
1//n -nel, ahol n a becsléshez felhasznált minták száma. 

Az elutasító mintavétel legnagyobb hibája, hogy nagyon sok mintát utasít el! Az e bí- 
zonyítékkal konzisztens minták aránya exponenciálisan egyre kevesebb, ahogy a bizonyí- 
tékváltozók száma nő, így az eljárás egyszerűen használhatatlan komplex problémákban. 

Vegyük észre, hogy az elutasító mintavétel nagyon hasonló a feltételes valószí- 
nűségek becsléséhez, ha közvetlenül a valódi világból történik a becslés. Például a 
P(Eső/VörösAzÉgESte — igaz) becslésénél egyszerűen megszámoljuk, milyen gyakran 
esik az után, hogy az előző este az ég vörös volt — figyelmen kívül hagyva azokat az 
estéket, amikor az ég nem volt vörös. (Itt a világ maga játssza a mintageneráló algorit- 
mus szerepét.) Nyilvánvalóan, ha az ég nagyon ritkán vörös, akkor ez hosszú időt vehet 
igénybe, és ez az, ami az elutasító mintavétel gyengesége. 


Valószínűségi súlyozás 


A valószínűségi súlyozás (likelihood weighting) elkerüli az elutasító mintavételezés 
gyengeségét azáltal, hogy csak az e bizonyítékkal konzisztens eseményeket generál. 
Az algoritmus működésének a leírásával kezdjük; majd megmutatjuk, hogy helyesen 
működik — azaz, hogy konzisztens valószínűség becsléseket generál. A VALÓSZÍNŰSÉGI- 
SÚLYOZÁS (lásd 14.14. ábra) rögzíti az E bizonyítékváltozók értékeit, és csak a maradék 
X és Y változókat mintavételezi. Ez garantálja, hogy minden generált esemény konzisz- 
tens a bizonyítékkal. Azonban nem minden esemény egyenlő. Mielőtt megállapítanánk 
a számlálási eredményeket a célváltozó eloszlásában, minden eseményt súlyozunk az- 
zal a valószínűséggel, amely megadja, hogy az esemény mennyire van összhangban 
a bizonyítékkal. Ezt a valószínűséget az egyes bizonyítékváltozók feltételes valószínű- 
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ségeinek a szorzatával mérjük, a szüleik ismeretében. Szemléletesen, azoknak az ese- 
ményeknek, ahol a bizonyíték valószínűtlennek tűnik, kisebb súlyt kell adni. 

Alkalmazzuk az algoritmust a 14.11. (a) ábrán látható háló esetén a P(EsőjLocsoló 
— igaz, VizesPázsit — igaz) kérdésre. A folyamat a következőképpen halad: először a 
w súlyt I,0-ra állítjuk. Aztán generálunk egy eseményt: 


1. Sorsoljunk a P(Felhós) — (0,5, 0,5) eloszlásból; tegyük fel, hogy igaz-at kapunk. 
2. A Locsoló egy bizonyítékváltozó igaz értékkel. Ezért beállítjuk, hogy 





" wW — w x PiLocsoló — igazlFelhős — igaz) — 0,1 


3. Sorsoljunk a P(EsőiFelhős — igaz) — (0.8, 0.2) eloszlásból; tegyük fel, hogy igaz-at 
kapunk. 
4. A VizesPázsit egy bizonyítékváltozó igaz értékkel, Ezért beállítjuk, hogy 


w — w x P(VizesPázsit — igazlLocsoló — igaz, Eső — igaz) — 0.099 


Itt a SÚLYOZOTT-MINTA az [igaz, igaz, igaz, igaz] eseményt adja ki 0,099 súllyal, és ezt 
az Eső — igaz esetnél vesszük számításba. A súly alacsony, mivel az esemény egy fel- 
hős napot ír le, amikor valószínűtlen, hogy a locsoló be van kapcsolva. 

Hogy megértsük, miért is működik a valószínűségi súlyozás, azzal kezdjük, hogy meg- 
vizsgáljuk a SÚLYOZOTT-MINTA Sws mintavételi eloszlását. Emlékezzünk, hogy az E bi- 
zonyítékváltozók értéke (e) rögzített. A többi változót Z-vel jelöljük, azaz Z — (X) U Y. 
Az algoritmus Z minden változóját mintavételezi, szülei adott értékei mellett: 


1 
Sws(z.e) — [ [ Pez;lszütők(z;)) (14.6) 
1—I 

Vegyük észre, hogy a Szülők(Z;) tartalmazhat mind rejtett, mind bizonyítékváltozó- 
kat is. A P(z) a priori eloszlástól eltérően az Sys eloszlás szentel valamennyi figyelmet 
a bizonyítéknak is: a mintavételezett értékeket minden Z; esetén befolyásolják a Z, ősei 
között levő bizonyítékok. Másfelől, Sws kevesebb figyelmet szentel a bizonyítékoknak, 
mint a P(zje) valódi a posteriori eloszlás, mivel a mintavételezett értékek minden 
Z; esetén figyelmen kívül hagyják azokat a bizonyítékokat, amelyek Z/-nek nem ősei.§ 

A w valószínűségi súly pótolja ki a különbséget a valódi és a kívánt mintavételi el- 
oszlás között. Egy adott 2-ből és e-ből álló x minta súlya az összes bizonyítékváltozó 
valószínűségének szorzata a szülei értékei mellett (amelyek közül néhány vagy akár az 
összes a Z,-k között lehet): 


m 
w(z,e) — [ [elszülök(E;)) (14.7) 
fa] 
A (14.6) és (14.7) egyenleteket összeszorozva láthatjuk. hogy egy minta súlvozott va- 
lószínűsége al NÖSEIt kényelmes alakú 
mm 
Sws(z,ejníz,e) — II P(z; szütők(z; I [Pte; szülők (E) -P(ze) (14.8) 


fed izl 

§ deálisan, a P(zje) valódi a posteriori elosztással megegyező mintavételi eloszlást szeretnénk használni, 

hogy az összes bizonyítékot figyelembe vegyük. Ez azonban nem tehető meg hatékonyan. Ha lehetne, akkor a 

kívánt valószínűséget tetszőleges pontossággal közelíthetnénk polinomiális számú mintával, Megmutatható, 
hogy nem létezhet ilyen polinom idejű közelítő séma. 
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function VALÓSZÍNŰSÉGESÚLYOZÁS(X, e, bn, N) returns P(XIe) egy becslése 
inputs: X, a lekérdezés változója 
€, a bizonyíték mint esemény 
bn. egy Bayes-háló 
N, a generálandó minták száma 
local variables: W, X értékeihez tartozó súlyozott számlálók vektora, kezdetben nulla 


forj— 1 to Ndo 

Xx, w — SÚLYOZOTT-MINTA(bn) 

WC) — WIx] -k w, ahol x az X értéke x-ben 
return NORMALIZÁL( WIXI) 





function SÚLYOZOTT-MINTAL(ÓN, €) returus egy esemény és egy súly 


x — egy esemény n elemmel; w — 1 
fori— 1! ton do 
It X; értéke szerepel e-ben 
then w — w x P(X; — xyiszülőkíX)) 
else x; — egy véletlen minta P(X; — xilszülők(X)) szerint 
return x, w 














14.14. ábra. A valószínűségi súlyozás algoritmusa Bayes-hálóban történő következtetéshez 


mivel a két szorzat lefedi az összes változót a hálóban, lehetővé téve, hogy az együttes 
valószínűségre a (14.1) egyenletet használjuk. 

Most már könnyen megmutatható, hogy a valószínűségi súlyozásos mintavétel kon- 
zisztens. Az X bármely konkrét x értékére a becsült a posteriori valószínűség a követ- 
kezőképpen számítható ki: 


B(Gle)— ay Nys(xy,ejwixy,e) a VALÓSZÍNŰSÉGI-SÚLYOZÁS-ból 


4 
sza Swsüayowixye) nagy N-ekre 
y 
áz ay P(xy,e) a (14.8) egyenlet miatt 


y 
5 a! P(x,e) — P(xle) 


Így a valószínűségi súlyozás konzisztens becsléseket szolgáltat. 

Mivel a valószínűségi súlyozás az összes generált mintát felhasználja, sokkal hatéko- 
nyabb lehet, mint az elutasításos mintavétel. Azonban a teljesítménye leromlik, amint 
a bizonyítékváltozók száma növekszik. Ez azért következik be, mert a legtöbb mintának 
nagyon kis súlya lesz, és így a súlyozott becslést főként a minták azon csekély töredéke 
határozza meg, amelyek egy elenyésző valószínűségnél jobban illeszkednek a bizonyí- 
tékokhoz. A probléma még erőteljesebben jelentkezik, ha a bizonyítékváltozók később 
fordulnak elő a változó sorrendben, mivel ekkor a minták olyan szimulációk, amelyek 
kevés hasonlóságot mutatnak a bizonyítékok által sugalmazott valósághoz. 
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Következtetés Markov-lánc szimulációval 


Ebben a fejezetben a Markov lánc Monte Carlo (MCMC, Markov chain Monte 
Carlo) algoritmust ismertetjük, hogy Bayes-hálókban következtethessünk. Először leír- 
juk, mit is csinál az algoritmus, majd elmagyarázzuk, hogy miért is működik, és miért 
van ilyen bonyolult neve. 


Az MCMC algoritmus 


Az előző két mintavételi algoritmustól eltérően, amelyek az egyes eseményeket a 
semmiből generálják, az MCMC minden eseményt az azt megelőző esemény vélet- 
len módosításával generál. Ezért a hálót hasznos úgy elképzelni, mint aminek van 
egy konkrét jelenlegi állapota, ami minden változóra meghatároz egy értéket. A kö- 
vetkező állapot generálása egy X; nem bizonyítékváltozóhoz tartozó érték véletlen- 
szerű mintavételezésével történik, az X; Markov-takarójába tartozó változók jelen- 
legi értékeinek feltétele mellett. (Emlékezzünk vissza az 586. oldalra: egy változó 
Markov-takarója a szüleiből, gyermekeiből és gyermekei szüleiből áll.) Az MCMC 
így véletlen bolyongást végez az állapottérben — a lehetséges teljes érték hozzáren- 
delések terében -, egyszerre egy változót billentve át, de rögzítetten tartva a bizo- 
nyítékváltozókat. 

Gondoljuk meg a P(EsőlLocsoló — igaz, VizesPázsit — igaz) kérdést a 14.11. (a) 
ábrán látható háló esetén. A Locsoló és a VizesPázsit bizonyítékváltozók rögzítettek a 
megfigyelt értékeikre, míg a rejtett Felhős és Eső változók véletlenszerűen inícializál- 
tak — mondjuk az egyik ígaz-ra, a másik hamis-ra. Így a kezdeti állapot [igaz, igaz, 
hamis, igaz). Ekkor a következő lépéseket hajtjuk végre ismétlődően: 


1. A Felhős-t mintavételezzük a Markov-takarójába eső változók jelenlegi értékeinek 
ismeretében: ebben az esetben a P(Felhős]Locsoló — igaz, Eső — hamis) szerint 
mintavételezünk. (Hamarosan megmutatjuk, hogyan számítható ki ez az. eloszlás.) 
Tegyük fel, hogy az eredmény Felhős — hamis. Ekkor az új állapot [/hamis, igaz, 
hamis, ígazl. 

2. Az Eső-t mintavételezzük a Markov-takarójába eső változók jelenlegi értékeinek isme- 
retében: ebben az esetben a P(EsőlFelhős — hamis, Locsoló — igaz, VizesPázsit — 
igaz) szerint mintavételezünk. Tegyük fel, hogy ennek eredménye Eső — igaz. Ekkor 
az új állapot [/hamis, igaz, igaz, igaz). 

A folyamat során meglátogatott minden egyes állapot egy olyan minta, ami hozzájárul 

az Eső célváltozó megbecsléséhez. Ha a folyamat 20 állapotot látogatott meg, ahol az 

Eső igaz, és 61 állapotot. ahol az Eső harnis, akkor a kérdésre a választ a NORMA- 

LIZÁL((20, 60)) — (025. 0.75) adja. A teljes algoritmus a 14.15. ábrán látható. 


Miért működik az MCMC? 


Most megmutatjuk, hogy az MCMC konzisztens becsléseket szolgáltat az a posteriori 
valószínűségekre. A fejezet anyaga eléggé technikai jellegű, de az alapállítás egyszerű: 
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function MCMC-KÉRDEZÉS(X, e, bn, N) returns P(XIe) egy becslése 
local variables: NIX], X értékeihez tartozó számlálók vektora, kezdetben nulla 
27. a nem bizonyíték változók bn-ben 
x, a háló jelenlegi állapota, kezdetben e-re állítva 


a Z-beli változók kezdeti értékét x-ben válasszuk meg véletlenszerűen 
forj— 1toNdo 
for each Z; Z-ben do 
sorsoljuk Z; értékét x-ben P(Zimb(Z))-ből, ahol az MB(Z;) értéke x szerinti 
NIX] — N[2] -4- 1, ahol x az X értéke x-ben 
return NORMALIZÁL(NEXI) 








14.15. ábra. Az MCMC algoritmus Bayes-hálóban történő közelítő következtetéshez 


a mintavételi folyamat egy olyan , dinamikus egyensúlyban" állapodik meg, amelyben 
az egyes állapotokban töltött idő hosszú távon számolt hányada pontosan az a posteriori 
valószínűséggel arányos. Ez a figyelemre méltó tulajdonság a speciális átmenet- 
valószínűség (transition probability) miatt áll fent, amely szerint a folyamat egyik 
állapotból a másikba lép át, ahogyan ezt a feltételes eloszlást a mintavételezett változó 
Markov-takarója meghatározza. 

Legyen 4(x—x?) az a valószínűség, hogy a folyamat x állapotból x" állapotba lép át. Ez 
az átmenet-valószínűség definiálja az úgynevezett Markov-láncot (Markov chain) az 
állapottéren. (A Markov-láncok a 15. és 17. fejezetben is kiemelkedő szerepet játszanak.) 

Tegyük fel most, hogy r lépésnyit futtatjuk a Markov-láncot, és legyen T(x) annak a 
valószínűsége, hogy a rendszer a ! időpillanatban az x állapotban van. Hasonlóan, le- 
gyen 7, 1(x) annak a valószínűsége, hogy a rendszer t -- 1 időpillanatban x" állapot- 
ban van. Ismerve 7(x)-et a 7, , 1(x") kiszámítható úgy, hogy minden olyan állapotra, 
amiben a rendszer r időpillanatban lehet, összegezzük az állapot valószínűségének és az 
ebből az állapotból az x" -be való átlépés valószínűségének szorzatát: 


T(x) ZIUTÁK)a(x—x) 


x 

Akkor mondjuk, hogy egy lánc elérte a stacionárius eloszlását (stationary 
distribution), ha 7, — 741. Jelöljük ezt a stacionárius eloszlást 7r-vel; az ezt definiáló 
egyenlet így 


T(x) —) mr (x)a(x—x)) minden x-re (149) 


Ha a g átmenet-valószínűség eloszlás eleget tesz néhány alapvető feltevésnek? akkor 
bármely g esetén pontosan egyetlen 7r eloszlás elégíti ki ezt az egyenletet. 

A (14.9) egyenlet úgy tekinthető, mint ami azt állítja, hogy az egyes állapotokból a 
. kilépések" várható értéke (azaz a jelenlegi , populáció") egyenlő az összes állapotbóli 
sbelépések" várható értékével. Ez a kapcsolat nyilvánvalóan teljesíthető, ha a várható 
átlépések mindkét irányban ugyanakkorák bármely állapotpár esetén. Ez a tulajdonság 
a teljes egyensúly (detailed balance): 


9, g által definiált Markov-láncnak ergodíkusnak (ergodic) kell lennie — azaz lényegében, minden állapot- 
nak elérhetőnek kell lennie bármely másik állapotból, és nem lehetnek szigorúan periodikus ciklusok. 
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T(x)g(x—x") — m(x)gfx—x) minden X, X-re (14.10) 


Megmutathatjuk, hogy a teljes egyensúly maga után vonja a stacionaritást, egyszerűen az 
x-ek felett összegezve a (14.10) egyenletben. Azt kapjuk, hogy 


2 MXxJg(x—x)) — 2 T(x)g(x—x) — Tate —x) — mix) 


ahol az utolsó lépés abból következik, hogy xi ből biztosan történik átmenet. 

Most megmutatjuk, hogy az MCMC-KÉRDEZ mintavételi lépésében megadott g(x—x") 
átmenet-valószínűség eleget tesz a teljes egyensúly egyenletének, ahol a stacionárius 
eloszlás a P(xle), a rejtett változók valódi a posteriori eloszlása. Ezt két lépésben tesz- 
szük meg. Először, egy Markov-láncot definiálunk, amelyben minden változót az ösz- 
szes többi változóval feltételesen mintavételezünk, és megmutatjuk, hogy ez eleget tesz 
a teljes egyensúly egyenletének. Majd egyszerűen megállapítjuk. hogy Bayes-hálóknál 
ez ekvivalens azzal a feltételes mintavételezéssel, hogy a feltétel a változó Markov- 
takarója (lásd 586. oldal). 

Legyen X; a mintavételezett változó, és jelölje X; az összes többi rejtett változót. 
A jelenlegi állapotban az értékük x; és X;. Ha az X;. -nek ú új x; értéket mintavételezünk 
feltételesen az összes többi változóval, beleértve a bizonyítékot is, akkor 


g(x—x) — 4((xp Xg) — Of, X) — POjlX;, e) 
Ezt az átmenet-valószínűséget nevezik Gibbs-mintavételezőnek (Gibbs sampler), ami 
az MCMC egy nagyon kényelmes alakja. 


Most megmutatjuk, hogy a Gibbs-mintavételező teljes egyensúlyban van a helyes 
a posteriori eloszlása szerint: 


TJ9(xROx) — P(XlOPGT IX; e) — P(x, X-]e) PGY IX; €) 
— P(xIX;. e) P(x.Ie) P(x/Ix;, e) (alkalmazva a láncszabályt az első tagon) 
— P(xIX;, e) Ptx/, xile) (alkalmazva a láncszabály megfordítását) 
— T(x) a(xx) 
Ahogy az 586. oldalon kimondtuk, egy változó független az összes többi változótól a 
Markov-takarójának a feltételében; így: 
PGx/IX; e) — Pe/Imb(Xx)) 
ahol mb(X;) jelöli az X; Markov-takarójában, MB(X;)-ben lévő változók értékeit. Amint 
a 14.10. feladat mutatja, egy változó valószínűsége a Markov-takarójának ismeretében 
arányos a változó szüleivel vett feltételes valószínűségének és az egyes gyermekek 
azok szüleivel vett feltételes valószínűségeinek a szorzatával: 
PGflmb(XYy—aPCsíbszülőkexyx [ID 0 POjlszülökü (14.11 
Y eGyermekek(X. ) 
Így egy változó átléptetéséhez az X; gyermekeinek számával megegyező számú szorzás 
szükséges. 
Itt csupán az MCMC-nek egy egyszerű változatát tárgyaltuk, nevezetesen a Gibbs- 
mintavételezőt. Legáltalánosabb formájában az MCMC hatékony módszer valószínű- 
ségi modellekkel való számolásra, és számos változatát fejlesztették ki, közöttük 
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a 4. fejezetben bemutatott szimulált lehűtés algoritmust, a 7. fejezetben a sztochasztikus 
kielégíthetőség algoritmust, valamint a 15. fejezetben a Metropolis-Hastings-minta- 
vételezőt. 
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A 8. fejezetben kifejtettük az elsőrendű logika reprezentációs előnyeit az ítéletlogiká- 

hoz képest. Az elsőrendű logika objektumok és közöttük lévő relációk létezését veszi 

alapul, és képes tényeket kifejezni a tárgyterület néhány vagy összes objektumáról. Ez 
gyakran vezet olyan reprezentációkra, amelyek összehasonlítathatlanul tömörebbek, 

mint az ekvivalens ítéletlogikai leírások. Márpedig a Bayes-hálók alapvetően az ítélet- 
logikához kapcsolódnak: a változók halmaza rögzített és véges, és minden változónak 
rögzített értékkészlete van. Ez a tény korlátozza a Bayes-hálók felhasználhatóságát. 

Ha sikerül találnunk egy módszert arra, hogy az elsőrendű reprezentációk kifejezőere- 31 
jét a valószínűség-számítással kombináljuk, várható, hogy ugrásszerűen megnöveljük a 
kezelhető problémák körét. 

Ennek a célnak az eléréséhez a következő alapvető felismerés szükséges: az ítéletlo- 
gika szemszögéből nézve a Bayes-háló elemi események feletti valószínűségeket hatá- 
roz meg, amelyek mindegyike a hálózat minden változójára meghatároz egy értéket. 
Azaz, az ítéletlogika terminológiája szerint egy elemi esemény egy modell vagy egy 
lehetséges világ. Az elsőrendű felfogás szerint egy modell (az értelmezésével együtt) 
meghatározza az objektumok egy tárgykörét, a közöttük fennálló kapcsolatokat, és a 
tudásbázisbeli konstansok és predikátumok egy megfeleltetését a modellbeli objektu- 
mokra és kapcsolatokra. Ezért egy elsőrendű valószínűségi tudásbázisnak az összes "81 
lehetséges elsőrendű modell valószínűségét definiálnia kell. Legyen 1(M) a tudásbázis 
által az M modellhez rendelt valószínűség. Ekkor bármely 9 elsőrendű állításnak a P(o) 
valószínűségét a szokásos módon kapjuk, összegezve azon lehetséges világok felett, 
ahol 6 igaz: 


P(o)— ba mM) (14.12) 
M:óigaz M-ben 

Eddig rendben is volna. Azonban van egy probléma: az elsőrendű modellek halmaza 

végtelen. Ez azt jelenti, hogy (1) az összegzés kivitelezhetetlen, és (2) egy teljes, kon- 

zisztens eloszlás meghatározása a világok egy végtelen halmazán igen bonyolult lehet. 

Fogadjunk el ezért bizonyos korlátozásokat, legalábbis időlegesen. Nevezetesen, 
hogy tervezzünk egy olyan korlátozott nyelvet, amelyhez csak véges modell tartozik. 
Ez számos módon megtehető. Itt a relációs valószínűségi modelleket (relational pro- 
bability models, RPM) vagy RVM-eket ismertetjük, amelyek a szemantikus hálók (lásd 
10. fejezet) és objektumrelációs adatbázisok elméletéből is vettek át elemeket. Egyéb 
megközelítések az irodalmi és történeti megjegyzésekben szerepelnek. 

Az RVM-ek megengednek konstans szimbólumokat, amelyek objektumokat nevez- 
nek meg. Például legyen KovácsProf egy professzor neve, János pedig egy diák neve. 
Minden objektum az osztály egy példánya: például KovácsProf egy Professzor és János 
egy Diák. Feltesszük, hogy minden konstans szimbólum osztálya ismert. 
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Függvényszimbólumaink kétfelé lesznek osztva. Az első fajtába tartozók, az egyszerű 
függvények (simple functions), egy objektumot nem egy másik strukturált objektumra 
képeznek le, hanem egy értékre egy rögzített értéktartományból, pontosan úgy, ahogy 
egy valószínűségi változónál. Például az IntelligenciatJános) és a Finanszírozás(Ko- 
vácsProf) lehet magas vagy alacsony; a Siker(János) és a Hírné((KovácsProf) tehet 
igaz vagy hamis. Függvényszimbólumok nem alkalmazhatók olyan értékekre, mint az 
igaz vagy a hamis, így nem lehetséges egyszerű függvények egymásba ágyazása. Ezzel 
elkerüljük a végtelenség egyik forrását. Egy adott objektumon alkalmazott egyszerű 
függvény értéke lehet megfigyelt vagy ismeretlen; reprezentációnkban ezek lesznek az 
elemi valószínűségi változók.!0 

Megengedünk emellett komplex függvényeket (complex functions) is, amelyek 
objektumokat képeznek le más objektumokra. Például a Konzulens(János) lehet 
KovácsProf. Minden komplex függvénynek van egy megadott értéktartománya és 
értékkészlete, amik osztályok. Például a Konzulens értéktartománya a Diák és érték- 
készlete a Professzor. A függvények csak helyes osztályokra alkalmazhatók; például 
a KovácsProf Konzulens-e nem definiált. Komplex függvények egymásba ágyazhatók: a 
TanszékVezető( Konzulens(János)) lehet MórProf. Egyelőre feltesszük, hogy minden 
komplex függvény értéke ismert az összes konstans szimbólumra. Mivel a TB véges, ez 
maga után vonja, hogy komplex függvények alkalmazásának minden láncolata elvezet 
a véges számú objektum egyikéhez." 

Az utolsó elem, amire szükségünk van, az a valószínűségi információ. Minden egy- 
szerű függvényhez specifikáljuk a szülők egy halmazát, csakúgy, mint a Bayes-hálóknál. 
A szülők lehetnek ugyanannak az objektumnak más egyszerű függvényei; például egy 
Professzor-nak a Finanszírozás-a függhet a Hírnév-től. A szülők lehetnek még kapcsoló- 
dó objektumok egyszerű függvényei — például egy diák Sikere függhet a diák Intelli- 
genciá-jától és a diák konzulensének Hírnév-től. Ezek valóban univerzálisan kvanti- 
fikált állítások egy osztály minden objektumának szüleiről. Így írhatjuk azt, hogy 


Vx x € Diák 2 Szülők(Siker(x)) — (Intelligencia(x), Hírnév( Konzulens(x))) 


(Kevésbé formálisan a 14.16. (a) ábrához hasonló diagrammokat rajzolhatunk.) Most 
megadjuk a gyermek feltételes valószínűség eloszlását, ahol a feltételt a szülei jelentik. 
Például mondhatjuk. hogy: 


Vx x € Diák 5 
P(Siker(x) — igaz] (/ntelligenciatx) — magas, Hírné(Konzulensíx)) — igaz) — 095 


Csakúgy, mint a szemantikus hálókban, csatolhatunk feltételes eloszlásokat magához 
az osztályhoz is, így a példányok öröklik (inherit) a függéseket és a feltételes valószí- 
nűségeket az osztálytól. 

Az RVM nyelv szemantikája felteszi, hogy minden konstans szimbólum egy külön- 
álló objektumra hivatkozik — az egyedi név feltételezést (unigue names assumption) 


10 agyon hasonló szerepet töltenek be. mint a változómentes atomi mondatok. amelyek a 9.1. alfejezetben 
leírt ítéletlogikai állításokra való visszavezetési folyamatban generálódnak. 

"1 Ez a megkötés azt jelenti, hogy nem használhatunk olyan komplex függvényeket. mint Apa vagy Anya, 
amelyek potenciálisan végtelen láncokat eredményezhetnének egy ismeretlen objektummal végződve. Ezt a 
megkötést később újra meggondoljuk. 
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Hírmér 


Finanszírozás 








(a) 69 


14.16. ábra. (a) Egy két osztályt (Professzor és Diák) leíró RVM. Két professzor és két diák van, mind- 
két diák konzulense KovácsProf. (b) Az (a)-beli RVM Bayes-háló ekvivalense. 


a 10. fejezetben írtuk le. Ezen feltevés mellett és a korábban felsorolt megkötésekkel, 
meg lehet mutatni, hogy minden RVM valószínűségi változók egy rögzített, véges halma- 
zát generálja, amelyek mindegyike egy egyszerű függvény egy konstans szimbólumra 
alkalmazva, Ekkor — feltéve, hogy a szülő-gyermek függések körmentesek — megkonstru- 
álhatunk egy ekvivalens Bayes-hálót. Azaz az RVM és a Bayes-háló azonos valószínűsé- 
geket határoz meg minden lehetséges világra. A 14.6. (b) ábra mutatja azt a Bayes-hálót, 
ami a 14.16. (a) ábra RVM-jéhez tartozik. Vegyük észre, hogy az RVM-ben szereplő 
Konzulens kapcsolatok nincsenek jelen a Bayes-hálóban. Ennek oka, hogy rögzítettek és 
ismertek. Azonban közvetetten feltűnnek a háló topológiájában; például a Siker(János) 
szülője a Hírnév( KovácsProf), mivel a Konzulens(János) értéke a KovácsProf. Általában, 
az objektumok között fennálló relációk meghatározzák az ezen objektumok tulajdonsá- 
gai között fennálló függőségeket. 

Az RVM-ek kifejezési erejének megnövelésére számos módszer kínálkozik. Megen- 
gedhetünk rekurzív függéseket (recursive dependencies) a változók között, hogy bízo- 
nyosfajta visszatérő kapcsolatokat kezelni tudjunk. Például tegyük fel, hogy a gyorsét- 
termi ételektől való függőséget egy McGén okozza. Ekkor minden x-re McGén(x) függ a 
McGérn(Apa(x)) és McGér(Anya(x))-től, amelyek viszont függnek a McGén(Apa(Apa(x))) 
és a McGén(Anya(Apa(x)))-től és így tovább. Bár az ilyen tudásbázisok végtelen változót 
tartalmazó Bayes-hálókhoz tartoznak, fixpont-egyenletekből olykor megoldásokhoz jut- 
hatunk. Például a kiszámítható a McGén egyensúlyi eloszlása, az öröklődés adott felté- 
teles valószínűsége mellett. A rekurzív tudásbázisok egy másik igen fontos családja a 
15. fejezetben leírt időbeli valószínűségi modelleket (temporal probabílity models) 
tartalmazza. Ezekben a modellekben a ? időpillanatbeli állapot tulajdonságai a t— 1 idő- 
Pillanatbeli állapot tulajdonságaitól függnek és így tovább. 

Az RVM-ek szintén kiterjeszthetők, hogy megengedjenek kapcsolati bizonytalanságot 
(relational uncertainty) is — azaz bizonytalanságot a komplex függvények értékeinél. Pél- 
dául lehet, hogy nem tudjuk, kicsoda a Konzulens(János). Ekkor a KonzulensíJános) egy 
valószínűségi változó lesz, aminek lehetséges értékei KovácsProf és MórProf. A megfelelő 
hálót a 14.17. ábra mutatja. 

Szintén jelen lehet azonossági bizonytalanság (identity uncertainty); például eset- 
leg nem tudjuk. hogy Mária és KovácsProf ugyanaz a személy-e. Azonossági bizony- 
talanság esetén az objektumok és az állítások száma változhat a lehetséges világokban. 


610 14. VALÓSZÍNŰSÉGI KÖVETKEZTETÉS 


Hírné(KovácsProf) 
inanszírozás(KovácsProf)) 


inanszírozásíMórProf) 












14.17. ábra. Egy Bayes-háló részlete, ami egy olyan RVM-hez tartozik, amelyben a Konzulens(János) 
ismeretlen, de vagy KovácsProf, vagy MórProf. A konzulens választása az egyes professzorok finanszí- 
rozásától függ. Vegyük észre, hogy a SikerlJános) most mind a két professzor Hírnev-étőt függ, bár a 
KonzulensíJános) érnéke meghatározza, hogy valójában melyiknek is van hatása. 


Annak a világnak, ahol Mária és KovácsProf ugyanaz a személy eggyel kevesebb ob- 
jektuma van, mint annak a világnak, ahol ők különböző személyek. Ez a következteté- 
si eljárást bonyolultabbá teszi, de a (14.12) egyenlet által lefektetett alapelv érvényben 
marad: bármely kijelentés valószínűsége jól definiált és kiszámítható. Az azonossági 
bizonytalanság különösen fontos robotok és beágyazott érzékelőrendszerek esetén, 
amelyeknek több objektumot ís követniük kell. Erre a problémára a 15. fejezetben visz- 
szatérünk. 

Vizsgáljuk meg most a következtetés kérdését. Világos. hogy a következtetés elvé- 
gezhető az ekvivalens Bayes-hálóban, feltéve, hogy az RVM nyelvet úgy korlátozzuk, 
hogy az ekvivalens háló véges és rögzített struktúrájú. Ez analóg azzal a módszerrel, 
ahogy elsőrendű logikai következtetést végezhetünk el ítéletlogikai következtetéssel, az 
ekvivalens ítéletlogikai tudásbázisban (lásd 9.1. alfejezet). Ahogy a logikai esetben is, 
az ekvivalens háló túlságosan nagy ahhoz, hogy megkonstruáljuk, különösen ahhoz, 
hogy kiértékeljük. A sűrű összekötöttség szintén probléma (lásd 14.12. feladat). A kö- 
zelítő algoritmusok, mint az MCMC (lásd 14.5. alfejezet), ezért igen hasznosak RVM- 
kben való következtetésre. 

Amikor az MCMC-t egy egyszerű RVM-tudásbázisának az ekvivalens Bayes- 
hálójára alkalmazzuk, ahol a tudásbázis nem tartalmaz kapcsolati vagy azonossági 
bizonytalanságot, az algoritmus a lehetséges világok teréből mintavételez, amit az 
objektumok egyszerű függvényeinek értékei határoznak meg. Világosan látható, hogy 
ez a megközelítés kiterjeszthető a kapcsol. az azonossági bizonytalanságok keze- 
lésére is. Ebben az esetben a lehetséges világok közötti átmenet lehet, hogy egy egy- 
szerű függvény értékét vagy egy komplex függvényt változtat meg, ami a függési 
struktúra megváltozásához is vezethet. Az átmenetek szintén megváltoztathatják a kons- 
tans szimbólumok közötti azonossági relációkat. Így az MCMC elegáns módszernek 
tűnik következtetések elvégzésére igen nagy kifejezőerejű, elsőrendű valószínűségi 
tudásbázisokban. 

A kutatás ezen a területen még a kezdeteknél tart, de az egyre nyilvánvalóbb, hogy 
az elsőrendű valószínűségi érvelés az MI-rendszerek óriási hatékonyságnövekedését 
eredményezi a bizonytalanság kezelése kapcsán. A potenciális alkalmazások között 
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jelen van a számítógépes látás, a számítógépes nyelvészet, az információ-visszakeresés 
és a szituációértékelés. Ezen területek mindegyikén az objektumok halmaza — és így va- 
lószínűségi változók halmaza — nem ismert előre, így a tisztán , kijelentéseken" alapu- 
ló módszerek, mint például a Bayes-hálók, nem képesek a helyzetet teljesen leírni. Ezen 
módszereket kiegészítették a modellek tere feletti kereséssel, de az RVM-ek egyetlen 
modellben teszik lehetővé a következtetést ilyen típusú bizonytalanság esetén is. 


14.7. EGYÉB MÓDSZEREK A BIZONYTALAN. 
KÖRNYEZETBEN TÖRTÉNŐ KÖVETKEZTETÉSHEZ 


Más tudományágak (például fizika, genetika, közgazdaságtan) régóta a valószínűség- 
számítást részesítették előnyben a bizonytalanság modellezésére. !? Pierre Laplace 1819-es 
megfogalmazásában ,,A valószínűség-számítás semmi egyéb, mint a józan ész számokban 
megfogalmazva". James Maxwell 1850-ben tett kijelentése szerint , a világ igazi logikája 
a valószínűségek kalkulusa, ami figyelembe veszi a valószínűség nagyságát, ahogy azt 
minden gondolkodó ember megteszi vagy meg kellene tennie". 

Ezt a régi tradíciót látva talán meglepő, hogy az MI a valószínűség-számítás helyett szá- 
mos alternatívával kísérletezett. Az 1970-es évekbeli első szakértői rendszerek teljesen fi- 
gyelmen kívül hagyták a bizonytalanságot, és szigorúan logikai következtetést használtak, 
de hamar kiderült, hogy ez a legtöbb valós problémánál nem alkalmazható. 
A szakértői rendszerek következő generációja (különösen az orvosi tárgytartományokban) 
valószínűségi technikákat használt. A kezdeti eredmények biztatók voltak, de nem voltak 
skálázhatók nagyobb problémákra a teljes együttes valószínűség-eloszlás megadásához 
szükséges exponenciális számú érték miatt. (Hatékony Bayes-hálós algoritmusok ekkor 
még nem voltak ismertek.) Ennek eredményeképpen a valószínűségi megközelítések el- 
vesztették vonzerejüket 1975 és 1988 között, és számos egyéb alternatívát próbáltak ki; 


s Egy elterjedt nézet szerint a valószínűség-számítás alapvetően numerikus jellegű, 
míg az emberi ítélethozatal sokkal , kvalitatívabb". Az bizonyos, hogy nem vagyunk 
tudatában, hogy különböző fokú bizonyossággal végzünk numerikus számításokat. 
(Ahogyan a logikai egyesítés elvégzésének sem vagyunk tudatában, mégis úgy 
tűnik, hogy képesek vagyunk valamilyenfajta logikai érvelésre.) Lehetséges, hogy a 
bizonyosság valamilyen numerikus fokát közvetlenül tárolják az idegsejtek kapcso- 
latainak és aktivációinak erősségei. Ebben az esetben ezen erősségek tudatos elérésé- 
nek a nehézsége nem meglepő. Azt is el kell ismerni, hogy a kvalitatív következteté- 
si mechanizmus a valószínűség-számítási alapokra is felépíthető, így a , nincsenek 
számok" érv a valószínűségek ellen nem meggyőző. Mindazonáltal néhány kvalitatív 
módszer igen hasznosnak tűnhet a sajátos tulajdonságaik miatt. Az egyik legjobban 
tanulmányozott módszer az alapértelmezéseken alapuló következtetés (default 
reasoning), ami nem úgy kezeli a következtetetéseket, mint amikben , bizonyos fokig 
hiszünk", hanem mint , amikben addig hiszünk, amíg nincs jobb indok valami mást 
hinni". Az alapértelmezéseken alapuló következtetés a 10. fejezetben szerepel. 


12 A bizonytalan ismereteket ésfvagy bizonytalan következtési formákat tartalmazó következtetéseket a to- 
vábbiakban egységesen , bizonytalansági következtetéseknek" nevezzük. (A ford.) 
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a Szabályalapú (rule-based) megközelítésekkel is megpróbáltak bizonytalanságot 
kezelni. Ezek a módszerek a logikai szabályrendszerek sikereit akarták felhasználni, 
de hozzáadva minden szabályhoz valamilyen , kiagyalt" ad hoc tényezőt, ami a bi- 
zonytalanságot kezeli. Ezeket az eljárásokat az 1970-es évek közepén fejlesztették 
ki, és igen nagy számú szakértői rendszer alapjául szolgáltak, különösen orvosi és 
egyéb területeken. 

s Az ismerethiány (ignorance) (ami a bizonytalansággal bizonyos értelemben szem- 
beállítható) kérdéseit eddig még nem érintettük. Fontoljuk meg egy érme feldobását. 
Ha tudjuk, hogy az érme szabályos, akkor ésszerűnek tűnik, hogy a fej valószínűsé- 
ge 0,5. Ha tudjuk, hogy az érme szabálytalan, de nem tudjuk, milyen módon, akkor 
0,5 az egyetlen ésszerűnek tűnő valószínűség. Nyilvánvaló, hogy a két eset ki 
böző, de a valószínűségük láthatóan nem különbözteti meg őket. A Dempster— 
Shafer-eimélet (Dempster-Shafer theory) intervallumértékeket (interval-valued) 
használ a bizonyosság fokozataira, így reprezentálja az ágens tudását egy állítás 
valószínűségéről. Más, másodrendű valószínűségeket használó módszereket is tár- 
gyalunk majd. 

s A valószínűség-számítás ugyanazt a lételméleti feltevést használja, mint a logika: az 
események vagy igazak, vagy hamisak a világban, még ha az ágens bizonytalan is, 
melyik is áll fenn. A fuzzy logika (fuzzy logic) kutatói egy másik ontológiát java- 
soltak, ami megengedi a meghatározatlanságot (vagueness) is: azt. hogy egy ese- 
mény lehet , valamennyire" igaz. A meghatározatlanság és a bizonytalanság valójá- 
ban ortogonális témakörök, ahogy azt látni fogjuk. 





A következő három alfejezet ezen megközelítések mindegyikét egy kicsit részleteseb- 
ben mutatja be. Nem tartalmaznak részletes technikai leírásokat, de a megadott hívat- 
kozások segítséget nyújtanak további részletek eléréséhez. 


Bizonytalansági következtetés szabályalapú eljárásokkal 


A szabályalapú rendszerek a logikai következtés gyakorlati és szemléletes rendszerein 
való korai munkákból alakultak ki. A logikai rendszerek általában, és a logikai szabály- 
alapú rendszerek speciálisan, rendelkeznek az alábbi három tulajdonsággal: 


s Lokalitás (locality): logikai rendszerekben, ha van A — B formájú szabály, akkor a 
B kikövetkeztethető, ha az A bizonyíték adott, bármely más szabályra való tekintet 
nélkül. Valószínűségi rendszerekben a Markov-takaróban rendelkezésre álló összes 
tényt figyelembe kell venni. 

s Leválasztás (detachment): ha egyszer találtunk egy logikai bizonyítást B állítás 
kikövetkeztetéséhez, az állítást tetszés szerint felhasználhatjuk, a származtatásától 
függetlenül. Vagyis leválasztható (detached) a megokolásaitól. Valószínűségek ese- 
tén azonban a bizonyosság bizonyítékának a forrása fontos az elkövetkező következ- 
tetésekben. 

s  Igazságfüggvény (truth-functionality): a logikában az összetett kifejezések igaz- 
ságértéke kiszámítható az alkotóinak igazságértékéből. Valószínűségek kombinálá- 
sa nem lehetséges ezen a módon, csak szigorú, teljes függetlenségi feltételezések 
mellett. 
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Számos kísérlet történt olyan bizonytalansági következtetések kifejlesztésére, ahol ezek 
az előnyös tulajdonságok megmaradnak. Az elképzelés szerint a bizonyosság mértékét 
hozzárendeljük állításokhoz és szabályokhoz, és kifejlesztünk tisztán lokális sémákat a bi- 
zonyosságmértékek kombinálására és terjesztésére. A sémák egyben igazságfüggvények, 
például az A v B bizonyosságmértéke, az A- és B-beli bizonyosságok függvénye. 

A rossz hír a szabályalapú rendszerek számára, hogy a lokalirás, a leválasztás és az igaz- 
ságfüggvény egyszerűen nem alkalmas a bizonytalansági következtetés számára. Vizsgál- 
juk először az igazságfüggvényt. Legyen F az az esemény, hogy fejet kapunk egy szabá- 
lyos érme feldobásakor, legyen 1) az az esemény, hogy ugyanekkor írást kapunk, és legyen 
F) az az esemény, hogy fejet kapunk egy szabályos érme második feldobásakor. Világos, 
hogy mindhárom esemény valószínűsége 0.5, és egy igazságtartó rendszernek ugyanazt az 
értéket kell hozzárendelnie bármely kettő konjunkciójához. De láthatjuk, hogy a kon- 
junkció valószínűsége függ maguktól az eseményektől is, nem csak a valószínűségektől. 
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A helyzet még rosszabb, ha bizonyításokat láncolunk. Az igazságfüggvényeken alapuló 
rendszerekben léteznek A — B alakú szabályok (rules), amelyek lehetővé teszik, hogy 
kiszámítsuk B-beli bizonyosságunk értékét, mint annak függvényét, hogy mennyire 
hiszünk a szabályban, és mennyire hiszünk A-ban. Ekkor természetesen mind előre-, 
mind hátrahaladó rendszereket is ki lehet fejleszteni. A szabálybeli bizonyosságunkat 
konstansnak tételezzük fel, amit általában a tudásmérnök határoz meg, például Am B. 

Gondoljuk a 14.11. (a) ábrán látható vizes-pázsit szituációra. Ha képesek szeretnénk 
lenni mind okozati, mind diagnosztikai következtetés elvégzésére, a két alábbi szabály- 
ra lesz szükségünk: 


Esőv VizesPázsit és VizesPázsit — Eső 


Ha nem vigyázunk, ez a két szabály visszacsatolásos módon fog működni úgy, hogy az 
Eső-re vonatkozó bizonyíték megnöveli a VizesPázsit-hoz tartozó bizonyosságot, ami 
viszont még inkább megnöveli az Eső-höz tartozó bizonyosságot. Nyilvánvaló, hogy 
bizonytalansági következtető rendszereknek nyilván kell tartaniuk, hogy milyen utakon 
terjedt a bizonyíték. 

Az okok közötti következtetés (vagy kimagyarázás) szintén bonyodalmas. Gondoljuk 
meg, mi is történik, ha a következő két szabályunk van: 


Locsoló — VizesPázsit és VizesPázsitv Eső 


Tételezzük fel, hogy látjuk a locsolót bekapcsolva. Előreláncolással a szabályainkon keresz- 
tül ez megnöveli azt a bizonyosságot, hogy a pázsit vizes, ami viszont megnöveli az esőhöz 
tartozó bizonyosságot. De ez képtelenség: a locsoló bekapcsolt állapota megmagyarázza a 
pázsit vizességét, így csökkentenie kell az esőhöz tartozó bizonyosságot. Egy igazságfügg- 
vényen alapuló rendszer úgy viselkedik, mintha a Locsoló— Eső szabályban is hinne. 
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Ezen nehézségek mellett hogyan lehetséges, hogy az igazságfüggvényen alapuló 
rendszereket valaha is hasznosnak tartották? A megoldás abban rejlik, hogy korlátozták 
a feladatokat körét, és a szabálybázist gondosan úgy tervezték meg, hogy nemkívána- 
tos kölcsönhatások ne következzenek be. A leghíresebb igazságfüggvényen alapuló 
rendszer bizonytalansági következtetésre a bizonyossági tényező (certainty factor) 
modell, amit a MYCIN orvosi diagnosztikai program számára fejlesztettek ki, és széles 
körben használták szakértői rendszerekben az 1970-es és az 1980-as években. A bizo- 
nyossági tényezők majdnem minden alkalmazása vagy tisztán diagnosztikai (mint a 
MycIN), vagy tisztán okozati szabálybázist tartalmazott. Továbbá a tények csak a sza- 
bálybázis , gyökereinél" léptek be, és a legtöbb szabálybázis egyszeresen összekötött 
volt. Heckerman megmutatta, hogy ezen feltételek mellett a bizonyossági tényezőkön 
alapuló következtetés kicsit eltérő változata ekvivalens a polifabeli Bayes-követ- 
keztetéssel (Heckerman, 1986). Más körülmények között, a bizonyossági tényezők 
katasztrofálisan helytelen bizonyosságot eredményezhetnek a tények túlzott figyelem- 
bevétele miatt. Amint a szabályhalmaz naggyá válik a szabályok között, a nemkívánatos 
interakciók egyre gyakoribbak, és a felhasználók azt találták, hogy számos szabálynak 
kell , hangolni" a bizonyossági faktorát. amikor új szabályokkal bővítenek. Szükségte- 
len mondani, hogy ez a megközelítés már nem ajánlott. 





Az ismerethiány reprezentálása: 
a Dempster-Shafer-elmélet 


A Dempster-Shafer-elméletet (Dempster-Shafer theory) azzal a céllal hozták létre, 
hogy megkülönböztethetővé váljon a bizonytalanság (uncertainty) és az ismeret- 
hiány (ignorance). Ez az elmélet egy állításnak nem a valószínűségét számítja ki, 
hanem helyette azt, hogy mennyi annak a valószínűsége, hogy a bizonyíték támogatja az 
állítást. A bizonyosságnak ezt a mértékét bizonyosságfüggvénynek (belief function) ne- 
vezik, és BeKX)-szel jelölik. 

Most visszatérünk a pénzérmés példánkhoz, a bizonyosságfüggvény bemutatásához. 
Tételezzük fel, hogy egy rossz kinézetű alak odamegy önhöz és felajánlja, hogy fogad- 
jon 1000 forintba, hogy a következő esetben fej lesz az eredmény. Mivel az érme lehet 
szabályos, de lehet szabálytalan is. milyen bizonyosságot kell ahhoz az eseményhez 
rendelni, hogy a következő eredmény fej lesz? A Dempster-Shafer-elmélet szerint mi- 
vel nincs bizonyíték egyik esetre sem, így azt keli mondani, hogy a bizonyosság 
Bel(Fej) — 0 és BeK-Fej) — 0. Ez szkeptikussá teszi a Dempster-Shafer-elméletet 
használó következtető rendszereket, aminek van egy intuitív vonzereje. Most tegyük fel, 
hogy rendelkezésre áll egy szakértő, aki 9997-os bizonyossággal tanúsítja, hogy az érme 
szabályos (azaz 9099-ban biztos, hogy P(Fej) — 0,5). Ekkor a Dempster-Shafer-elmélet 
azt adja, hogy BelkFej) — 0.9 x 0.5 — 045, és hasonlóan Bel(-Fej) — 09 x 0,5 — 045. 
Ekkor még mindig 109 az a , hiány", amit a tényeink nem fednek le. . Dempster szabá- 
lya" (Dempster, 1968) megmutatja, hogy hogyan kombináljunk tényeket, hogy új Bel ér- 
téket kapjunk, Shafer munkája pedig ezt egy teljes számítási modellként fogalmazta meg. 

Mint az alapértelmezéses következtetésnél, itt is probléma a bizonyosság és a cselek- 
vések összekapcsolása. Valószínűségek esetén a döntéselmélet szerint, ha P(Fej) — 0.5 
és P(-Fej) — 0,5, akkor (feltéve, hogy nyerni és veszteni 1000 forintot pontosan egy- 
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más ellentettjei) a következtető számára közömbös lesz a tét elfogadása vagy elutasítá- 
sa. Egy Dempster-Shafer-következtető esetén Be(( Fej) — 0. és így nincs oka elfogad- 
ni, de ugyanakkor BekFej) — 0, és így nincs oka vonakodni sem. Így látható. hogy 
ebben az esetben a Dempster-Shafer-következtető ugyanarra a következtetésre jutott, 
hogy hogyan cselekedjen. Sajnos a Dempster-Shafer-elmélet számos más esetben is 
megenged nem definiált döntéseket, amikor a valószínűségi következtetés konkrét 
választást eredményez. Valójában a hasznosság fogalma a Dempster-Shafer-modellben 
még nem kellően tisztázott. 

Dempster-Shafer-elmélet egyik értelmezése, hogy egy valószínűségi intervallumot 
definiál — az intervallum a Fej esetén a szakértő tanúságtétele előtt (0, 1]. míg utána 
[0,45, 0.55]. Az intervallum nagysága hasznos segítséget adhat annak megítélésében, 
hogy mikor van szükségünk további tényekre: elárulhatja, hogy a szakértő tanúságtéte- 
le akkor fog segíteni, ha nem tudjuk, hogy szabályos-e az érme, de nem fog segíteni, ha 
már tudjuk, hogy az érme szabályos. Azonban nincsenek világos irányelvek ennek 
megtételére vonatkozóan, mivel nincs világos értelmezés arra, hogy mit is jelent az in- 
tervallum szélessége. A Bayes-megközelítésben ez a fajta következtetés könnyen elvé- 
gezhető, ha megvizsgáljuk azt. hogy újabb tények begyűjtésével hogyan változna egy 
bizonyosság. Például a fejek megjelenésével kapcsolatos bizonyosságunkat jelentősen 
befolyásolná, ha tudjuk, hogy az érme szabályos, és aszimmetrikus súly észrevétele 
jelentősen befolyásolná azon bizonyosságunkat, hogy az érme szabályos. Egy teljes 
Bayes-modell magában foglalna ehhez hasonló tényezőkre vonatkozó valószínűségi 
becsléseket is, megengedve, hogy a , tudatlanságunkat" bizonyosságaink azon meg- 
változásának mértékével fejezzük ki, amelyek jövőbeli megfigyelések esetén követ- 
keznének be. 


A meghatározatlanság reprezentálása: 
fuzzy halmazok és logikák 


A fuzzy halmazok elmélete (fuzzy set theory) egy eszköz annak specifikálására, hogy 
egy objektum milyen mértékben illeszkedik egy bizonytalan leíráshoz. Például fontol- 
juk meg azt az állítást, hogy , Nóri magas". Igaz ez akkor, ha Nóri 175 cm magas? 
A legtöbb ember vonakodna igent" vagy . nemet" mondani, és inkább azt választaná, 
hogy ,olyasmi", Látható. hogy ez nem egy külső világra vonatkozó bizonytalanság — 
mi biztosak vagyunk Nóri magasságában. A probléma az, hogy a , magas" nyelvi kife- 
jezés nem az objektumok éles kettéosztását jelenti - a magasságnak fokozatai vannak. 
Ezért a legtöbb szerző szerint a fuzzy halmazelmélet egyáltalán nem használható 
bizonytalansági következtetésekre. Ehelyett a fuzzy halmazelmélet a MagasSzemély-t 
egy fuzzy predikátumnak tekinti, aminek az igazságértéke inkább egy 0 és 1 közötti 
érték, mint hogy igaz vagy hamis lenne. A , fuzzy halmaz" név a predikátum értelme- 
zéséből származik, ahogyan implicite definiálja a halmaz tagjait — egy halmazt, aminek 
nincsenek éles határai. 

A fuzzy logika (fuzzy logic) egy eljárás olyan logikai kifejezésekkel való következ- 
tetésre, amelyek fuzzy halmazbeli tagsági állításokat írnak le. Például annak az össze- 
tett kifejezésnek, hogy MagasSzemély(Nóri) V Nehéz(Nóri) van fuzzy igazságértéke, 
ami a kifejezésben lévő komponensek igazságértékeinek a függvénye. Egy összetett 
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kifejezés T fuzzy igazságértékének a kiértékelésére a következő alapvető szabályok 
szolgálnak: 


TA AB) sz min((A), T(B)) 
THAVB) e max(T(A), TB) 
T(-A4) - 1- (A) 


A fuzzy logika tehát egy igazságfüggvényen alapuló rendszer, és ez komoly nehézsé- 
geket okoz. Tegyük fel például, hogy T(IMagasSzemél(Nóri)) — 0,6 és TNehéz(Nóri)) 
— 0,4. Ekkor azt kapjuk, hogy T(MagasSzemély(Nóri) A Nehéz(Nóri)) — 0.4, ami elfo- 
gadhatónak tűnik, de az is adódik, hogy T(MagasSzemély(Nóri) A -MagasSzemély(Nó- 
ri)) — 04, ami már nem. Világos, hogy a probléma amiatt lép fel, hogy az igazságfügg- 
vényen alapuló megközelítés nem képes kezelni a pozitív és negatív korrelációkat az 
állítás részei között. 

A fuzzy szabályozás (fuzzy control) egy metodológia olyan szabályozási rend- 
szerek alkotására, amelyekben a valós értékű bemenetek leképezését a kimeneti para- 
méterekre fuzzy szabályok reprezentálják. A fuzzy szabályozás nagyon sikeresnek 
bizonyult olyan kereskedelmi termékekben, mint az automatikus sebességváltók, a 
videokamerák és a villanyborotvák. A kritikusok [lásd például (Elkan, 1993)] úgy ér- 
veltek, hogy ezek az alkalmazások azért sikeresek, mert kicsi a szabálybázisuk, nem 
végeznek többlépéses következtetést, és hangolható paramétereik vannak, amelyek 
állításával a rendszer teljesítménye javítható. Az a tény, hogy fuzzy műveleteket hasz- 
nálnak, mellékes a sikereik szempontjából; a magyarázat egyszerűen az, hogy egy tö- 
mör és szemléletes módszert biztosítanak egyenletesen interpoláló, valós értékű függ- 
vények megadására. 

Voltak arra irányuló kísérletek, hogy a fuzzy logikát a valószínűség-számítás keretein be- 
lül értelmezzék. Az egyik elgundolás az, hogy az olyan kijelentéseket, mint , Nóri magas" 
úgy fogjuk fel, mint egy folytonos rejtett változó, Nóri valódi Magasság-ának diszkrét meg- 
figyeléseit. A valószínűségi modell meghatározza a P(, Megfigyelő állítja, hogy Nóri ma- 
gas" IMagasság) valószínűséget, például az 591. oldalon leírt probit eloszlás (probit distri- 
bution) felhasználásával. Ekkor az a posteriori eloszlás Nóri magassága felett a megszokott 
módon számolható ki, például ha a modell része egy hibrid Bayes-hálónak. Egy ilyen meg- 
közelítés természetesen nem igazságfüggvényen alapuló. Például a feltételes eloszlás 


P(, Megfigyelő állítja, hogy Nóri magas"[Magasság, Súly) 


kapcsolatot enged meg a magasság és a súly között, ahogyan a megfigyelést okozzák. 
Így nagyon valószínűtlen, hogy valakit, aki két és fél méter magas és kilencven kilo- 
gramm, , magas és nehéz"-nek nevezzünk, bár a , két és fél méter" , magas"-nak és a 
kilencven kilogramm" , nehéz"-nek minősül. 

A fuzzy predikátumoknak szintén adható egy valószínűségi értelmezés a valószínűségi 
halmazokat (random sets) felhasználva — azaz olyan valószínűségi változókat, amiknek 
lehetséges értékei objektumok halmazai. Például a MagasSzemély egy valószínűségi hal- 
maz, amelynek lehetséges értékei emberek halmazai. A P(Magas — 51) valószínűség, 
ahol Sy az embereknek valamely konkrét halmaza, annak a valószínűsége, hogy ponto- 
san ezt a halmazt minősítené , magas"-nak a megfigyelő. Ekkor a , Nóri magas" való- 
színűsége minden olyan halmaz valószínűségének az összege, amelyben Nóri elemként 
jelen van. 
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Mind a hibrid Bayes-hálós megközelítés, mind a valószínűségi halmaz megközelítés 
úgy tűnik, hogy modellezi a meghatározatlanság egyes vetületeit bizonyosságok fel- 
használása nélkül. Mindazonáltal számos megválaszolatlan kérdés van a nyelvi megfi- 
gyelések és folytonos mennyiségek helyes reprezentációjával kapcsolatban, amely kér- 
désekkel a fuzzy kutatói közösségen kívül a többség nem foglalkozik. 


14.8. ÖSSZEFOGLALÁS 


Ez a fejezet a Bayes-hálókat (Bayesian networks) mutatta be, amelyek egy jól kidol- 
gozott reprezentációt jelentenek a bizonytalan tudás számára. A Bayes-hálók nagyjából 
hasonló szerepet töltenek be, mint amit az ítéletlogika a biztos tudás számára. 


s A Bayes-háló egy irányított körmentes gráf, aminek csomópontjai valószínűségi 
változókhoz tartoznak; minden csomóponthoz tartozik egy feltételes eloszlás, ahol 
a feltételt a csomópont szülei jelentik. 

s A Bayes-hálók tömör módot adnak a tárgyterület feltételes függetlenségi (condi- 
tional independence) kapcsolatainak a reprezentálására. 

s Egy Bayes-háló egy teljes együttes eloszlást specifikál; egy együttes bejegyzést a 
megfelelő lokális feltételes eloszlásokbeli bejegyzések szorzata határoz meg. Egy 
Bayes-háló gyakran exponenciálisan kisebb méretű, mint a teljes együttes eloszlás. 

s Számos feltételes eloszlást lehet tömören reprezentálni eloszlások kanonikus család- 
jaival. A hibrid Bayes-hálók (hybrid Bayesian networks), amelyek mind diszkrét, 
mind folytonos változókat tartalmaznak, sokféle kanonikus eloszlást használnak. 

5" A következtetés Bayes-hálókban a célváltozók egy halmaza valószínűség-eloszlásának 
kiszámítását jelenti, feltéve a tényváltozók egy halmazát. Az egzakt következtetési 
algoritmusok, mint a változó eliminálás (variable elimination) feltételes valószínűsé- 
gek szorzatainak összegét értékelik, amilyen hatékonyan csak lehet. 

s  Polifákban (polytrees) (egyszeresen összekötött hálókban) az egzakt következtetés 
számítási ideje a háló méretével lineárisan nő. Általános esetben a probléma kezel- 
hetetlen. 

s  Sztochasztikus közelítő számítási technikák, mint a valószínűségi súlyozás (likeli- 
hood weighting) és al Markov lánc Monte Carlo (Markov chain Monte Carlo) 
módszerek elfogadható becsléseket adnak a hálóbeli valódi a posteriori valószínű- 
ségekre, és sokkal nagyobb hálókkal is megbirkóznak, mint az egzakt algoritmusok. 

s A valószínűség-számítás kombinálható az elsőrendű logikából vett reprezentációs 
ötletekkel, hogy nagyon hatékony rendszereket hozzunk létre bizonytalanság esetén 
történő következtetéshez. A relációs valószínűségi modellek (RV.M-ek) eleget tesz- 
nek olyan reprezentációs megkötéseknek, amelyek egy olyan jól definiált valószínű- 
ség eloszlást garantálnak, amely egy ekvivalens Bayes-hálóval kifejezhető. 

s Számos egyéb rendszert is javasoltak a bizonytalanság esetén történő következ- 
tetéshez. Nagy általánosságban azt lehet mondani, hogy az igazságfüggvényen 
(truth-functional) alapuló rendszerek az ilyen érveléshez nem a legmegfelelőbb 
eszközök. 
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A hálók felhasználása valószínűségi információk reprezentálására Sewall Wright mun- 
kájával kezdődött el a 20. század elején a genetikai öröklődés analízisével és az álla- 
tok növekedési tényezőivel kapcsolatban (Wright, 1921; 1934). Az ő hálóinak egyike 
látszik ennek a könyvnek a borítóján. I. J. Good, Alan Turinggal együttműködve, 
olyan valószínűségi reprezentációkat és Bayes következtetési módszereket fejlesztett 
ki, amelyeket a modern Bayes-hálók előfutárának lehet tekinteni - bár a cikkre nem 
hivatkoznak gyakran ebben a kontextusban (Good, 1961)."3 Ugyanez a cikk az eredeti 
forrása a zajos-VAGY modellnek. 

A döntési problémák hatásdiagram (influence diagram) reprezentációját — ami a 
valószínűségi változók reprezentációjához egy irányított körmentes gráfot tartalmazott 
— döntéselemzések során használták az 1970-es évek vége felé (lásd 16. fejezet), de 
a kiértékelésre csak felsorolást használtak. Judea Pearl fejlesztette ki az üzenetváltó el- 
járást, a fa hálókban (Pearl, 1982a) és az egyszeresen összekötött (polifa) hálókban 
(Kim és Pearl, 1983) történő következtetésre, és szemben az akkor népszerű bizonyos- 
sági tényezős rendszerekkel, a diagnosztikai helyett a kazuális valószínűségi modellek 
létrehozásának fontossága mellett érvelt. Az első szakértői rendszer, ami Bayes-hálókat 
használt, a CONVINCE volt (Kim, 1983; Kim és Pearl, 1987). A későbbi rendszerek között 
találjuk a mozgatóidegekkel kapcsolatos rendellenességek diagnosztizálására szolgáló 
MUNIN (Andersen és társai. 1989) és a patológiás helyzetek felderítésére szolgáló 
PATHFINDER rendszert (Heckerman, 1991). Messze a legtöbbet használt Bayes-hálós 
rendszerek a Microsoft Windows diagnóziskijavítás moduljai (például a Nyomtató va- 
rázsló) (Breese és Heckerman, 1996) és az Office segéd a Microsoft Office-ban 
(Horvitz és társai, 1998). 

Általános Bayes-hálókban történő egzakt következtetésre Pearl fejlesztett ki egy cso- 
portosításon alapuló algoritmust, felhasználva egy konverziót változók csoportjai feletti 
irányított polifába, amelyben üzenetváltások biztosítják a csoportok közös változói felet- 
ti konzisztenciát. Egy hasonló módszer, amit David Spiegelhalter és Steffen Lauritzen 
fejlesztett ki (Spiegelhalter, 1986: Lauritzen és Spiegelhalter, 1988). egy irányítatlan 
Markov-hálóba vivő konverzión alapul. Az eljárást a HUGIN rendszerben valósították 
meg, ami egy hatékony és széles körben használt eszköz a bizonytalansági következ- 
tetések esetén (Andersen és társai, 1989). Ross Shachter, a hatásdiagramok kutatói 
közösségéből, egy egzakt módszert fejlesztett ki, ami a háló célirányos csökkentésén 
alapul a posteriori megőrző átalakításokat felhasználva. 

A fejezetben leírt változó eliminációs módszer Shachter módszeréhez áll legköze- 
lebb, amiből a szimbolikus valószínűségi következtetés (SZVK) módszere alakult ki 
(Shachter, 1990). Az SZVK megkísérli optimalizálni az olyan kifejezési fák kiértékelé- 
sét, mint amilyen a 14.8. ábrán látható. Az általunk ismertetett algoritmus a Zhang és 
Poole által kifejlesztetthez áll a legközelebb (Zhang és Poole, 1994; 1996). Irreleváns 
változók eltávolítására szolgáló kritériumokat Geiger és társai, illetve Lauritzen és 
társai fejlesztettek ki (Geiger és társai, 1990; Lauritzen és társai, 1990); az általunk 


13 [ J. Good vezető statisztikus volt Turing kódfeltörő csapatában a második világháború során. A 200I: 
űrodüsszeia c. művében Arthur C. Clarke Goodnak és Minskynek tulajdonította azokat az áttöréseket, amelyek 
a HAL számítógép kifejlesztéséhez vezettek (Clarke, 19682). 
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megadott kritérium ezeknek egy egyszerű speciális esete. Rina Dechter (Dechter, 1999) 
mutatta meg. hogy a változó eliminálás ötlete lényegében megegyezik a nem folyta- 
tólagos dinamikus programozással (nonserial dynamic programming) (Bertele és 
Brioschi, 1972). Ez egy algoritmikus megközelítés, amit Bayes-hálókban előálló követ- 
keztetési problémák széles körére lehet sikerrel alkalmazni. Ilyen probléma például meg- 
figyelések egy adott halmazához a legvalószínűbb magyarázat megkeresése. Ez össze- 
kapcsolja a Bayes-hálós algoritmusokat a kényszerkielégítési problémákat megoldó 
kapcsolódó módszerekkel, és közvetlen módszereket szolgáltat az egzakt következtetés 
komplexitására a háló hiperfájának a szélessége alapján. 

Folytonos valószínűségi változók jelenlétét Bayes-hálókban Pearl, illetve Shachter és 
Kenley vizsgálta (Pearl, 1988; Shachter és Kenley, 1989); ezek a cikkek kizárólag foly- 
tonos változókat tartalmazó hálókat tárgyaltak, amelyek lokális függési modelljei lineá- 
ris normális eloszlásúak. Diszkrét változók bevezetését Lauritzen és Wermuth vizsgálta 
(Lauritzen és Wermuth, 1989), amit a cHUGIN rendszerben meg is valósítottak (Olesen. 
1993). A probit eloszlást először Finney vizsgálta (Finney, 1947), szigmoid eloszlásnak 
nevezve. Az eloszlást széles körben használják diszkrét választási jelenségek modelle- 
zésére, és kiterjeszthető több mint két választási lehetőség kezelésére (Daganzo, 1979). 
A logit eloszlás használatához Bishop ad indoklást (Bishop, 1995). 

Cooper mutatta meg, hogy a következtetés általános problémája tetszőleges Bayes- 
hálóban NP-teljes (Cooper, 1990), Paule Dagum és Mike Luby pedig azt, hogy ennek 
a közelítő megoldása is NP-teljes (Dagum és Luby, 1993). A tárkomplexitás szintén 
komoly probléma mind a csoportosító, mind a változó eliminációs módszereknél. 
A vágóhalmaz feltételezéseken (cutset conditioning) alapuló eljárás, amit a kényszer- 
kielégítési problémákra az 5. fejezetben mutattunk be, elkerüli az exponenciális mére- 
tű táblák létrehozását. Egy Bayes-hálóban a vágóhalmaz a csomópontok azon halmaza, 
amelyek értékeinek rögzítése esetén a fennmaradó csomópontok függései egy fagráfra 
egyszerűsödnek, ami már lineáris időben és térben megoldható. A lekérdezést összeg- 
zéssel adhatjuk meg a vágóhalmaz minden lehetséges értékadása mellett, így az összes 
tárigény még mindig lineáris (Pearl, 1988). Darwiche (Darwiche, 2001) egy rekurzívan 
feltételező algoritmust ad meg, ami tetszőleges tár/idő egyensúlyt tesz lehetővé. 

Gyors közelítő algoritmusok Bayes-hálókra való kifejlesztése nagyon aktív terület, 
a statisztika, a számításelmélet és a fizika határterületén. Az elutasító mintavételezés 
módszere egy általános, a statisztikában régóta ismert technika; Bayes-hálóknál Max 
Henrion alkalmazta először, aki logikai mintavételezésnek (logic sampling) nevezte 
(Henrion, 1988). A valószínűségi súlyozás, amit Fung és Chang (Fung és Chang, 1989), 
illetve Shachter és Peot fejlesztettek ki (Shachter és Peot, 1989), egy példája a fontos- 
sági mintavétel (importance sampling) jól ismert statisztikai módszerének. A valószí- 
nűségi súlyozás nagymérvű felhasználását az orvosi diagnosztikában Shwe és Cooper 
jelenti (Shwe és Cooper, 1991). Cheng és Druzdzel a valószínűségi súlyozás adaptív 
verzióját közlik (Cheng és Druzdzel, 2000), ami akkor is jól működik. ha a bizonyíték 
a priori valószínűsége nagyon alacsony. 

A Markov lánc Monte Carlo (MCMC) módszerek a Metropolis algoritmussal kez- 
dődtek, ami Metropolisnak köszönhető (Metropolis és társai, 1953), ami a 4. fejezetben 
leírt szimulált lehűtés algoritmusának szintén a forrása. A Gibbs-mintavételezőt Geman 
és Geman fejlesztette ki irányítatlan Markov-hálókban történő következtetésre (Geman 
és Geman, 1984). Az MCMC Bayes-hálókban történő alkalmazása Pearinek köszönhető 
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(Pearl, 1987). A Gilks és társai által összegyűjtött cikkek MCMC-alkalmazások széles 
skáláját ölelik fel, számos közülük a jól ismert BuGsS csomaggal lett kifejlesztve (Gilks és 
társai, 1996). 

A közelítési módszereknek két nagyon fontos családja létezik, amelyeket nem tárgyal- 
tunk a fejezetben. Az első család a variációs közelítés (variational approximation) 
módszere, ami mindenfajta komplex számítás egyszerűsítésére felhasználható. Az alap- 
ötlet az, hogy az eredeti problémának előállítjuk egy olyan redukált verzióját, ami annyira 
egyszerű, hogy dolgozni lehessen vele, de amennyire lehet hasonló az eredeti problémá- 
hoz. A redukált probléma leírása tartalmazza a A variációs paramétereket (variational 
parameters), amelyeket úgy állítunk be, hogy minimalizáljon egy D távolságfüggvényt 
az eredeti és a redukált problémák között, gyakran a 0D/OX — 0 egyenletrendszer meg- 
oldásával. Számos esetben pontos felső és alsó korlátok kaphatók. Variációs módsze- 
reket régóta használnak a statisztikában (Rustagi, 1976). A statisztikus fizikában a 
mezőátlag (mean field) módszer egy speciális variációs módszer, amelyben a modellt 
alkotó egyes változókat teljesen függetlennek tételezzük fel. Ezt az ötletet felhasználva 
sikerült kezelni nagy irányítatlan Markov-hálókat (Peterson és Anderson, 1987; Parisi, 
1988). A variációs módszerek Bayes-hálókra történő alkalmazásának matematikai 
megalapozását Saul és társai fejlesztették ki, és ők kaptak a szigmoid hálókra pontos 
alsó korlát közelítéseket a mezőátlag módszerrel (Saul és társai, 1996). Jaakkola és 
Jordan úgy terjesztették ki a módszert (Jaakkola és Jordan, 1996), hogy mind az alsó, 
mind a felső korlát kinyerhető legyen. A variációs módszereket Jordan tekintette át 
(Jordan, 1999). 

A közelítő algoritmusok második családja Pearl fagráfon futó üzenetváltásos algorit- 
musán alapszik (Pearl, 1982a). Az algoritmust általános hálókra is lehet alkalmazni, 
ahogy Pearl javasolta (Pearl, 1988). Az eredmények lehetnek helytelenek, és lehet, 
hogy az algoritmus nem áll le, de számos esetben a szolgáltatott értékek közel vannak 
a helyes értékekhez. Ez az úgynevezett bizonyosságterjesztéses (belief propagation) 
vagy hurkos terjesztéses (loopy propagation) megközelítés kevés figyelmet kapott, 
mindaddig, amíg McEliece és társai fel nem figyeltek (McEliece és társai, 1998) arra, 
hogy az üzenetváltás többszörösen összekötött Bayes-hálókban pontosan megegyezik a 
turbó dekódolás (turbo decoding) algoritmus által végzett számítással (Berrou és tár- 
sai, 1993), ami jelentős áttörést eredményezett a hibajavító kódok tervezésében. Ebből 
az a következtetés vonható le, hogy a bizonyosságterjesztés gyors is és pontos is a na- 
gyon nagy méretű és nagyon sűrűn összekötött dekódolásra használt hálókban, és ezért 
Tehet, hogy általánosabban is hasznos lehet. Murphy és társai egy kísérletről számoltak 
be, ahol ez valóban működött (Murphy és társai, 1999). Yedidia és társai további kap- 
csolatokra mutattak rá a bizonyosságterjesztés és a statisztikus fizika között (Yedidia és 
társai, 2001). 

A valószínűség és az elsőrendű nyelvek közötti kapcsolatot Carnap tanulmányozta 
(Carnap, 1950). Gaifman, illetve Scott és Krauss megadott egy nyelvet, amelyben va- 
lószínűségeket elsőrendű mondatokhoz lehet kapcsolni, és amelyre a modellek valószí- 
nűségi mértékek voltak lehetséges világokon (Gaifman, 1964; Scott és Krauss, 1966). 
Az Ml.n belül ezt az ötletet az ítéletlogikára Nilsson, a predikátumlogikára pedig Halpern 
fejlesztette ki (Nilsson, 1986; Halpern, 1990). A tudásreprezentációs kérdések első kiter- 
jedt vizsgálatát ilyen nyelvek esetén Bacchus végezte (Bacchus, 1990), Wellman és 
társainak a tanulmánya a korai implementációkat tekinti át (Wellman és társai, 1992), 
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amelyek egy ekvivalens (ítéletlogikai) Bayes-háló létrehozásán alapulnak. Napjainkra 
a kutatók elkezdték megérteni a teljes tudásbázisok fontosságát, azaz olyan tudásbázisok 
fontosságát, amelyek akár a Bayes-hálók, egy egyértelmű együttes eloszlást definiálnak 
az összes lehetséges világ felett. Az erre szolgáló eljárások a logikai programozás va- 
lószínűségi verzióin (Poole, 1993; Sato és Kameya, 1997) vagy szemantikus hálókon 
(Koller és Pfeffer, 1998) alapultak. A fejezetben ismertetett típusú relációs valószínű- 
ségi modelleket Pfeffer vizsgálta részletesebben (Pfeffer, 2000). Pasula és Russell mind 
a relációs, mind az azonossági bizonytalanságot vizsgálta az RVM-ekben és az MCMC 
következtetés felhasználásában (Pasula és Russell, 2901). 

Amint a 13. fejezetben kifejtettük, a korai valószínűségi rendszerek kegyvesztettek 
lettek az 1970-es években, helyt adva az alternatív módszerek megjelenésének. A bizo- 
nyossági tényezőket a MYCIN orvosi szakértői rendszerbeli felhasználásra fejlesztették 
ki (Shortliffe, 1976), amit egyrészt mérnöki megoldásnak is, másrészt az emberi ítélet- 
hozatal modelljének is javasolták, bizonytalanság esetében. A Rule-Based Expert Systems 
gyűjtemény (Buchanan és Shortliffe, 1984) teljes áttekintést ad a MYcIN-ről és leszárma- 
zottairól (lásd még [Stefik, 1995]). David Heckerman megmutatta, hogy a bizonyossági 
tényezős számítások kicsit módosított verziója már helyes valószínűségeket ad bizonyos 
esetekben, de más esetekben a bizonyítékok hibát okozó, túlzott figyelembevételére 
vezet (Heckerman, 1986). A PROSPECTOR szakértői rendszer (Duda és társai, 1979) sza- 
bályalapú megközelítést használt, amiben a szabályokat (ritkán tartható) giobális füg- 
getlenségi feltételezésekkel igazolták. 

A Dempster-Shafer-elmélet Arthur Dempster publikációjával kezdődött, amiben a 
pontszerű valószínűségi értékek általánosítását javasolta intervallumértékekre, és sza- 
bályokat javasolt a kombinálásukra (Dempster, 1968). Glenn Shafer későbbi munkája 
vezetett el a Dempster-Shafer-elmélet és a valószínűség-számítás egymással versengő 
szemléletéhez (Shafer, 1976). Ruspini a Dempster-Shafer-elmélet és a valószínűség- 
számítás kapcsolatát elemezte (Ruspini és társai, 1992). Shenoy a Dempster-Shafer 
bizonyosságfüggvény alapján egy eljárást javasolt a döntéshozatalra (Shenoy, 1989). 

A fuzzy halmazokat Lotfi Zadeh dolgozta ki válaszul arra a nehézségre (Zadeh, 1965), 
hogy egzakt bemeneti értékeket adjunk az intelligens rendszerek számára. Zimmermann 
leírása (Zimmermann, 2001) részletes bevezetést nyújt a fuzzy halmazok elméletébe; a 
(Zimmermann, 1999) pedig fuzzy alkalmazásokról szóló cikkek gyűjteménye. Amint 
korábban említettük, a fuzzy logikát gyakran tekintik a valószínűség-számítás verseny- 
társának, pedig valójában eltérő kérdésekkel foglalkozik. A lehetőségelméletet (possi- 
bility theory) (Zadeh, 1978) a bizonytalanság kezelésére vezették be fuzzy rendszerek- 
ben, és sok közös vonása van a valószínűség-számítással. Dubois és Prade alapos át- 
tekintést nyújt a lehetőségelmélet és a valószínűség-számítás kapcsolatáról (Dubois és 
Prade, 1994). 

A valószínűség-számítás MI-n belüli feltámadása főként a Bayes-hálók felfedezésén 
múlt, ami módszert adott a feltételes függetlenségek reprezentálására és kihasználá- 
sára. Ez az újjászületés igen küzdelmes volt; Peter Cheeseman harcias In defense of 
Probability (Cheeseman, 1985) és a későbbi An Inguire into Computer Understanding 
(Cheeseman, 1988, megjegyzésekkel) c. cikke ízelítőt ad a vitából. A logika művelői- 
nek egyik legfőbb kifogása az volt, hogy a valószínűség-számítás miatt szükségesnek 
vélt számítások önelemzéssel nem érhetők el, és egy nem reális pontossági szintet tételez- 
nek fel a bizonytalan tudásunkban. A kvalitatív Bayes-hálók (gualitative probabilistic 
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networks) (Wellman, 1990a) lehetőséget adnak a Bayes-hálók tisztán kvalitatív absztrak- 
ciójára, csupán a változók közötti hatások pozitív és negatív jellegét kihasználva. 
Wellman megmutatta, hogy számos esetben ennyi információ is elegendő az optimális 





és Matt Ginsberg munkája kivonatolja a valószínűség-számítás elméletében szerepelő 
feltételesség és a tények kombinálásának alapvető tulajdonságait, és megmutatja, ho- 
gyan lehet ezeket alkalmazni logikai és alapértelmezési következtetésekben (Darwiche 
és Ginsberg, 1992). 

A fejezetben leírt szívbetegség-kezelő rendszer Lucastól származik (Lucas, 1996). 
A Bayes-hálók más területen történő alkalmazásai között találjuk egyebek között a 
Microsoftnál végzett fejlesztéseket a felhasználó céljainak kikövetkeztetésére (Horvítz 
és társai, 1998) és a kéretlen elektronikus levelek szűrésére (Sahami és társai, 1998), az 
Electric Power Research Institute fejlesztését áramgenerátorok figyelésére és a NASA 
fejlesztését időkritikus információk megjelenítésére a Mission Controlnál Houstonban 
(Horvitz és Barry, 1995). 

Az MI-n belüli bizonytalansági következtetéssel kapcsolatos számos fontos korai 
publikáció megtalálható a Readings in Uncertain Reasoning (Shafer és Pearl, 1990) és az 
Uncertainty in Artifical Intelligence (Kanal és Lemmer, 1986) antológiákban. A Bayes- 
hálók témakörének fejlődésében a legfontosabb egyedülálló publikáció vitathatatlanul a 
Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference (Pearl, 
1988). Több kiváló munka tartalmazza az újabb anyagokat, mint például (LLauritzen, 
1996; Jensen, 2001: Jordan, 2003). A valószínűségi következtetéssel kapcsolatos új 
eredmények mind az MI fő irányait meghatározó főbb lapokban. mint pl. az Artificial 
Intelligence-ben, mind a specializáltabb folyóiratokban, mint amilyen az International 
Journal of Approximate Reasoning jelennek meg. A gráfos modellekről (graphical 
models), amely modellosztály magában foglalja a Bayes-hálókat is, számos cikk statisz- 
tikai újságokban jelenik meg. Az Uncertainty in Artificial Intelligence (UAD, a Neural 
Information Processing Systems (NIPS) és az Artificial Intelligence and Statistics 
(AISTATS) konferenciák kiadványai kiváló forrásai a legfrissebb kutatásoknak. 





Akkumulátor 












Üzemanyag 


Beindul 


14.18. ábra. Egy gépkocsi elektromos és motorikus rendszereinek részeit leíró Bayes-háló Minden vál- 
tozó bináris, és az igaz érték jelzi a megfelelő funkció helyes működését. 
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Feladatok 


14.1. 


14.2. 


14.3. 


Tekintsük a 14.18. ábrán látható gépkocsi-diagnosztikai hálót. 

(a) Egészítse ki a hálót a Jegesldő és az IndítóMotor bináris változókkal, 

(b) Adjon meg ésszerű feltételes valószínűségi táblákat az összes csomópontra. 

(c) Hány független értéket tartalmaz a teljes együttes valószínűség-eloszlás 
függvény 8 bináris csomópont esetén, feltételezve, hogy nincs közöttük fel- 
tételes függetlenségi reláció? 

(d) Hány független valószínűségi értéket tartalmaznak az ön hálójának táblá- 
zatai? 

(e) A Beindul feltételes valószínűség eloszlása megadható egy zajos-ÉS elosz- 
lással. Írja le ezt az eloszláscsaládot általában és kapcsolatát a zajos-VAGY 
eloszláshoz. 


A helyi nukleáris erőműben van egy riasztó, ami érzékeli, ha a hőmérsékletmé- 

rő egy adott küszöbértéket meghalad. A mérő a reaktormag hőmérsékletét mé- 

ri. Tekintse a következő bináris változókat: R (riasztó hangja), Hp (hibás riasz- 

tó), Hy (hibás mérő) és a következő többértékű változókat: M (mérő) és H (egy 

aktuális belső hőmérséklet). 

(a) Rajzoljon fel egy Bayes-hálót a tárgytartományra, feltételezve, hogy való- : 
színűbb, hogy a mérő akkor hibásodik meg, ha a hőmérséklet túl magas. 

(b) A hálózata polifa lett? 

(c) Tételezze fel, hogy a hőmérsékletnek csak két lehetséges értéke van: normá- 

lis és magas; és hogy a mérő helytelen hőmérsékletet mér az esetek x99-ában, 

ha működik, és y96-ában, ha hibás. Adja meg az M feltételes valószínűség- 

tábláit. 

Tételezze fel. hogy a riasztó tökéletesen működik, hacsak nem hibás, mely 

utóbbi esetben egyáltalán nem riaszt. Adja meg az R-hez tartozó feltételes 

valószínűség-táblát. 

(e) Tételezze fel, hogy a mérő és a riasztó működik, és a riasztó megszólal. Fe- 
jezze ki annak a valószínűségét, hogy a reaktormag hőmérséklete magas a 
háló feltételes valószínűségeinek a függvényében. 


(d. 


Két csillagász — távcsöveiket használva — a világ különböző részein My és M2 
méréseket végeznek az égbolt egy kis részén látható csillagok számáról (Sz). Ál- 
talában egy kis e valószínűsége a hibának, ami egy csillagnyi eltérést jelent. 
Bármelyik távcsővel megtörténhet az is (egy sokkal kisebb f valószínűséggel), 
hogy nincs rendesen fókuszálva (F, és F, események), amely esetben a tudós 3 
vagy több csillaggal kevesebb csillagot számlál (ha Sz kisebb mint 3, akkor 
egyetlen csillagot sem észlel). Tekintsük a 14.19. ábrán látható három hálót. 
(a) Melyik Bayes-háló reprezentálja helyesen (de nem feltétlenül hatékonyan) 
a fenti ismereteket? 
(b) Melyik a legjobb háló? Adjon magyarázatot. 
(c) Adjon meg egy ésszerű feltételes valószínűségi táblát a P(MIlSz) értékeire, 
amikor M, € (0, I, 2, 3, 4) és Sz € (1, 2, 3). A feltételes eloszlás minden 
értékét az e és az f paraméterek függvényében fejezze ki. 
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hal 


Gin ai) 





14.19. ábra. Három lehetséges háló a távcsőproblémára 


(d) Tételezze fel, hogy My — 1 és M) — 3. Mik a csillagok lehetséges számai, ha 
a priori nem korlátozzuk Sz értékét? 

(e) Mi a csillagok legvalószínűbb száma ezen megfigyelések esetén? Magya- 
rázza el ennek kiszámítását, vagy ha nem lehetséges kiszámítani, magya- 
rázza el, milyen további információkra van szükség, és hogy az miként be- 
folyásolná az eredményt. 


14.4. Tekintsük a 14.19. (ii) ábrán látható hálót, és tegyük fel, hogy a két teleszkóp 


azonosan működik. Legyen Mi, M2 € (0, I, 2, 3, 4) és Sz € (1, 2, 3) a 14.3. 
feladatban megadott szimbolikus FVT-kkel. A felsoroló algoritmus felhasználá- 
sával számolja ki a következő valószínűség-eloszlást: P(SzlM) — 2, M, — 2). 


14.5. Tekintsük a lineáris Gauss lokális eloszlású hálók családját, amit az 589. oldal 


illusztrál. 

(a) Egy kétváltozós hálóban legyen X az X2 szülője, X-nek legyen normális a 
priori eloszlása, P(X.IX1) pedig egy lineáris normális eloszlás. Mutassa meg, 
hogy a P(X4, X2) együttes eloszlás egy többváltozós Gauss-eloszlás, és szá- 
molja ki ennek a kovarianciamátrixát. 

(b) Bizonyítsa be indukcióval, hogy egy általános lineáris Gauss-háló 
XI, .... X,ren vett együttes eloszlása szintén többváltozós Gauss-eloszlás. 


14.6. Az 591. oldalon definiált probit eloszlás egy bináris gyermek valószínűség- 


eloszlását írja le, egyetlen folytonos szülő esetén. 

(a) Hogyan terjeszthető ki a definíció több folytonos szülő esetére? 

(b) Hogyan terjeszthető ki, hogy többértékű gyermekváltozóra is alkalmazható 
legyen? Gondolja végig mind a két esetet, amikor a gyermek értékei sorren- 
dezettek (ahogyan a vezetésnél a sebességfokozat megválasztása a sebesség, 
a lejtés. a kívánt gyorsulás stb. függvénye), és amikor nem állíthatók sorba 
(mint például a busz, a vonat vagy a kocsi választása munkába menetelnél). 
(Segítség: gondoljunk a lehetséges értékek két csoportra osztására, hogy bi- 
náris változót szimuláljunk.) 
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14.7. Ez a feladat a 14.10. ábrán látható változó eliminációs algoritmusra irányul. 


14.8. 


14.9. 


(a) 


(b) 
(e) 


(d) 


A 144. alfejezet a változó eliminálást alkalmazza arra a lekérdezésre, hogy 
P(BetöréslJánosTelefonál — igaz, MáriaTelefonál — igaz) 


Végezze el a jelzett számításokat, és ellenőrizze, hogy helyes-e a válasz. 
Számolja össze az elvégzett aritmetikai műveletek számát, és hasonlítsa 
össze a felsorolási algoritmus által elvégzettek számával. 

Tegyük fel, hogy a háló egy láncot alkot: bináris változók szekvenciáját, 
ahol Szülők(X) — (X; 1) i — 2, ..., n esetén. Mi a P(X.IX,, — igaz) kiszámí- 
tásának a komplexitása a felsorolást használva? És mi, ha változó eliminá- 
lást használunk? 

Bizonyítsa be, hogy a változó eliminálás futásának komplexitása egyszere- 
sen összekötött hálóban lineáris a háló méretében bármely, a háló struktú- 
rájával konzisztens változó sorrendezés mellett. 


Vizsgáljuk meg az egzakt következtetés komplexitását általános Bayes-hálókban. 


(a) 


(b 


Bizonyítsa be, hogy bármely 3-SAT probléma redukálható egy egzakt kö- 
vetkeztetésre egy olyan Bayes-hálóban, amely a konkrét problémát repre- 
zentálja, és így az egzakt következtetés NP-nehéz. (Segítség: gondoljon egy 
olyan hálóra, amiben minden kijelentésszimbólumhoz, minden klózhoz és a 
klózok minden konjunkciójához rendre egy-egy csomópont tartozik.) 

A 3-SAT problémában a kielégítő érték-hozzárendelések számának megha- 
tározása tP-teljes. Bizonyítsa be, hogy az egzakt következtetés legalább 
ennyire nehéz. 


Tekintsük egy véletlen minta egy megadott egyváltozós eloszlásból történő ge- 
nerálásának a problémáját. Feltételezhetjük, hogy rendelkezésre áll egy vélet- 
lenszám-generátor, ami egyenletes eloszlás szerint 0 és 1 közötti véletlen szá- 
mokat ad. 


(a) 


b 


(9 


(d) 


Legyen X egy diszkrét valószínűségi változó P(X; — x)) — pyi € (I, ..., k) 
tömegfüggvénnyel. Az X eloszlásfüggvénye (cumulative distribution) 
minden lehetséges j-re megadja annak valószínűségét, hogy X € (xi. vs X- 
Magyarázza el, hogyan számolható ki az eloszlásfüggvény 0(X) időben, és 
hogyan generálhatunk vele egy X eloszlása szerinti mintát. Ez utóbbi meg- 
tehető kevesebb mint 0(X£) időben? 

Most tegyük fel, hogy A mintát szeretnénk generálni X szerint, ahol N 5 k. 
Magyarázza el, hogyan tehető ez úgy meg, hogy a mintánkénti várható 
futási idő konstans (azaz független k-tól). 

Most tekintsünk egy folytonos értékű változót egy parametrikus eloszlás- 
sal (például normálissal). Hogyan generálhatunk mintákat egy ilyen elosz- 
lásból? 

Tegyük fel. hogy egy folytonos értékű változót szeretne lekérdezni, és egy 
olyan mintavételező algoritmust használ a következtetésre, mint a VALÓ- 
SZÍNŰSÉGISÚLYOZÁS. Hogyan kellene módosítania a lekérdezés-válaszadás 
folyamatát? 
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14.10. Egy változó Markov-takaróját (Markov blanket) az 586. oldalon definiáltuk. 


14.11. 


14.12. 


(a) 
(b) 


Bizonyítsa be, hogy a változó független a háló összes többi változójától, ha 
Markov-takarója ismert. 
Vezesse le a (14.11) egyenletet. 


Tekintsük a P(EsőjLocsoló — igaz, VizesPázsit — igaz) lekérdezést a 14.11. (a) 
ábra szerint, és annak az MCMC módszerrel való megválaszolását. 


(a) 
(b) 


(c) 
(d) 
(e) 


Hány állapota van a Markov-láncnak? 

Számítsa ki a 0) állapotátmenet-mátrixot (transition matrix 0). ami tar- 
talmazza az összes g(y—y") értéket minden y-ra és y/-ra. 

Mit reprezentál 02, az állapotátemeneti mátrix négyzete? 

Mi lesz 07, ha n — 00? 

Magyarázza el, hogy hajtsunk végre valószínűségi következtetést Bayes- 
hálókban, ha 0" elérhető. Hatékony módja ez a következtetésnek? 


Három focicsapat, A, B és C játszik egymás ellen. Minden meccsen két csapat 
vesz részt, az eredmény pedig győzelem, vereség vagy döntetlen lehet. Minden 
csapatnak egy rögzített, ismeretlen fokozatú játékszintje van — ami egy 0 és 3 
közötti egész érték -, és egy meccs eredménye a két csapat játékszintje közötti 
különbségtől függ sztochasztikusan. 


(a) 
(b) 
(c) 
(d) 


(e) 


Hozzon létre egy relációs valószínűségi modellt a tárgyterületre, és javasol- 
jon értékeket az összes szükséges valószínűség-eloszlásra. 

Hozzon létre egy ekvivalens Bayes-hálót. 

Tegyük fel, hogy az első két meccsen A megveri B-t. C-vel pedig döntet- 
lent játszik. Egy tetszőleges egzakt következtetést felhasználva, számítsa ki 
a harmadik meccs a posteriori eloszlását. 

Tegyük fel, hogy n csapat vesz részt a bajnokságon, és minden eredmé- 
nyünk megvan, kivéve az utolsót. Hogyan változik az utolsó meccs meg- 
jóslásának a komplexitása az n függvényében? 

Vizsgálja meg az MCMC alkalmazását ezen a problémán. Milyen gyorsan 
konvergál az MCMC a gyakorlatban, és hogyan skálázható fel? 


15. IDŐBELI VALÓSZÍNŰSÉGI 
KÖVETKEZTETÉS 


Ebben a fejezetben megpróbáljuk értelmezni a jelent, megérteni a múltat és esetleg 
megjósolni a jövőt, még akkor is, ha igencsak kevéssé kristálytiszta. 


A bizonytalan környezetben lévő ágenseknek - a logikai ágensekhez hasonlóan — ké- 
pesnek kell lenniük környezetük aktuális állapotának nyomon követésére. Ezt a felada- 
tot nehezebbé teszi a részleges és zajos érzékelés, és az a bizonytalanság, ahogyan a 
környezet az idő előrehaladtával változik. Az ágens a legjobb esetben is a jelenlegi 
reprezentációkat és következtetési algoritmusokat ír le, amelyek lehetővé teszik ezt az 
értékelést, a 14. fejezetben bemutatott ötletekre építve. 

Az alapvető megközelítés leírása a 15.1. alfejezetben szerepel: egy változó világot 
úgy modellezünk, hogy a világ állapotának minden vonatkozására, minden időpilla- 
natban egy valószínűségi változót használunk. Ezen változók közti kapcsolatok írják le 
az állapot fejlődését. A 15.2. alfejezet meghatározza az alapvető következtetési felada- 
tokat, és leírja az időbeli modellekhez tartozó következtető algoritmusok általános struk- 
túráját. Ezután három különbözőfajta modellt írunk le: a rejtett Markov-modelleket 
(hidden Markov model), a Kalman-szűrőket (Kalman filters) és a dinamikus Bayes- 
hálókat (dynamic Bayesian networks) (ami mint speciális aleseteket magában foglalja 
a rejtett Markov-modelleket és a Kalman-szűrőket). Végül a 15.6. alfejezet bemutatja, 
miként alkotják az időbeli valószínűségi modellek a modern beszédfelismerő rendsze- 
rek magját. Ezen modellek mindegyikének létrehozásában központi szerepet tölt be a 
tanulás, de a tanulási algoritmusok részletes vizsgálata a VI. részre marad. 


15.1. IDŐ ÉS BIZONYTALANSÁG 


A valószínűségi következtetésre szolgáló technikáinkat változatlan (static) világok 
esetén fejlesztettük ki, amelyekben minden egyes valószínűségi változónak egyetlen 
rögzített értéke van. Például egy gépkocsi javításánál feltesszük, hogy ami meghibáso- 
dott, az a diagnosztizálás alatt is hibás marad; a feladatunk a gépkocsi állapotának kikö- 
vetkeztetése a megfigyelt bizonyítékokból, amelyek szintén változatlanok maradnak. 

Most vegyünk fontolóra egy másféle problémát: egy cukorbeteg páciens kezelését. 
Akárcsak a gépkocsijavítás esetén, rendelkezünk bizonyítékokkal: a jelenlegi inzulin- 
adagok, az élelmiszer-bevitel, a vércukorszint mérésének eredményei és egyéb testi tüne- 
tek. A feladat a páciens jelenlegi állapotának értékelése, beleértve az aktuális vércukor- 
szintet és inzulinszintet. Ezeknek az információknak az alapján az orvos (vagy a páciens) 
döntést hoz a páciens élelmiszer-beviteli és inzulinadagjáról. 
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A gépkocsijavítás esetétől eltérően, itt a probléma dinamikai vonatkozásai alap- 
vetőek. A vércukorszintek és méréseik idővel gyorsan változhatnak, amit befolyásol 
a páciens aktuális élelmiszer-bevitele és inzulinadagja, az anyagcsere aktivitása, a nap- 
szak és egyéb tényezők. Ahhoz, hogy a bizonyítékok időbeli alakulásából a jelenlegi 
állapotot megbecsüljük, és egy kezelés kimenetelét megjósoljuk,. modelleznünk kell 
ezeket a változásokat. 

Ugyanezek a szempontok számos más esetben is jelentkeznek, egy nemzet gazdasá- 
gi aktivitásának közelítő és részleges statisztikák alapján történő követésétől, beszéd- 
szekvenciák zajos és többértelmű akusztikai mérésekből történő megértéséig. Adódik 
a kérdés: hogyan lehet az ezekhez hasonló dinamikai helyzeteket modellezni? 





Állapotok és megfigyelések 


Az alapvető megközelítés, amit követünk, hasonló a 10. fejezetben leírt szítuációkalkulus 
alapjául szolgáló ötlethez: a változás folyamatát pillanatfelvételek sorozatának tekinthet- 
jük, amelyek mindegyike egy adott pillanatban írja le a világ állapotát. Minden pillanat- 
felvétel vagy időpont (time slice) valószínűségi változók egy halmazát tartalmazza, 
amelyek némelyike megfigyelhető, némelyike pedig nem. 

Az egyszerűség kedvéért a továbbiakban fel fogjuk tenni, hogy a változóknak ugyan- 
az a részhalmaza minden időpontban megfigyelhető (bár az elkövetkezőkben ez teljes 
mértékben sehol sem szükségszerű). A t időpillanatban nem megfigyelhető változók hal- 
mazának a jelölésére X,-t fogjuk használni, és E,-t a megfigyelhető változók halmazának 
a jelölésére. A ? időpontbeli megfigyelés E, — e, az értékek valamely e, halmazára. 

Gondoljuk át a következő leegyszerűsített példát: tegyük fel, hogy egy titkos, föld- 
alatti létesítmény biztonsági őrei vagyunk. Szeretnénk tudni, hogy vajon aznap esik-e, 
de a külvilághoz való egyetlen hozzáférésünket az jelenti, hogy reggelenként látjuk, 
hogy az igazgató esernyővel vagy esernyő nélkül jön be. Minden egyes ? napon az E, 
halmaz így egyetlen bizonyítékváltozót tartalmaz. az [U,-t (van-e esernyő), és X, az R-t. 
az egyetlen állapotváltozót tartalmazza (esik-e). Más problémákhoz változók nagyobb 
balmaza tartozhat. A cukorbetegség példájában a bizonyítékváltozók lehetnek a 
MértVércukor, és a Pulzusszám,, és az állapotváltozók lehetnek a Vércukor, és a Gyomor- 
tartalom," 

Az időpontok közötti intervallum szintén problémafüggő. A cukorbetegség követé- 
sénél az alkalmas intervallum inkább egy óra, mint egy nap. Ebben a fejezetben általában 
egy rögzített véges intervallumot tételezünk fel, ami azt jelenti, hogy az időpillanatok 
egész számokkal felcímkézhetők. Feltesszük, hogy az állapotsorozat ? — 0-nál kezdő- 
dik; és jelentéktelen okokból feltesszük, hogy a bizonyítékok z: — 1-nél kezdenek be- 
érkezni, és nem t — 0-nál Így az esernyős világot az Rg. R, R2, ..- állapotváltozók és az 
Ui, Ua, -. bizonyítékváltozók reprezentálják. Az a : b jelölést fogjuk használni az egé- 
szek a-tól b-ig tartó sorozatának jelölésére (a határokat beleértve), és X.., jelöli a válto- 
zók megfelelő halmazát X.-tól X,-ig. Például U.3 az U,, U2, U3 változóknak felel meg. 


1 Vegyük észre, hogy a Vércukory és a Mértvéreukorj két különböző változó. így kezeljük az aktuális meny- 
nyiségek zajos mérését. 
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Stacionárius folyamatok és a Markov-feltétel 


Egy adott problémánál az állapotváltozók és a bizonyítékváltozók haimazának megha- 
tározása után a következő lépés a változók közötti függőségek megadása. Követhetnénk 
a 14. fejezetben megállapított eljárást, valahogyan sorrendezve a változókat, és kérdé- 
seket feltéve az elődöktől való feltételes függetlenségre, adott szülői halmaz esetén. 
Egy nyilvánvaló választás, hogy a változókat a természetes idősorrendjük szerint sorren- 
dezzük, mível az ok általában megelőzi a hatást, és a változókat lehetőleg az ok-okozati 
sorrendjük szerint vesszük. 

Azonban hamar beleütközhetünk egy akadályba: a változók halmaza nem korlátos, 
mivel minden időpontra tartalmazza az állapot- és bizonyítékváltozókat. Valójában ez 
két problémát is felvet: (1) korlátlan számú feltételes valószínűségi táblát kell megad- 
nunk minden változóra, minden időpillanatban; (2) ezek korlátlan számú szülőt tartal- 
mazhatnának. 

Az első problémát megoldja annak feltételezése, hogy a világ állapotának a változásait 
egy stacionárius folyamat (stationary process) okozza — azaz egy változási folyamat, 
amit olyan törvények határoznak meg, amik maguk nem változnak az idővel. (Ne kever- 
jük össze a stacionaritást a statikussággal: egy statikus folyamatban maga az állapot nem 
változik.) Az esernyős világban ekkor a P(USzülők(U,)) feltételes valószínűség, hogy 
az esernyő feltűnik, minden f-re azonos. A stacionaritás feltevésénél ezért csak egy , rep- 
rezentatív" időpillanathoz tartozó változók feltételes valószínűségeit kell megadnunk. 

A második problémát, a potenciálisan végtelen számú szülő kezelését, az úgyneve- 
zett Markov-feltétel (Markov assumption) elfogadása oldja meg — azaz, hogy a jelen- 
legi állapot a korábbi állapotoknak csak véges történetétől függ. Ennek a feltevésnek 
eleget tévő folyamatokat elsőként Andrei Markov orosz matematikus tanulmányozta 
részletesen. Ezeket a folyamatokat Markov-folyamatoknak (Markov processes) vagy 
Markov-láncoknak (Markov chains) neveznek. (A Markov-folyamatok feloszthatók 
aszerint, hogy az állapottér folytonos vagy diszkrét, illetve hogy az idő folytonos vagy 
diszkrét. Markov-láncoknak a diszkrét idejű és/vagy diszkrét állapotterű Markov- 
folyamatokat nevezik — a ford.) A Markov-folyamatok különböző jellemzőkkel ren- 
delkezhetnek; a legegyszerűbb az elsőrendű Markov-folyamat (first-order Markov 
process), amelyben a jelenlegi állapot csak az előző állapottól függ. és nem függ 
egyetlen korábbitól sem. Máshogy fogalmazva, egyetlen állapot ismeretére van 
szükség, hogy a jövő a múlttól feltételesen független legyen az állapot ismeretében. 
A jelölésünket felhasználva, a megfelelő feltételes valószínűségi állítás azt mondja ki, 
hogy minden f-re 


PXIXo1) — PRIX, (15.1) 


Így egy elsőrendű Markov-folyamatban az állapotok időbeli változását leíró szabályo- 
kat teljes mértékben tartalmazza a (X.IX1..) feltételes eloszlás, amit az elsőrendű fo- 
lyamat állapotátmenet-modelljének (transition model) nevezünk? A 15.1. ábra első- 
rendű és másodrendű Markov-folyamatokhoz tartozó Bayes-hálóstniktúrákat mutat. 


2 Az állapotátmenet-modell a valószínűségi analógja a 7. fejezet logikai frissítő áramkörének és a 10. fejezet 
követő állapot axiómáinak. 
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15.1. ábra. (a) Egy elsőrendű Markov-folyamathoz tartozó Bayes-hálóstruktúra, A reprezentált Markov- 
folyamatban az állapotot az X, változók definiálják. (b) Egy másodrendű Markov-folyamat. 








Az X, állapotváltozók szüleinek a korlátozásán túl korlátoznunk kell az E, bizonyí- 
tékváltozók szüleit is. Tipikusan feltesszük, hogy a bizonyítékváltozók egy  időpilla- 
natban csak az aktuális állapottól függnek: 


PREJXo Fox) — P(EIXD (15.22) 


A P(EX)) feltételes eloszlást érzékelő modellnek (sensor model) nevezik (vagy néha 
megfigyelési modellnek [observational model), mivel leírja, hogy az , érzékelőket" — 
azaz a bizonyítékváltozókat — hogyan befolyásolja a világ aktuális állapota. Vegyük 
észre a függés irányát: a , nyíl" az állapottól az érzékelő értékére mutat, mivel a világ 
állapota okozza azt, hogy az érzékelők bizonyos értékeket vegyenek fel. Az esernyős 
világban például az eső okozza az esernyő feltűnését. (A következtetési folyamat termé- 
szetesen a másik irányban halad; a modellezett függések iránya és a következtetés irá- 
nya közötti különbségtétel a Bayes-hálók egyik fő előnye.) 

Az állapotátmenet-modellhez és az érzékelő modellhez még meg kell adnunk egy 
P(Xg) a priori eloszlást a 0. időpontbeli állapotok felett. Ez a három eloszlás, kombinál- 
va a (15.1) és a (15.2) egyenletekben megfogalmazott feltételes függetlenségi állítások- 
kal, biztosítja számunkra a teljes együttes eloszlás meghatározását az összes változó 
felett. Bármely véges t-re azt kapjuk, hogy 


1 

P(Xo.XI.sXr.EÉvs ED) —PX [TP IX; DP(E;IX 

iz] 
A függetlenségi állítások egy nagyon egyszerű Bayes-hálóstruktúrának felelnek meg, 
ami az egész rendszert leírja. A 15.2. ábrán látható a háló struktúrája az esernyős 
példa esetén, beleértve az állapotátmenet- és az érzékelő modellekhez tartozó feltételes 
eloszlásokat. 

Az ábrán lévő struktúra elsőrendű Markov-folyamat feltételezésen alapul, mivel fel- 
tesszük, hogy az eső valószínűsége csak attól függ, hogy az előző nap esett-e. Egy ilyen 
feltevésnek a helyénvalósága magától a tárgyterülettől függ. Az elsőrendű Markov- 
feltétel kimondja, hogy az állapotváltozók az összes olyan információt tartalmazzák, 
amely a következő időpontbeli valószínűség-eloszlások megadásához szükséges. Néha 
ez a feltevés pontosan teljesül — például ha egy részecske véletlen bolyongást (random 
walk) végez az x tengelyen, 31-gyel változtatva meg a pozícióját minden időpontban, 
ekkor az x koordinátát használva állapotként, egy Markov-lánc adódik. Gyakran a felte- 
vés csak közelítő, mint amikor az eső jóslása csak az alapján történik, hogy esett-e az elő- 
ző napon. Két lehetséges javítás létezik, ha a közelítés túlságosan pontatlannak bizonyul: 
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15.2. ábra. Az esernyős világot leíró Bayes-hálóstruktúra és feltételes eloszlások. Az álapotátmenet- 
modell a P(EsőjJEső, 1) feltételes valószínűiség-elosztás. az érzékelő modell a P(EsernyőtJEsőp). 


1. A Markov-folyamat rendjének a megnövelése. Például létrehozhatnánk egy másod- 
rendű modellt, felvéve egy Eső, 2-t mint az Eső, szülőjét, ami lehet, hogy valamivel 
pontosabb predikciót adna (például Palo Altóban nagyon ritkán esik több mint két na- 
Pig egyfolytában). 

2. Az állapotváltozók halmazának megnövelése. Például felvehetnénk az Évszak, vál- 
tozót, hogy ez lehetővé tegye számunkra az esős évszakok történeti feljegyzéseinek 
beépítését, vagy hozzáadhatnánk a fiőmérséklet,, a Páratartalom, és a Légnyomás, 
változókat, hogy az eső feltételeinek fizikai modelljeit felhasználhassuk. 


A 15.1. feladat annak megmutatását kéri, hogy az első megoldás - a folyamat rendjé- 
nek a megnövelése — mindig átfogalmazható az állapotváltozók halmazának megnöve- 
lésére, változatlanul hagyva a rendet. Vegyük észre, hogy állapotváltozók hozzáadása ja- 
víthatja a rendszer előrejelző erejét, de megnöveli a predikciós követelményeket is: ek- 
kor már az új változókat is jósolni kell. Így a változóknak egy , önmagában elégséges" 
halmazát keressük, ami valójában azt jelenti, hogy meg kell értenünk a modellezett fo- 
lyamat , fizikáját". A folyamat pontos modellezése iránti követelmény nyilvánvalóan 
mérsékeltebb, ha új érzékelőket vehetünk fel (például a hőmérséklet és a nyomás méré- 
sére), amelyek közvetlenül az új állapotváltozókról szolgáltatnak információt. 

Gondoljuk meg például egy X-Y síkon véletlenszerűen sétáló robot követésének 
a problémáját. Egy javaslat az állapotváltozók egy elégséges halmazára ekkor a pozíció 
és a sebesség lehet: Newton törvényeit felhasználva kiszámolható az új pozíció, és a se- 
besség megjósolhatatlanul változik. Ha azonban a robot akkumulátorról üzemel, akkor 
az elem lemerülésének tipikusan van egy szisztematikus hatása a sebesség megváltozá- 
sára. Mivel ez viszont függ attól, hogy mennyi energia használódott el az összes korábbi 
manőverben, a Markov-tulajdonság sérül. A Markov-tulajdonságot helyreállíthatjuk egy 
Akkumulátor, feltöltöttségi szintnek mint az X,-t alkotó állapotváltozók egyikének a fel- 
vételével. Ez segít a robot mozgásának a jóslásában, de ugyanakkor megköveteli az Ak- 
kumulátor, jóslását az Akkumulátor, 1-ből és a sebességből. Bizonyos esetekben ez 
megbízhatóan megtehető; a pontosság azonban javulna egy, az akkumulátor feltöltött- 
ségét mérő új érzékelő felvételével. 
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15.2. KÖVETKEZTETÉS IDŐBELI MODELLEKBEN 


Egy általános időbeli modellstruktúra kidolgozása után, most már megfogalmazhatjuk 
a megoldandó alapvető következtetési feladatokat: 


. Szűrés (filtering) vagy ellenőrző megfigyelés (monitoring). Ez a bizonyossági 
állapot (belief state) kiszámításának a feladata — ami a jelenlegi állapot feletti a pos- 
teriori eloszlás, az adott időpontig vett összes bizonyíték ismeretében. Azaz szeret- 
nénk kiszámítani a P(X, le, .,) mennyiséget, feltéve, hogy a bizonyítékok folyamatos 
sorozatban érkeznek kezdve a t — 1 időponttól. Az esernyős példában ez az aznapi 
eső valószínűségének a kiszámítását jelentené, az esernyőhordozó eddigi összes 
megfigyelésének az ismeretében. A szűrés az, amit egy racionális ágensnek el kel 
végeznie ahhoz, hogy a jelenlegi állapotot követni tudja, és így racionális döntése- 
ket hozhasson (lásd 17. fejezet). Kiderül, hogy majdnem azonos számítás szolgáltatja 
a bizonyítéksorozat megfigyelésének a valószínűségét (likelihood), P(ej.,)-t. 

s Előrejelzés (prediction). Ez egy jövőbeli állapot feletti a posteriori eloszlás kiszá- 
mitásának a feladata, az adott időpontig vett összes bizonyíték ismeretében. Azaz, 
szeretnénk kiszámítani a P(X,, les.) mennyiséget valamely k 5 0 esetén. Az esernyős 
példában ez jelentheti az eső valószínűségének a kiszámítását három napra előre, az 
esermyőhordozó eddigi összes megfigyelésének az ismeretében. Az előrejelzés hasz- 
nos a cselekedetek lehetséges sorozatainak a kiértékelésében. 

" Simítás (smoothing) vagy visszatekintés (hindsight). Ez egy múltbeli állapot felet- 
ti a posteriori eloszlás kiszámításának a feladata, a jelen időpontig vett összes bizo- 
nyíték ismeretében. Azaz szeretnénk kiszámítani a P(X, je.) mennyiséget valamely 
02 k c t esetén. Az esernyős példában ez jelentheti az eső valószínűségének a ki- 
számítását múlt szerdára, ha ismerjük az esernyőhordozónak a mai napig történő 
összes megfigyelését. A visszatekintés az állapotnak egy jobb becslését adja, mint 
ami akkor elérhető volt, mivel több bizonyítékot használ fel. 

s  Legvalószínűbb magyarázat (most likely explanation). A megfigyelések egy s0- 
rozatának ismeretében lehet, hogy szeretnénk megtalálni azt az állapotsorozatot, ami 
a leginkább valószínű, hogy az adott megfigyeléseket generálta. Azaz szeretnénk 
kiszámítani az argmax,,, P(x: Je.) értékét. Például ha az esernyő feltűnik az első 
három nap mindegyikén, és hiányzik a negyediken, akkor a legvalószínűbb magya- 
rázat az, hogy az első három napon esett és a negyediken nem esett. Az erre a fel- 
adatra szolgáló algoritmusok számos alkalmazásban hasznosak, ideértve a beszéd- 
felismerést — ahol a cél a szavak legvalószínűbb sorozatának a megtalálása hangok 
sorozatának ismeretében — és egy zajos csatornán továbbított bináris szekvenciák 
rekonstrukcióját. 


Ezeken a feladatokon túl szükség van még módszerekre az állapotátmenet- és érzékelő 
modellek megfigyelésekből történő megtanulására. Csakúgy, mint a statikus Bayes- 
hálóknál, a dinamikus Bayes-hálós tanulás elvégezhető mint a következtetés mellék- 
terméke. A következtetés egy becslést ad arra, hogy milyen átmenetek következtek be 
valójában, és milyen állapotok generálták az érzékelők értékeit, és ezek a becslések 
felhasználhatók a modell frissítésére. A frissített modellek jobb becsléseket adnak, és a 
folyamat a konvergálásig iterálódik. A teljes folyamat a várhatóérték-maximálás vagy 
EM algoritmus egy esete (lásd 20.3. alfejezet). Figyelemre méltó részlet, hogy a tanulás 
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teljes simítós következtetést igénye! szűrés helyett, mivel ez jobb becsléseket ad a 
folyamat állapotára. Lehet, hogy a szűréssel való tanulás nem konvergál helyesen; gon- 
doljunk például a gyilkosságok felderítésének a megtanulására: a visszatekintés mindig 
szükséges annak kikövetkeztetéséhez a megfigyelhető bizonyítékok alapján, hogy mi 
történt a gyilkosság helyszínén. 

Az előző szakaszban felsorolt négy következtetési feladatot megoldó algoritmusok 
először leírhatók általános szinten, függetlenül az alkalmazott modell konkrét típusától. 
Az egyes modellekhez igazodó javításokat a következő fejezetekben ismertetjük. 


Szűrés és előrejelzés 


Kezdjük a szűréssel. Megmutatjuk, hogy ez menet közben egyszerűen, online módon 
elvégezhető: a 1-edik időpillanatig tartó szűrés eredményét ismerve, a f -t 1-edik időpil- 
lanatra az eredmény könnyen kiszámítható az új e,,j bizonyítékból. Azaz 


PG, rlerra — ey, PCXler.2) 
valamely f függvénnyel. Ezt a folyamatot gyakran nevezik rekurzív becslésnek (recursive 
estimation). Tekinthetjük a számítást úgy, mint ami valójában két részből áll: elsőként a 
jelenlegi állapot eloszlását terjesztjük előre 1-ről t -t- 1-re; azután fogjuk frissíteni, felhasz- 
nálva az új e,,y bizonyítékot. Ez a kétlépéses folyamat elég egyszerűen alakul: 
PCXyrlerr41) — PCX e rler- er (felosztva a bizonyítékot) 
7 a P(eyilX4 err) PCXyylej:) (a Bayes-szabályt használva) 
— a P(e,1IX.4.1 PCX,.i er (a bizonyíték Markov-tulajdonsága 
miat 
Itt és végig a fejezetben, az a. egy normalizációs konstans, ami a valószínűségek 
1-re összegzését biztosítja. A második tényező P(X,, 1lex:,) reprezentálja a következő 
állapot egylépéses előrejelzését, és az első tényező ezt frissíti az új bizonyítékkal. Ve- 
gyük észre, hogy P(e, , 1]X.. 1) közvetlenül kinyerhető az érzékelő modellből. Most a je- 
lenlegi X, állapotot feltételnek véve a következő állapot egylépéses előrejelzéséhez ju- 
tunk: 


PG rle 41) — PPealX2POXnalóp éj.) P(xle1) 


— a Pe, IX a) ÖPOSadRetes :.) (kihasználva a Markov-tulajdonságot)(15.3) 


Az összegzésen belül. az első tényező egyszerűen az állapotátmenet-modell és a máso- 
dik a jelenlegi állapot eloszlása. Így megvan a kívánt rekurzív képlet. A szűrt P(X lej.) 
becslésre úgy gondolhatunk, mint egy f., , üzenetre", amit előre terjesztünk végig a 
sorozaton, minden átmenetnél az új megfigyeléssel módosítva és frissítve. A folyamat 


11.41 — a ELŐRE ip éz.) 


ahol az ELŐRE a (15.3) egyenlet által leírt frissítést hajtja végre. 
Ha az összes állapotváltozó diszkrét, minden frissítés ideje állandó (azaz -től független), 
és a tárigény is állandó. (Ezek az állandók természetesen függnek az állapottér méretétől 
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És a tárgyalt időbeli modell konkrét tíj I.) A frissítés idő- és tárigényének állandó- 
nak kell lennie, ha egy korlátos memóriájú ágensnek követnie kel! az aktuális állapot 
eloszlását a megfigyelések egy korlátlan sorozata esetén. 

Mutassuk be a szűrési folyamatot két lépésen keresztül az alap esernyős példában (lásd 
15.2. ábra). Feltesszük, hogy a biztonsági őrünknek van valamilyen a priori hite, hogy a 
0. napon esett-e, éppen azelőtt, hogy a megfigyelések sorozata elkezdődik. Tegyük fel, 
hogy ez P(Rg) — (0.5, 0,5). Most a két megfigyelést a következőképpen dolgozzuk fel: 


s Az 1. napon az esernyő feltűnik, így U) — igaz. Az előrejelzés f — 0-ról r — 1-re 
PR) —-Y PRI Pra 


[7 
7 (0.7, 03) x 05 - (03, 0.7) x 0.5 — (0,5, 0,5) 
és a t — 1-beli bizonyítékkal való frissítés azt adja, hogy 
P(Rilu) — a PtujlRp) P(Rp) — a(0.9, 0,2) (05, 05) 
7 a(0,45, 0,1) a (0,818, 0,182) 
s A 2. napon az esernyő feltűnik, így U2 — igaz. Az előrejelzés t — 1-ről tr — 2-re 
PCRoli) —P(Rolr) Piri) 
[7 


z (0.7, 0,3) x 0.818 -- (0,3, 0,7) x 0,182 sz (0,627, 0,373) 
a t — 2-beli bizonyítékkal való frissítés pedig azt adja, hogy 
P(Rolu, 142) — a P(olR2) P(Rolu) — a(0,9, 0,2) (0,627, 0,373) 
- a(0,565, 0,075) sz (0,883, 0,117) 


Érzésünk szerint az eső valószínűsége azért növekedett az 1. napról a 2. napra, mert az 
eső folytatódik. A 15.2. (a) feladat ennek a tendenciának a további vizsgálatát kéri. 

Az előrejelzés feladatát tekinthetjük egyszerűen szűrésnek új bizonyíték hozzáadása 
nélkül. Valójában a szűrési folyamat már magában foglal egy egylépéses előrejelzést és 
könnyen származtatható a következő rekurzív számítás a t 4 k 4 1 állapot előrejelzésére 
at-t k előrejelzéséből: 


PG. xerleg., 77 PC akellx e PC szle1:d (15.4) 


Természetesen ez a Számítás csak az állapotátmenet-modellt tartalmazza és nem az ér- 
zékelő modellt. 

Érdekes meggondolni, hogy mi történik, ahogy egyre távolabbra próbálunk előre 
jelezni a jövőben. A 15.2. (b) feladat megmutatja, hogy az eső előrejelzett eloszlása 
a (0,5, 0,5) fix ponthoz konvergál, ami után a továbbiakban állandó marad. Ez az állapot- 
átmenet-modell által meghatározott Markov-folyamat stacionárius eloszlása (stationary 
distribution) (lásd még 605. oldal). Rengeteg ismeret gyűlt fel az ilyen eloszlások tu- 
lajdonságairól és a keverési időről (mixing time) — ami nagyjából a fix pont eléréséig 
eltelt idő. Gyakorlati szempontból ez bukásra ítél minden olyan kísérletet, ami a keveré- 
si idő kis hányadánál nagyobb számú lépés múlva kísérli meg az aktuális állapot elő- 
rejelzését. Minél bizonytalanabb az állapotátmenet-modell, annál rövidebb a keverési 
idő, és a jövő annál homályosabb. 

A szűrésen és az előrejelzésen túl, felhasználhatjuk az előrehaladó rekurziót egy 
bizonyítéksorozat P(e,.,) valószínűségének a kiszámítására is. Ez egy hasznos mennyi- 
ség, ha különböző időbeli modelleket szeretnénk összehasonlítani, amelyek ugyanazt 
a bizonyítéksorozatot állíthatták elő; például a 15.6. alfejezetben különböző szavakat 
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hasonlítunk össze, amelyek ugyanazt a hangsort állíthatták elő. Ehhez a rekurzióhoz 
felhasználjuk az £1., — P(X,. ej.) valószínűségi (likelihood) üzenetet. Egyszerű feladat 
azt megmutatni, hogy 

1.rs1  ELŐRE(É[:,, €y41) 
Kiszámítva £/.,-t, az aktuális valószínűséget az X, feletti összegzéssel kapjuk: 

1147 Pe —D Eazlx (15.5) 


Simítás 


Ahogy korábban meghatároztuk, a símítás (smoothing) múltbeli állapotok feletti el- 
oszlás kiszámításának a folyamata a jelenig tartó bizonyítékok ismeretében; azaz 
P(XJer.,) számítása valamely 0 £ k c ft esetén (lásd 15.3. ábra). Ez legkényelmeseb- 
ben két részletben végezhető el — a bizonyíték £-ig és a bizonyíték k -t- 1-től 1-ig, 


P(X.le1:)— PCX,Je1.x eza) 


5 a P(Xler:) P(ex, 1.X.4. er) (a Bayes-szabályt használva) 
7 a P(X.ler: P(e,,1..]X.) (a feltételes függetlenséget használva) 
—OTik Dry (15.6) 





ahol definiáltuk a b, , 4, — P(ex, 1-, IX) ..visszafelé" üzenetet, analóg módon az f/., elő- 
re üzenethez. Az f,., előre üzenetet előre szűréssel lehet kiszámolni 1-től k-ig, a (15.3) 
egyenlet alapján. A b,, )., visszafelé üzenetről pedig kiderül, hogy egy egyszerű rekur- 
zív folyamattal kiszámítható, ami r-től visszafelé halad: 

PlexiIX9 — DPlexi]X4. xx. DP(X4lXD (feltételnek véve X4.1-et) 
Xkal 
z P(exa xx DPCXaIXD (a feltételes függetlenség miatt) 


Xel 


DX Ptepy1. egszel Ka POxz IX 


Xkal 


— DO PCeralxrD Pesze XpePOcx LXX (15.7) 


Xhal 


ahol az utolsó lépés az ey, és az e,,2., feltételes függetlenségéből következik az xy, 
melletti feltétellel. Az összegzésben a három tényezőből az első és a harmadik közvet- 
lenül a modellből megkapható. a második pedig a rekurzív hívás". Az üzenetjelölést 
használva kapjuk, hogy 


Dzsi — HÁTRA(Br 4 2375 Egy: 


ahol a HÁTRA a (15.7) egyenlet által leírt frissítést hajtja végre. Ahogy az előrefelé 
rekurziónál, az egyes frissítésekhez szükséges idő- és tárigény állandó, és így 1-től füg- 
getlen itt ís. 
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15.3. ábra. A simítás egy múltbeli k időpontban az állapot a posteriori P(X. le, . ) eloszlását számítja ki 
egy teljes, 1-től t-ig terjedő megfigyelés sorozat ismeretében . 


Most láthatjuk, hogy a (15.6) egyenlet mindkét tényezője kiszámítható időbeli rekur- 
zióval, az egyik előrefelé fut 1-től k-ig, és a szűrés (15.3) egyenletét használja, a másik 
visszafelé fut 1-től k-4-1-ig, és a (15.7) egyenletet használja. Figyeljünk arra, hogy a visz- 
szafelé fázist b, )., — Pe, 1.]X — 1-gyel inicializáljuk, ahol 1 egy egyesekből álló 
vektor. (Mivel e, 1, egy üres sorozat, a megfigyelésének valószínűsége 1.) 

Alkalmazzuk most ezt az algoritmust az esernyős példára, kiszámítva az eső valószí- 
nűségének simított becslését : — 1-nét, az első és második nap megfigyeléseinek isme- 
retében. A (15.6) egyenlet szerint ezt az adja meg, hogy 


PCR, 42) — a P(Rilup PGolRkn) (15.8) 


A korábban leírt előrefelé szűrési folyamatból már tudjuk, hogy az első tényező (0.818, 
0,182). A második tényezőt a (15.7) egyenletbeli visszafelé rekurziót alkalmazva szá- 
mithatjuk ki: 

PiolR)—Y Pinlr) PEDPCÁRD 


r, 
— (09 x I x (0.7, 0,3)-H0.2 x 1 x (0.3. 0.7) — (069, 041) 


Ezt visszahelyettesítve a (15.8) egyenletbe azt kapjuk, hogy a simított becslés az esőre 
az 1. napon 


P(Rilun, 12) — a(0,818, 0,182) x (0,69, 041) sz (0.883, 0,117) 


Így ebben az esetben a simított becslés nagyobb, mint a szűrt becslés (0,818). Ennek 
oka az, hogy az esernyő a 2. napon valószínűbbé teszi, hogy esett a 2. napon, és mivel 
az eső tartósan szokott esni, ez még valószínűbbé teszi, hogy esett az 1. napon. 

Mind az előrefelé, mind a visszafelé haladó rekurzió lépésenként állandó időt igé- 
nyel; így a simítás időkomplexitása ej., bizonyíték esetén 0(1). Ez egy konkrét k időlé- 
Pésbeli simítás komplexitása. Ha a teljes szekvenciát szeretnénk simítani, nyilvánvaló 
módszer, hogy egyszerűen az egész simítási folyamatot lefuttatjuk minden egyes simí- 
tandó időpillanatra. Ez 0(t?) időkomplexitást eredményez. Jobb megközelítés a dina- 
mikai programozás nagyon egyszerű alkalmazásával 0(7)-re csökkenti a komplexitást. 
A megoldás kulcsa megjelent az esernyős példa előző elemzésében, ahol az előrefelé 
szűrés folyamatának eredményeit újra fel tudtuk használni. A lineáris idejű algoritmus 
kulcsa így az előrefelé szűrés eredményeinek a tárolása az egész sorozatnál. Aztán a 
visszafelé rekurziót futtatjuk 1-től 1-ig, kiszámítva a szűrt becslést minden k lépésnél 
a kiszámolt b; , j., visszafelé üzenetből és a tárolt f., előrefelé üzenetből. Az algorit- 
mus, amit találóan előre-hátra algoritmusnak (forward-backward algorithm) ne- 
veznek, a 15.4. ábrán látható. 
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function ELŐRE-HÁTRA(ev, prior) returns valószínűségeloszlások egy vektora 
inputs: ev, a bizonyíték (megfigyelés) értékek egy vektora az 1, ..., : lépéshez 
prior: a kezdő állapot P(Xg) a priori eloszlása 
local variables: fv, az előrefelé üzenetek vektora a 0, ..., t lépéshez 
b. a hátrafelé üzenet egy reprezentációja, kezdetben csupa 1 
Sv, a simított becslések vektora az 1, ..., t lépéshez 


£Vf0] — prior 
fori— I tordo 
fv[7l — ELŐRE(fv[7 — 11, ev[/]) 
for ( — tdownto I do 
sv[f] — NoRmauizát(fvl/) x b) 
b — HÁTRA(b, evf/)) 
return sv 











15.4. ábra. Az előre-hátra algoritmus, ami állapotok egy sorozatának az a posteriori valószínűségeit 
számítja ki adott megfigyelési sorozat ismeretében. Az ELŐRE és a HÁTRA műveleteket rendre a (15.3) 
és (15.7) egyenletek definiálják. 





A figyelmes olvasó észrevehette, hogy a 15.3. ábrán látható Bayes-hálóstruktúra 
egy polifa (polytree) a 14. fejezet szóhasználatában. Ez azt jelenti, hogy a csoporto- 
sító algoritmus egy nyilvánvaló alkalmazása szintén lineáris idejű algoritmust eredmé- 
nyez, ami a teljes sorozatra kiszámítja a simított becslést. Mára már világossá vált, 
hogy az előre-hátra algoritmus valójában a csoportosító eljárásokban használt polifa 
terjesztési algoritmusnak egy speciális esete (bár a kettőt egymástól függetlenül fej- 
lesztették ki). 

Az előre-hátra algoritmus alkotja a gerincét azon számítási módszereknek, amelyeket 
számos zajos megfigyelések sorozatával foglalkozó alkalmazásban használnak, a beszéd- 
felismeréstől a repülőgépek radarkövetéséig. Ahogy leírtuk, két gyakorlati hátránya van. 
Az első, hogy a tárigénye túl nagy lehet azoknál az alkalmazásoknál, ahol az állapottér 
nagy, és a sorozatok hosszúak, mivel O(Iflt) méretű tárat használ, ahol If] az előrefelé 
üzenet reprezentációjának a mérete. A tárigény O(jfilog 2-re csökkenthető az idő- 
komplexitásnak egy log r tényezővel történő egyidejű megnövelése árán. ahogy a 15.3. 
feladat mutatja. Bizonyos esetekben (lásd 15.3. alfejezet) egy állandó tárigényű algorit- 
mus használható időbüntetés nélkül. 

Az alapalgoritmus második hátránya, hogy a folyamatos (online) működéshez módo- 
sítást igényel. Ekkor ugyanis a korábbi időpontokhoz simított becsléseket kell kiszámí- 
tanunk, amint folyamatosan új megfigyelések érkeznek a sorozat végéhez. A leggya- 
koribb követelmény az állandó időkülönbségű simítás (fixed-lag smoothing), ami 
a P(x, ale.) simított becslés kiszámítását jelenti egy rögzített d-re. Azaz a simítást a 
jelenlegi  időpillanat előtt d lépéssel lévő időpontra végezzük el; növekedését a simítás- 
nak is követnie kell. Nyilvánvaló, hogy lefuttathatjuk az előre-hátra algoritmust a d lépéses 
sáblakban", amint egy új bizonyíték adódik, de ez nem tűnik hatékonynak. A 15.3. al- 
fejezetben látni fogjuk, hogy az állandó időkülönbségű simításnál egy frissítés bizonyos 
esetekben állandó idő alatt megtehető, függetlenül a d időkülönbségtől. 
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A legvalószínűbb sorozat megtalálása 


Tegyük fei, hogy a biztonsági őr esernyősorozata a munkája első öt napjában az [/gaz. 
igaz, hamis, igaz, igaz). Mi a legvalószínűbb időjárás-sorozat, ami ezt megmagyarázza? 
Az esernyő hiánya a 3. napon azt jelenti, hogy nem esett, vagy azt. hogy az igazgató 
elfelejtette elhozni? Ha a 3. napon nem esett, talán a 4. napon sem esik (mivel az idő- 
járás nem változik gyorsan), de ekkor az igazgató puszta óvatosságból hozta az eser- 
nyőt. Összességében 27 lehetséges időjárás-sorozatot választhatunk. Létezik-e módszer 
a legvalószínűbb sorozat megkeresésére, az összes felsorolása nélkül? 

Az egyik megközelítés, amit kipróbálhatunk a következő lineáris idejű algoritmus: 
használjuk a simító algoritmust, hogy megtaláljuk az időjárás a posteriori eloszlását 
minden időpillanatban: majd állítsuk elő a sorozatot minden egyes lépésnél az 
a posteriori szerinti legvatószínűbb időjárást felhasználva. Egy ilyen megközelítést kö- 
telező gyanakvással kell fogadnia az olvasónak, mivel a szűrés által kiszámított a pos- 
teriori eloszlások az egyes időpontok feletti elosztások, ezzel szemben a legvalószínűbb 
sorozat megtalálásához az összes időpont feletti egyűtres valószínűségeket kell figyelembe 
venni. Az eredmények valójában nagyon különbözők lehetnek (lásd 15.4. feladat). 

Lineáris idejű algoritmus azonban létezik a legvalószínűbb sorozat megtalálására, de 
kicsit több gondolkozást igényel. Ugyanazon a Markov-tulajdonságon alapul, mint ami 
hatékony algoritmusokat eredményezett a szűrésre és a simításra. A problémáról való 
gondolkodás legkönnyebb módja, hogy ha minden sorozatot egy útvonalnak tekintünk 
egy gráfban, aminek a csomópontjai az egyes időpillanatokban a lehetséges állapotok. 
Egy ilyen gráf látható az esernyős problémára a 15.5. (a) ábrán. Most gondoljuk meg a 
gráfon keresztül vezető legvalószínűbb út megkeresésének a problémáját, ahol egy út 
valószínűsége (a likelihood érték) az útvonal menti átmenetek valószínűségeinek és az 
egyes állapotokban adott megfigyelések valószínűségeinek a szorzata. Koncentráljunk 
most azokra az útvonalakra, amelyek elérik az Esős — igaz állapotot. A Markov- 
tulajdonság miatt fennáll, hogy az Esős — igaz állapotba vezető legvalószínűbb útvonal 
tartalmazza azt a tegvalószínűbb útvonalat, amely valamelyik 4. időpontbeli állapotba 
vezet, és amit egy átmenet követ az Esős — igaz-ba; a 4. időpontbeli állapot pedig, ami 
része lesz az Esős — igaz-ba vezető útnak, az az állapot, amelyik maximalizálja ennek 








Másképpen fogalmazva, van egy rekurzív kapcsolat az x, , , állapotokba vezető legvaló- 
színűbb útvonalak és az X, állapotokba vezető legvalószínűbb útvonalak között. Ez a kap- 
csolat olyan egyenletként írható fel, amely az útvonalak valószínűségeit kapcsolja össze: 


maxP(x pc Xs Xpléirr44) — Ber saJK rea max(PCX sah Jmax PC -s Xs X.ler:)) 
Xp.X, bag (159) 


A (15.9) egyenlet megegyezik a szűrés (15.3) egyenletével, azzal a kivétellet, hogy 


1. az f., — P(X.Je,.) előre üzenet helyett a következő üzenet szerepel: 
m,., izt ess P(xi.... X;. X.lej.) 
ret a 
ami az x, állapotba vezető legvalószínűbb út valószínűségeit adja meg: és 
2. a(15.3) egyentletbeli x, feletti összegzés helyett a (15.9) egyenletben az x, feletti ma 
Xximalizálás szerepel. 
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15.5. ábra. (a) Az Eső, lehetséges állapotsorozatait tekinthetjük egy átvezető útnak egy gráfon, aminek 
csomópontjai a lehetséges állapotok az egyes időpontokban, (Az állapotokat négyzetes csomópont jelzi, 
hogy félreérthetetlenül megkülönböztessük őket egy Baycs-háló csomópontjaitól.) (b) A Viterbi-algorítmus 
működése az ligaz, igaz, hamis, igaz, igaz) megfigyelési sorozatra. Minden időpontra feltüntettük az mi, 
üzenet értékeit, ami minden egyes t időpontbeli állapothoz megadja a legjobb, benne végződő sorozat való- 
színűségét. Minden egyes állapothoz egy vastag nyíl is vezet, ami a legjobb elődjét jelzi, a megelőző 
sorozat valószínűségének és az átmenet valószínűségének a szorzata szerint. A vastag nyilak visszafelé 
követése az m.5-beni legvalószínűbb állapotból pedig megadja a legvalószínűbb sorozatot. 





Így a legvalószínűbb állapotsorozat kiszámítása hasonló a szűréshez: előrefelé végig- 
fut a sorozaton, minden időpontban kiszámítva az m üzeneteket a (15.9) egyenlet szerint. 
A számítás menetét a 15.5. (b) ábra mutatja. Végül ez kiadja az összes végső állapothoz 
vezető legvalószínűbb útvonal valószínűségét. Így már könnyen kiválasztható a teljes 
hosszúságú legvalószínűbb sorozat (a vastagon szedettel kiemelt végső állapottól). 
Az aktuális sorozat azonosításához — szemben azzal, amikor csak a valószínűségét szá- 
mítjuk ki — az algoritmusnak minden állapotból mutatókat kell nyilvántartania a legjobb 
hozzá vezető állapothoz (vastagon szedettel látható); a sorozat a mutatóknak a legjobb 
végső állapottól való visszafelé követésével határozható meg. 

Az előzőleg leírt algoritmust Viterbi-algoritmusnak nevezik a megalkotója után. 
Hasonlóan a szűrési algoritmushoz, ennek a komplexitása is lineáris 1-ben, a sorozat 
hosszában. Azonban eltérően a szűréstől, a tárigénye szintén lineáris t-ben. Ez azért van 
így, mert a Viterbi-algorítmusban mutatókkal kel! nyilvántartani az egyes állapotokhoz 
vezető legjobb sorozatot. 
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Az előző fejezet időbeli valószínűségi következtetésre szolgáló algoritmusokat vezetett 
be egy általános keretben, ami független volt az állapotátmenet- és az érzékelő model- 
lek speciális formájától. Ebben és a következő két alfejezetben, olyan konkrétabb 
modelleket és alkalmazásokat tárgyalunk meg. amelyek bemutatják az alapalgoriítmu- 
sok erejét, és bizonyos esetekben további tökéletesítéseket tesznek lehetővé. 

A rejtett Markov-modellekkel (RMM) (hidden Markov model, HMM) kezdjük. 
Egy RMM egy olyan időbeli valószínűségi modell, amelyben a folyamat állapotát 
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egyetlen diszkrét valószínűségi változó írja le. [A modell karakterisztikus tulajdonsága 
tehát a rejtett állapot, azaz a (sztochasztikus) állapotfejlődés és annak passzív (szto- 
chasztikus) megfigyelése. Az index időértelmezése helyett bármely szekvenciális értel- 
mezés lehetséges, gyakori például az indexnek mint egy egydimenziós pozíciónak az 
értelmezése is — a ford.) A változó lehetséges értékei a világ lehetséges állapotai. 
Az előző fejezetben leírt esernyős példa ezért egy RMM, mivel csak egyetlen állapot- 
változója van az Eső, . Az RMM keretei között további állapotváltozók csak úgy adhatók 
hozzá az időbeli modellhez, hogy az összes állapotváltozót egyetlen , megaváltozóba" 
kombináljuk, amelynek az értékei az egyes állapotváltozók értékeinek minden lehetséges 
kombinációja. Látni fogjuk, hogy az RMM-ek korlátozott struktúrája lehetővé teszi az 
összes alapalgoritmus egy nagyon egyszerű és elegáns mátrixos átfordítását.? A 15.6. 
alfejezet bemutatja az RMM-ek használatát a beszédfelismerésben. 


Egyszerűsített mátrix algoritmusok 


Egyetlen, diszkrét X, állapotváltozó esetén konkrét forma adható az állapotátmenet- 
modell, az érzékelő modell és az előre és hátra üzenetek reprezentációira. Jelöljük az 
X, állapotváltozó értékeit I, ..., S egészekkel, ahol S a lehetséges állapotok száma. 
A P(X.IX,.1) állapotátmenet-model) ekkor egy T S x S mátrix, ahol 
Ty—-PO,— ja) 
Azaz Ti az átmenet valószínűsége i-ből j-be. Például az esernyős világban az állapot- 
átmenet-mátrix 
07 03 
T-P(, z 
(XIX. (s 07 


Az érzékelő modellt szintén mátrixalakra hozzuk. Ebben az esetben mivel az E, bizo- 
nyítékváltozó értéke ismert, mondjuk e,, így a modellnek csak azt a részét használjuk, 
ami az e, megjelenésének valószínűségét meghatározza. Minden " időpontra konstruá- 
lunk egy O, diagonális mátrixot, aminek az átlóbeli elemeit a P(e.]X, — i) értékek adják, 
a többi értéke pedig 0. Például az esernyős világban az 1. napon az Uj — igaz, így 
a 15.2. ábra szerint azt kapjuk, hogy 


0.9 0 
sé b 0.2) 


Most oszlopvektort használva az előre és hátra üzenetek reprezentálására, a számítások 
egyszerű mátrix-vektor műveletekké válnak. A (15.3) előrefelé egyenlet ekkor 


fier1 OLAT fir (15.10) 
és a (15.7) visszafelé egyenlet pedig 
bisz — TOz 4 1Dx4.2-1 (15.11) 


3 A vektor- és mátrixművelekben járatlan olvasó számára hasznos lehet az A) függeléket átnézni, mielőtt a 
fejezetben továbbhaladna. 
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Ezekből az egyenletekből látható, hogy az előre-hátra algoritmus (lásd 15.4. ábra) 
időkomplexitása egy t hosszúságú sorozatra történő alkalmazásnál 0(52r), mivel min- 
den lépés egy S elemű vektor szorzását igényli egy S x S mátrixszal. A tárigény pedig 
0(S1), mivel az előrefelé fázis ? darab S méretű vektort tárol el. 

Amellett hogy a mátrixos jelölés az RMM-ek esetében a szűrés és a simítás algorit- 
musaira egy elegáns leírásmódot kínál, ez javított algoritmusokra is jelez lehetőségeket. 
Az első az előre-hátra algoritmus egy egyszerű változata, ami simítás elvégzését teszi 
lehetővé állandó tárigény mellett, a sorozat hosszától függetlenül. Az ötlet az, hogy egy 
konkrét k időpillanatban a simítás mind az f/., előre, mind a b, 1., hátra üzenetek egy- 
idejű jelenlétét igényli a (15.6) egyenlet szerint. Az előre-hátra algoritmus ezt úgy 
biztosítja, hogy az előrefelé fázisban tárolja az f-eket, hogy a hátrafelé fázisban elérhe- 
tők legyenek. Egy másik módszer szerint ez úgy érhető el, hogy egyetlen menetben 
mind f-et, mind b-t ugyanabban az irányban terjesztjük. Például az f , előre" üzenet ter- 
jeszthető hátrafelé, ha átrendezzük a (15.10) egyenletet, hogy a másik irányban működjön: 





fiz FATTYT OT fa 


A módosított szűrési algoritmus úgy működik, hogy először lefut egy szabványos 
előre fázis, kiszámítva f, ,-t (elfelejtve az összes közbenső eredményt), majd lefut egy 
visszafelé fázis együtt b-re és f-re, kiszámítva a simított becslést minden időpontban. 
Mivel mindegyik üzenetnek csak egy példánya szükséges, a tárigény állandó (azaz füg- 
getlen r-től, a sorozat hosszától). Az algorítmusra egyetlen jelentős megkötés vonatkozik: 
az állapotátmenet-mátrixnak invertálhatónak kell lennie, és az érzékelő modellben nem le- 
hetnek nullák — azaz minden megfigyelésnek lehetségesnek kell lenni minden állapotban. 

A második terület, ahol a mátrixjelölés javítást jelez, a menet közben történő (online) 
simítás állandó időkülönbözettel. Az a tény, hogy a simítás elvégezhető állandó tár- 
igénnyel azt jelzi, hogy léteznie kell egy hatékony rekurzív algoritmusnak menet köz- 
beni simításra — azaz olyan algoritmusnak amelynek az időkomplexitása független az 
időkülönbözet hosszától. Tegyük fel, hogy az időkülönbözet d; azaz a simítást 1 — d idő- 
pontban végezzük, ahol ? a jelenlegi időpont. A (15.6) egyenlet szerint ki kell számol- 
nunk a r — d időpontra az 


fr gDegyiz 
értékét. Majd amikor az új megfigyelés beérkezik, a 1—d 4 1 időpontra kell kiszámíta- 
nunk az 


OÜrndét Br.d42zai 
értéket. Hogyan tehető ez meg inkrementálisan? Először is, az f,., 4, a kiszámítható az 
f.,. arből a szabványos szűrés műveletét használva a (15.3) egyenlet szerint. 

A visszafelé üzenet inkrementális kiszámítása trükkösebb, mivel nincs egyszerű kap- 
csolat a régi b, 4, 4., visszafelé üzenet és az új b, 3,2.,4s visszafelé üzenet között. Ehe- 
lyett, a régi b, 4.1., visszafelé üzenet és a sorozat kezdő b,, 1 ., visszafelé üzenete közöt- 
ti kapcsolatot fogjuk megvizsgálni. Ennek eléréséhez alkalmazzuk a (15.11) egyenletet 
d alkalommal, és azt kapjuk, hogy 

1 


b. va —T II TO; b, — B, 441 (15.12) 
4——d41 
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ahol a B, 4. 1. mátrix a T és az O mátrixok sorozatának a szorzata. A B-t felfoghatjuk 
egy transzformációs operátornak", ami egy későbbi visszafelé üzenetet egy korábbiba 
alakít. Egy hasonló egyenlet áll fenn az új visszafelé üzenetekre a következő megfigye- 
lés beérkezése után: 
1-4 


besze [ II TO; boy2r41— Bars! (15.13) 
1—1—d42 





Ha a (15.12) és a (15.13) egyenletben megvizsgáljuk a szorzatokat, láthatjuk, hogy egy- 
szerű kapcsolat van közöttük: a második szorzathoz el kell , osztani" az első szorzatot 
TO, 44 1-gyel. és megszorozni az új utolsó elemmel TO, 1-gyel. Mátrixjelöléssel ekkor 
a régi és az új B mátrixok között egy egyszerű kapcsolat van: 


ús; 88 
B, 442741 — Og (TB, aaz TO4ga (15.14) 
Ez az egyenlet a B mátrix egy inkrementális frissítését adja, amely viszont (a (15.3) 


egyenlet által) lehetővé teszi az új b, 44241 visszafelé üzenet kiszámítását. A teljes 
algoritmus, ami az f és B tárolását és frissítését igényli, a 15.6. ábrán látható. 





function ÁLLANDÓ-IDŐKÜLÖNBSÉGŰ-SIMÍTÁS(e, mmm, d) returns egy eloszlás X, a felett 
inputs: ey, a jelenlegi bizonyíték a : időpontban 
"mm, egy rejtett Markov-modell $ x § méretű T állapotátmenet-mátrixszal 
d. az időkülönbség nagysága a simításnál 
static: z, a jelenlegi idő, kezdetben ! 
€, egy valószínűség-eloszlás, a P(X.ley.,) előrefelé üzenet, kezdetben PRIOR[/mrn) 
B, a d lépésnyit hátrafelé transzformáló mátrix, kezdetben az egységmátrix 
€, a, A bizonyítékok kétirányú listája : — d-től t-ig, kezdetben üres 
local variables: 0, 4. 0, diagonális mátrixok az érzékelő modell információjával 


adjuk ert az é,. ay végéhez 
0, — egy P(elX-t tartalmazó diagonális mátrix 
41 5 d then 
f — ELŐRE, ej) 
töröld e, 4.1-et az e, a.s elejéről 
0, 4 — egy P(e, alX,.4)-t taralmazó diagonális mátrix 
B—04T BTO, 
else B — BTO, 
tiszt 
if r 5 d then return NORMALIZÁL(£ x B1) else return semmi 











15.6. ábra. Egy állandó d lépésnyi időkülönbözettel simító algoritmus, fol 
algoritmusként megvalósítva: egy új időpontbeli megfigyelésre kiadja az új 





latos működésű (online) 
ított becslést 





15.4. KALMAN-SZŰRŐK 


Képzeljünk el egy kismadarat, amint a dzsungel sűrűjében repül szürkületkor: a moz- 
gásának csupán rövid, szakaszos felvillanásait pillanthatjuk meg; minden igyekeze- 
tünkkel azt próbáljuk megjósolni, hogy hol van most a madár, és legközelebb hol fog 
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felbukkanni, hogy nehogy szem elől tévesszük. Vagy képzeljük azt, hogy a második vi- 
lágháborúban radarkezelők vagyunk, egy gyenge, mozgó radarjelet kémlelve, ami 10 
másodpercenként jelenik meg a képernyőn. Vagy, kissé még távolabbra visszalépve, 
képzeljük magunkat Kepler helyébe, ahogy a bolygók mozgását próbálja rekonstruálni 
igen pontatlan szögmérések sokaságából, amit rendszertelen és pontatlanul mért inter- 
vallumokban rögzítettek. Mindegyik esetben egy fizikai rendszer állapotát próbáljuk meg- 
becsülni (helyet és sebességet például) időben egymást követő zajos megfigyelésekből. 
A problémát megfogalmazhatjuk egy időbeli valószínűségi modellben való következtetés- 
ként, ahol az állapotátmenet-modell a mozgás fizikáját írja le, az érzékelő modell! pedig a 
mérési folyamatot. Ez a fejezet azokat a speciális reprezentációkat és következtetési algo- 
ritmusokat vizsgálja, amelyeket ilyen típusú problémákra fejlesztettek ki; a tárgyalt eljárást 
Kalman-szűrésnek (Kalman filtering) nevezik, a kidolgozója Rudolf E. Kalman? után. 

Világos, hogy több folytonos változóra lesz szükségünk a rendszer állapotának meg- 
adásához. Például a madár repülése megadható egy (X, Y, Z) pozícióval és egy (X, Y, 2) 
sebességgel minden egyes időpillanatban. Szükségünk lesz még alkalmas feltételes 
sűrűségfüggvényekre az állapotátmenet- és érzékelő modellekhez; a 14. fejezethez 
hasonlóan, lineáris Gauss-eloszlásokat (linear Gaussian) fogunk használni. Ez azt je- 
lenti, hogy a következő X,.4 állapot a jelenlegi X, állapot lineáris függvénye, amihez 
még egy Gauss-zaj adódik, amely feltétel a gyakorlatban igen elfogadhatónak bizonyul. 
Tekintsük például a madár X koordinátáját, pillanatnyilag figyelmen kívül hagyva a töb- 
bi koordinátát. Legyen a megfigyelések közötti intervallum A, és tételezzünk fel állan- 
dó sebességet; ekkor a pozíció frissítésére az adódik, hogy 


X.4a-X,4XA 
Ha Gauss-zajt adunk hozzá, akkor egy lineáris Gauss-féle állapotátmenet-modellt kapunk: 
P(X4a —agyalxp 7 xX-áp)ENO, Hi A GYx4a) 


Az X, pozíció és X, sebességvektorok alkotta rendszerhez tartozó Bayes-hálóstruktúra 
a 15.7. ábrán látható. Vegyük észre, hogy ez a lineáris Gauss-modellnek egy nagyon 


/ 


15.T. ábra. Egy X, hely, X, sebesség és Z, helymegfigyelés alkotta lincáris dinamikus rendszerhez tarto- 
zó Bayes-hálóstruktúra 


$ Rudolf E. Kalman (Kálmán Rudolf) magyar származású matematikus, 
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speciális alakja; az általános alakot a fejezetben később írjuk le, ami alkalmazások nagyon 
széles körét fedi le az első bekezdés egyszerű mozgásos példáin túl. Az olvasónak hasz- 
nos lehet az A) függelékben átnézni a Gauss-eloszlások egyes matematikai tulajdonsá- 
gait; a jelenlegi céljainkhoz a legfontosabb, hogy egy többváltozós Gauss-eloszlást 
(multivariate Gaussian) d változó esetén egy d elemű 4 átlag és egy d x d-s E 
kovarianciamátrix ad meg. 


Gauss-eloszlások frissítése 


A 14. fejezetben hivatkoztunk a lineáris Gauss-eloszlások családjának egy alaptulajdon- 
ságára: az eloszláscsalád zárt a standard Baycs-hálóbeli műveletekre. Most ezt az állítást 
pontosítjuk az időbeli valószínűségi modellben végzett szűrés esetére. A megkövetelt tu- 
lajdonságok megfelelnek a szűrés (15.3) egyenletben megadott kétlépéses számításának: 


1. Ha a jelenlegi P(XJej.,) eloszlás Gauss-eloszlás és a P(X,,11x) állapotátmenet- 
modell lineáris Gauss-modell, akkor az egylépéses előrejelzés eloszlása 


PCX, ale) — f PO a PO led, (15.15) 
x 
szintén Gauss-eloszlás. 
2. Ha az előrejelzés P(X, , 1le1.) eloszlása Gauss-eloszlás és a P(e,, 1X.41) érzékelő modell 
lineáris Gauss-modell, akkor az új bizonyítékkal, mint feltétellel, a frissített eloszlás 


PG palérz41) — 0PCE alX PK galetrr) (15.16) 
szintén Gauss-eloszlás. 


Így a Kalman-szűrés ELŐRE művelete fogad egy 4, átlaggal és 3, kovarianciamátrixszal 
meghatározott f,,, Gauss előre üzenetet, És előállít egy új többváltozós f,. ma C Gauss elő- 
re üzenetet 44 "átlaggal és X.1 kovarianciamátrixszal. Így, ha egy f, — P(Xo) — 
N(1o, X0) Gauss-eloszlással indulunk, egy lineáris (Gauss-modellel való szűrés az álla- 
potokon Gauss-eloszlást eredményez minden időpontban. 

Ez tetszetős és elegáns eredménynek tűnik, de miért is olyan fontos? Ennek a magya- 
rázata az, hogy a most tárgyalt esethez hasonló néhány speciális esetet kivéve, a szűrés 
folytonos vagy hibrid (diszkrét és folytonos) hálókkal olyan állapotetoszlásokat generál, 
amelyek reprezentációja az idővel korlátlanul nő. Ezt az állítást általában nem könnyű 
bizonyítani, de a 15.5. feladat egy egyszerű példán mutatja be, hogy mi történik. 


Egy egyszerű egydimenziós példa 


Azt állítottuk, hogy a Kalman-szűrés ELŐRE művelete egy Gauss-eloszlást egy új 
Gauss-eloszlásba visz át. Ez új átlag- és kovarianciamátrix kiszámítását jelenti az elő- 
ző átlagból és kovarianciamátrixból. Az általános (többváltozós) eset frissítési szabá- 
lyának származtatása igen sok lineáris algebrai lépést igényel, így egyelőre a nagyon 
egyszerű egyváltozós esetnél maradunk, és később adjuk meg az eredményeket az általános 
esetre. A számítások még az egyváltozós esetre is unalmasak kissé, de úgy érezzük, hogy 
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érdemes látni őket, mivel a Kalman-szűrő hasznossága olyan szorosan kötődik a Gauss- 
eloszlások matematikai tulajdonságaihoz. 

A tárgyalt időbeli modell egyetlen folytonos X, állapotváltozós véletlen bolyongást 
(random walk) ír ie egy zajos Z, megfigyeléssel. Egy példa lehet erre a , vásárlói biza- 
lom" mutatója, amit modellezhetünk úgy, mint ami havonként egy véletlen Gauss- 
eloszlású változáson megy át, és amelyet egy véletlen vásárlói kérdőív mér fel, ami 
szintén Gauss-mintavételi zajt okoz. Az a priori eloszlást gaussinak tételezzük fel 
Vr szórásnégyzettel: 





P(x) — ae ? 


(Az egyszerűség kedvéért ebben a fejezetben ugyanazt az a: szimbólumot fogjuk hasz- 
nálni minden normalizációs állandó jelölésére.) Az állapotátmenet-modell egyszerűen 
a jelenlegi állapot egy Gauss-eloszlású módosítását jelenti állandó 22 szórásnégyzettel: 


sz 1 Gazd] 
2 oz 
PGzyi I x)-ae 4 
Az érzékelő modell egy Gauss-eloszlású zajt tételez fel 02 szórásnégyzettel: 
-[8— I 2] 
Pízkp-oe d S 


Most, az a priori P(Xg) eloszlás ismeretében kiszámíthatjuk az egylépéses előrejelzés el- 
oszlását felhasználva a (15.15) egyenletet: 


tev KÖ ai 
Pa f[/ Pixlxo)PCxo)dxo -af/e 
o af Y-t 





Az integrál i fe TRENT néz ki. A továbbhaladás lehetőségét annak észrevétele je- 
lenti, hogy a kitevő két olyan kifejezés összege, amelyek négyzetesek xg-ban, és így az 
maga is négyzetes xg-ban. Egy egyszerű trükk, amit teljes négyzetté kiegészítésként 
(completíng the sguare) ismerünk, lehetővé teszi bármely ax 4 bxg 1 c átírását egy 


b 
alxg -2 négyzetes tag és egy c Tao tól független maradék tag összegévé. A ma- 
radék tag az integrálból kivihető, így azt kapjuk, hogy 


P(x) — ar ST bő], 


Most az integrál Pontosan egy Gauss-eloszlás teljes tartomány feletti integrálja, ami 
egyszerűen 1-et ad. Így csupán a maradék tag maradt a négyzetesből. 
A második kulcslépés annak észrevétele, hogy a maradék tagnak xy-ben négyzetes- 
nek kell lennie; valóban, egyszerűsítés után azt kapjuk, hogy 
41 E 7] 
7 
P(x) ae A 08-te 
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x pozíció 


15.8. ábra. A Kalman-szűírés frissítési ciklusának a lépései egy véletlen bolyongás esetén. A véletlen bo- 
lyongás a priori eloszlása sg — 0.0 és ag — 1.0. az átmenet bizonytalansága a, — 2.0, az érzékelő bi- 
zonytalansága 0, — 1.0, az első megfigyelés pedig z, — 2.5 (az x tengelyen csillaggal jelölve). Vegyük 
észre, ahogy a P(x) előrejelzés ellapul a P(xp)-hoz képest az átmenet bizonytalansága miatt. Vegyük azt 
zre, hogy az a posteriori P(xulz1) kissé balra helyezkedik el a z, megfigyeléstől, mivel az átlag az 
előrejelzés és a megfigyelés súlyozott átlaga. 





Azaz az egylépéses előrejelzés eloszlása sgalssreloszlás, ugyanazzal a ug átlaggal, 
a szórásnégyzet pedig egyenlő az eredeti vő szórásnégyzetnek és az átmenet oz szórás- 
négyzetének az összegével. Egy pillanatnyi belegondolás után ez szemléletesen is el- 
fogadhatónak tűnik. 

A frissítés lépésének befejezéséhez még szükséges, hogy az első időpontbeli megfi- 
gyelést, xy-t feltételként vegyük számításba. A (15.16) egyenletből erre az adódik, hogy 


Péld -aPíak0Ptxp) — sal La 2 retek. ] 


Most ismét kombináljuk a kitevőket, és négyzetté egészítsük ki (15.6 feladat), azt kap- 
va, hogy 
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P(xI2)— ae (15.17) 


így egy frissítési ciklus után egy új Gauss-eloszlásunk van az állapotváltozóra. 
A (15.17) egyenletben a Gauss-alakból láthatjuk. hogy az új átlag és szórás kiszámít- 
ható a régi átlagból és szórásból a következőképpen: 


(oz Hős ya Hoz 
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09402 tol (15.18) 


A 15.8. ábrán látható egy frissítési ciklus az állapotátmenet- és az érzékelő modell 
konkrét értékei esetén. 
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Az előző egyenletpár pontosan ugyanazt a szerepet játssza, mint az általános szűrés 
egyenlete (t5.3) vagy az RMM-szűrés egyenlete (15.10). A Gauss-eloszlások speciális 
tulajdonsága miatt azonban az egyenleteknek van néhány további érdekes tulajdonsá- 
ga. Először is, hogy az új tra átlag kiszámítása értelmezhető úgy, mint egyszerűen az 
új z,,1 megfigyelés és a régi 4, átlag súlyozott átlaga. Ha a megfigyelés megbízhatat- 
lan, akkor oz Jagy, és több figyelmet szentelünk a régi átlagnak; ha a régi átlag meg- 
bízhatatlan (sZ nagy), vagy a folyamat nehezen megjósolható (oz nagy), akkor több fi- 
gyelmet szentelünk a megfigyelésnek. Másodszor, vegyük észre, hogy a 04-i szórás- 
négyzet frissítése független a megfigyeléstől. Ezért előre kiszámíthatjuk, hogy mi lesz 
a szórásnégyzetértékek sorozata. Harmadszor, a szórásnégyzetértékek sorozata gyorsan 
konvergál egy adott értékhez, ami csak 02 -től és 02-től függ, ezáltal lényegesen egy- 
szerűsítve az elkövetkező számításokat (lásd 15.7. feladat). 


Az általános eset 


Az előző levezetés szemléletesen bemutatta a Gauss-eloszlásoknak azt az alaptulajdon- 
ságát, ami a Kalman-szűrés működését lehetővé teszi: azt a tényt, hogy az exponens 
négyzetes alakú. Ez nem csak az egyváltozós esetre igaz; a teljes többváltozós Gauss- 
eloszlás alakja: 
Ny, D(x) — ae ale-nyzs-n) 
A kitevőben lévő tényezők összeszorzása láthatóvá teszi, hogy a kitevő is négyzetes 
függvénye az x-ben lévő x; valószínűségi változóknak. Ahogy az egyváltozós esetben, 
a szűrési frissítés megőrzi az állapoteloszlás gaussi voltát. 

Elsőként definiáljuk a Kalman-szűrésnél használt általános időbeli modellt. Mind az 
állapotátmenet-modell, mind az érzékelő modell lineáris transzformációt enged meg 
additív Gauss-zajjal. Így azt kapjuk, hogy 


PCxgyi [x— N(Fx, EX) 
Ptz, Ixp) — N(CHx,, E. z,) 
ahol az F és a D, mátrixok a lineáris állapotátmenet-modellt és az átmeneti zaj kovarian- 


ciáját írják le, a H és a 32. pedig az érzékelő modell megfelelő mátrixai. Ekkor az átlag és 
a kovariancia frissítésének az egyenletei a maguk rémisztő valóságában: 


Ha 7 Fi EK, a(z, 41 —HF4t) 
E41-0-K aXFZFT 47) (15.20) 


ahol a K,.4 -(FZFT 4X, JH"(H(FZFT Ke HT a ny! mennyiség neve a Kal- 
man-erősítésmátrix (Kalman gain matrix). Akár hihető. akár nem, ezeknek az 
egyenleteknek lehetséges egy szemléletes értelmezése. Például, gondoljuk meg a 4i ál- 
lapotátlag-becslés frissítését. Az Fu, tag a 141 időpontban előre jelzett állapot, így 
HFy4u, az előre jelzett megfigyelés. Ezért a z,, , - HF, tag az előre jelzett megfigyelés 
hibáját reprezentálja. Ez van megszorozva a K, , tényezővel az előre jelzett állapot kor- 
rigálásához; így a K,, , annak mértéke, hogy mennyire kell figyelembe venni az új meg- 
figyelést az előrejelzéshez képest. Ahogyan a (15.18) egyenletben, az a tulajdonság 


(15.19) 
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most is fennáll, hogy a szórásnégyzet frissítése független a megfigyeléstől. A E, és a K, 
értékek sorozata ezért előre (offline) is kiszámolható, és a követés közben szükséges 
konkrét számítások igen mérsékeltek. 

Hogy bemutassuk az egyenletek működését egy X-Y síkon mozgó tárgy követésének 
a problémájára alkalmaztuk őket. Az állapotváltozók az X — (X, Y, X, P)T, így az F, 
Ep Hés E, 4 x 4-es mátrixok. A 15.9. (a) ábrán látható az igazi pályagörbe, a zajos 
megfigyelések sorozata és a Kalman-szűréssel becsült pályagörbe végig a kovarianciá- 
val, amit az egységnyi szórás méretű körvonalak jeleznek. A szűrési folyamat jól teljesít 
az aktuális mozgás követésében. és ahogy várható, a szórásnégyzet gyorsan beáll egy rög- 
Zített értékre. 

Ahogyan szűrésre, úgy simításra is származtathatók egyenletek lineáris Gauss-mod- 
ell esetén. A simítás eredményei a 15.9. (b) ábrán láthatók. Vegyük észre, hogy a hely- 
zetbecslés szórásnégyzete gyorsan lecsökken, a pályagörbe végét leszámítva (itt miért 
nem?), és hogy a simítással becsült pályagörbe sokkal egyenletesebb. 


2D szűrés 2D sármítás 











15.9. ábra. (a) A Kalman-szűrés eredménye egy X-Y síkon mozgó objektumnál, feltüntetve a valódi 
(balról jobbra haladó) pályagörbét, a zajos megfigyelések egy sorozatát és a Kalman-szűrés alapján 
becsült pályagörbét. A belybecslések szórásait az oválisok jelzik. (b) A Kalman-simítás eredménye 
ugyanarra a megfigyelési sorozatra. 


A Kalman-szűrés alkalmazhatósága 


A Kalman-szűrést és kiterjesztéseit alkalmazások széles körében használják. A , klasz- 
szikus" alkalmazás légi járművek és rakéták radar követése. Kapcsolódó alkalmazások 
között van a tengeralattjárók és földi járművek akusztikai követése, és járművek és em- 
berek képi követése. Egy kissé elvontabb szemlélettel a Kalman-szűrőket részecskék 
buborékkamrás pályagörbéjének rekonstrukciójára, valamint óceáni áramlások felszíni 
műholdképek alapján történő rekonstrukciójára használják. Az alkalmazások köre sok- 
kal szélesebb, mint csupán mozgások követése: bármely rendszerre alkalmazható, ami 
folytonos állapotváltozókkal és zajos megfigyelésekkel jellemezhető. Ilyen rendszerek 
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magukban foglalnak zúzdákat, vegyi üzemeket, nukleáris reaktorokat, növényi öko- 
szisztémákat és nemzetgazdaságokat. 

A Kalman-szűrés alkalmazhatóságának ténye egy rendszerre nem jelenti, hogy az ered- 
mények érvényesek vagy hasznosak lesznek. A feltevések — lineáris Gauss-féle állapot- 
átmenet-modell és érzékelő modell — igen erősek. A kiterjesztett Kalman-szűrő (KKSZ) 
(extended Kalman filter, EKF) megpróbál úrrá lenni a modellezett rendszer nemlineáris 
tulajdonságain. Egy rendszer nemlineáris, ha az állapotátmenet-modell nem írható le, mint 
az állapotvektor mátrixszorzata, ahogyan ez a (15.19) egyenletben szerepel. A KKSZ úgy 
működik, hogy rendszert x,-ben lokálisan lineárisként modellezi az x, — pt, környezetében, 
ahol yt , a jelenlegi állapoteloszlás átlaga. Ez jól működik , sima", , jó magaviseletű" rend- 
szereknél, és lehetővé teszi a követőnek, hogy egy olyan Gauss-állapoteloszlást tartson 
nyilván és frissítsen, ami elfogadható közelítése az igazi a posteriori eloszlásnak. 

Azonban mit is jelent, hogy egy rendszer , nem sima" vagy ,rossz magaviseletű"? 
Technikailag ez azt jelenti, hogy jelentős nemlinearitás van jelen a rendszer viselkedé- 
sében abban a régióban, ami , közel" van a jelenlegi ,z, átlaghoz (a X, kovarianciamátrix 
szerint). Ennek a tulajdonságnak a nem technikai megértéséhez gondoljunk arra a példá- 
ra, amikor egy dzsungelben szálló madár követésével próbálkoztunk. A madár nagy se- 
bességgel egyenesen egy fatörzs felé tart. A Kalman-szűrő, akár reguláris, akár kiterjesz- 
tett a madár pozíciójára, csak Gauss-előrejelzést adhat, és ennek a Gaussnak az átlaga a 
fatörzs közepére esik, ahogyan a 15.10. (a) ábrán látható. A madár egy elfogadható mo- 
dellje azonban egy elkerülő műveletet jelezne előre egyik vagy másik oldalra, ahogy az 
a 15.10. (b) ábrán látható. Egy ilyen modell erősen nemlineáris, mivel a madár döntése 
nagyon eltérő a fatörzshöz vett pontos pozíciójának függvényében. 

Ilyen példák kezeléséhez nyilvánvalóan egy kifejezőbb nyelvre van szükségünk a 
modellezett rendszer viselkedésének a reprezentálásához. A szabályozáselmélet terü- 
letén, ahol olyan problémák, mint például egy repülőgép elkerülő manőverezése ugyan- 





(a) b 


15.10. ábra. Egy fa felé repülő madár (felülnézetben). (a) Egy Kalman-szűrő előrejelzése a madár helyze- 
tére, ami egyetlen Gauss-eloszlás az akadály közepére illesztve. (b) Egy valósághűbb modell számításba ve- 
Szi a madár elkerülő manővereit, és azt jelzi előre, hogy az egyik vagy a másik oldalon fog elszállni. 
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ilyen típusú bonyodalmakat vetnek fel, a megszokott megoldás a váltó Kalman-szűrő 
(switching Kalman filter). Ebben a megközelítésben, több Kalman-szűrő fut párhuza- 
mosan, mindegyik a rendszer különböző modelljét használva — például egy az egyenes 
repülésre, egy az éles balra fordulásra és egy az éles jobbra fordulásra. Az előrejelzé- 
seknek egy súlyozott összegét használjuk, ahol a súly attól függ, hogy mennyire illesz- 
kednek az egyes szűrők az aktuális adatokhoz. A következő fejezetben látni fogjuk, 
hogy ez egyszerűen az általános dinamikus Bayes-háló modell egy speciális esete, amit 
a 15.7. ábrán látható hálóból egy diszkrét , manőver" állapotváltozó hozzáadásával nye- 
rünk. A váltó Kalman-szűrőket a 15.5. feladat tárgyalja tovább. 


15.5. DINAMIKUS BAYES-HÁLÓK 


Egy dinamikus Bayes-háló vagy DBH (dynamic Bayesian network, DBN) egy olyan 
Bayes-háló, ami egy a 15.1. alfejezetben leírt típusú időbeli valószínűségi modellt rep- 
rezentál. (Ahogy korábban is említettük az index időbeli értelmezése helyett bármely 
szekvenciális értelmezés lehetséges, gyakori például az indexnek mint egy egydimen- 
ziós helyzeti pozíciónak az értelmezése is — a ford.) A DBH-kra már láttunk példákat, 
a 15.2. ábrán az esernyős hálót és a 15.7. ábrán a Kalman-szűrő hálót. Általában egy 
DBH minden egyes szeletének tetszőleges számú állapotváltozója (X,) és bizonyíték- 
változója (E,) lehet. Az egyszerűség kedvéért fel fogjuk tenni, hogy a változók és kap- 
csolataik szeletről szeletre pontosan ismétlődnek, és hogy a DBH egy elsőrendű 
Markov-folyamatot reprezentál, így minden változónak csak a saját szeletében vagy 
a közvetlenül megelőző szeletben lehetnek szülei. 

Nyilvánvaló, hogy minden rejtett Markov-modell reprezentálható mint egy DBH, 
egyetlen állapotváltozóval és egyetlen bizonyítékváltozóval. Az is fennáll, hogy minden 
diszkrét változós DBH reprezentálható mint egy RMM; ahogyan a 15.3. alfejezetben 
megmutattuk, a DBH összes állapotváltozója összekombinálható egyetlen állapotváltozó- 
vá, aminek az értékei az egyes állapotváltozók értékeinek az összes lehetséges együttese. 
Azonban ha minden RMM egy DBH, és minden DBH átfordítható egy RMM-be, akkor 
mi a különbség? A különbség abban rejlik, hogy egy komplex rendszer állapotának az őt 
alkotó változókra történő dekomponálásával a DBH képes kihasználni az időbeli való- 
színűségi modell ritkaságát. Tegyük fel például, hogy egy DBH-nak 20 bináris állapot- 
változója van, amelyek mindegyikének három szülője van az előző szeletben. Ekkor a 
DBH állapotátmenet-modellje 20 x 2? — 160 valószínűségi értéket tartalmaz, míg a hozzá- 
tartozó RMM-nek 229 állapota és ezért 29, azaz durván egybillió átmenet-valószínűség ér- 
téke van az állapotátmenet-mátrixban. Ez legalább három ok miatt is rossz: először, hogy az 
RMM maga sokkal több tárat igényel, másodszor, hogy a hatalmas állapotátmenet-mátrix 
az RMM-következtetést sokkal költségesebbé teszi, harmadszor, hogy ilyen hatalmas szá- 
mú paraméter megtanulásának problémája a tiszta RMM-modelleket alkalmazhatatlanná 
teszi nagy problémák esetén. A DBH-k és az RMM-ek közötti kapcsolat nagyjából analóg 
a hagyományos Bayes-hálók és a teljes táblázatos együttes eloszlások közötti kapcsolathoz. 

Már megmutattuk, hogy minden Kalman-szűrő reprezentálható egy DBH-ban folyto- 
nos változókkal és lineáris Gauss feltételes eloszlásokkal (lásd 15.7. ábra). Az előző feje- 
zet végén tárgyaltak miatt azzal is tisztában kell lenni, hogy nem minden DBH reprezen- 
tálható egyetlen Kalman-szűrő modellel. Egy Kalman-szűrőnél az aktuális állapotelosz- 
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lás mindig egy egyedülálló többváltozós Gauss-eloszlás — azaz egyetlen , dudor" egy 
konkrét helyen. A DBH-k ezzel szemben tetszőleges eloszlást képesek modellezni, Szá- 
mos valós alkalmazásnál ez a rugalmasság elengedhetetlen. Gondoljuk meg például a 
kulcsaim jelenlegi helyét. Lehetnek a zsebeimben, az éjjeli szekrényen, a konyhapulton 
vagy a bejárati ajtóban himbálódzva. Egyetlen Gauss-dudornak, ami ezt az összes he- 
lyet magában foglalja, jelentős valószínűséget kell rendelni ahhoz, hogy a kulcsok az 
előszobában a levegőben vannak. A valós világ olyan aspektusai, mint céltudatos ágen- 
sek, akadályok és zsebek , nemlinearitásokat" vezetnek be, amelyek diszkrét és folyto- 
nos változók kombinációját igénylik, hogy egy elfogadható modellhez jussunk. 


DBH-k létrehozása 


Egy DBH létrehozásához háromfajta információt kell megadni: a P(Xg) a priori eloszlást 
az állapotváltozók felett; a P(X, , IX.) állapotátmenet-modellt; és a P(E,IX,) érzékelő mo- 
dellt. Az állapotátmenet- és érzékelő modell megadásához, meg kell adni az egymást 
követő szeletek közötti és az állapot- és bizonyítékváltozók közötti kapcsolatok topoló- 
Biáját. Mivel az állapotátmenet- és érzékelő modelleket stacionáriusnak — minden t-re 
azonosnak — tételezzük fel, a legkényelmesebb egyszerűen az első szeletre megadni 
őket. Például az esernyős világ teljes DBH-specifikációját megadja az a három csomó- 
Pontos háló, ami a 15.11. (a) ábrán látható. Ebből a specifikációból a teljes (egyik irány- 
ban végtelen) DBH megkonstruálható az első szelet megfelelő másolásával. 

Gondoljunk most át egy érdekesebb példát: egy akkumulátorhajtású, az X-Y síkon 
mozgó robot követesét, ahogyan azt a 15.1. alfejezetben bevezettük. Elsőként szüksé- 
günk van állapotváltozókra, amelyek mind az X, — (X,, Y) pozíció-, mind az X,5(Xx,Y) 
sebességkomponenseket magukban foglalják. Feltételezünk valamilyen pozíciómérő 
módszert - akár egy rögzített kamerát vagy egy felszíni GPS-t (Global Positioning 
System) -, ami a Z, méréseket eredményezi. A pozíció a következő időpontban a jelen- 
legi pozíciótól és sebességtől függ, ugyanúgy, mint a standard Kalman-szűrő modell- 
ben. A sebesség a következő időpontban a jelen sebességtől és az akkumulátor állapo- 
tától függ. Felveszünk még egy Akkumulátor, változót az aktuális akkumulátor töltési 
szintjének reprezentálására, aminek szülői az előző akkumulátorszint és a sebesség, és 
felveszünk még egy AMérő, változót, ami az akkumulátor töltési szintjét méri. Ez szol- 
gáltatja a 15.11. (b) ábrán látható alapmodellt. 

Érdemes részletesebben megvizsgálni az AMérő;-hez tartozó érzékelőmodell tulaj- 
donságait. Tegyük fel az egyszerűség kedvéért, hogy mind az Akkumulátor,, mind az 
AMérő, diszkrét értékeket vehetnek fel 0-tól 5-ig — igen hasonlóan egy tipikus laptop 
számítógép akkumulátormérőjéhez. Ha a mérő mindig pontos akkor a P(AMérőJAkku- 
mulátor) FVT-nek végig 1,0 valószínűségeket kell tartalmaznia az .áttójában" és 0,0 
valószínűségeket máshol. A valóságban a mérésekben a zaj mindig felbukkan. Folyto- 
nos mérésekre, egy kis szórású Gauss-eloszlást lehetne ehelyett használni." A diszkrét 
változóinknál a Gauss-eloszlást egy olyan eloszlással közelíthetjük, amelyben a hiba 
valószínűsége a megfelelő módon csökken, így nagy hiba valószínűsége igen kicsi. 


5 szigorúan véve egy Gauss-eloszlás problematikus, mivel pozitív valószínűséget rendet nagy negatív tölté- 
sí szintekhez. A béta-eloszlás gyakran jobb választás az olyan változókra, amelyeknek tartománya korlátos. 
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(a) (b) 
15.11. ábra. (a) Az esernyős DBH-hoz tartozó a priori eloszlás, az állapotátmenet-modell és az érzékelő 
modell megadása. Az összes következő szelet feltevésünk szerint az 1. szelet másolata. (b) Egy X-F 
síkon való robotmozgáshoz tartozó egyszerű DBH. 


A Gauss-hibamodell (Gaussian error model) kifejezést fogjuk használni mind a foly- 
tonos, mind a diszkrét változatokra. 

A robotikában bárki, aki egy kevés gyakorlattal rendelkezik a számítógépes folyamat- 
vezérlésben vagy az automatikus érzékelés más eseteiben, rögtön tanúskodik arról 
a tényről, hogy a kis mennyiségű mérési hiba gyakran a legkevésbé fontos a problémák 
között. Ugyanis a valódi érzékelők elromlanak, és amikor egy érzékelő elromlik, akkor 
nem küld szükségszerűen egy jelet azzal, hogy , Ó, egyébiránt az adat, amit küldök, egy 
halom zagyvaság." Ehelyett egyszerűen küldi a zagyvaságot. A meghibásodás legegy- 
szerűbb formáját átmeneti hibának (transient failure) nevezik, amikor az érzékelő 
alkalmanként elhatározza, hogy valami zagyvaságot küld. Például az akkumulátor 
szintérzékelőjének lehet olyan szokása, hogy nullát küld, amikor valaki meglöki a ro- 
botot, még akkor is, ha az akkumulátor teljesen fel van töltve. 

Lássuk, mi történik, amikor egy átmeneti hiba bekövetkezik egy Gauss-hibamodellnél, 
ami nem tudja kezelni az ilyen hibákat. Tételezzük fel például, hogy a robot csendesen 
üldögél, és 20 egymást követő mérés az akkumulátoron 5-öt ad. Ezután az akkumulátor- 
mérő időleges kiesése miatt a következő mérés eredménye AMérőzy — 0. Mire kell 
következtetnünk egy egyszerű Gauss-hibamodellből az Akkumulátor2y-gyel kapcsolat- 
ban. A Bayes-szabály szerint a válasz függ mind a P(AMérődy — OJákkumulátora) 
Érzékelő modelltől, mind a P(Akkumulátora jlAMérő) .ap) előrejelzéstől. Ha egy nagy ér- 
zékelési hiba valószínűsége szignifikánsan kisebb, mint az Akkumulátor: j — 0-ba való 
átmenet valószínűsége, még ha ez utóbbi nagyon valószínűtlen is, akkor az 
a posteriori eloszlás nagy valószínűséget fog rendelni a lemerült akkumulátorhoz. Egy 
második nulla értékű mérési eredmény ! — 22-nél ezt a konklúziót majdnem biztossá 
teszi. Ha az átmeneti hiba aztán eltűnik, és a jelzett érték visszaáll 5-re ? — 23-tól, akkor 
az akkumulátorszint becslése gyorsan vissza fog állni 5-re, szinte varázsütésre. Ezt az 
eseménysort mutatja be a 15.12. (a) ábra felső görbéje, ami az Akkumulátor, várható ér- 
tékét mutatja idő szerint egy diszkrét Gauss-hibamodellt használva. 
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15.12. ábra. (a) Felső görbe: az Akkumidátor, várható értékének a pályagörbéje egy olyan megfigyelési 
sorozatnál, ami csak 5-ösöket tartalmaz, kivéve a 0-kat a ! — 21 és a t — 22 időpontokban, egy egyszerű 
Gauss-hibamodell felhasználásával. Alsó görbe: a pályagörbe. amikor a megfigyelések 0-val folytatód- 
nak f z 21-től. (b) Ugyanez a kísérlet az átmenetihiba-modellel elvégezve. Vegyük észre, hogy az átme- 
neti hibát jól kezeli, de a végleges hiba túlzott pesszimizmust eredményez. 


A helyreállás ellenére előfordul (t — 22-nél), hogy a robot meg van győződve, hogy 
az akkumulátora lemerült; feltehetően ekkor ki kell küldenie egy segítség jelet, és te kell 
kapcsolnia. Sajnos a túlegyszerűsített érzékelő modellje tévútra vezette. Hogyan lehet ezt 
kijavítani? Gondoljunk egy ismerős példára az emberek mindennapos vezetési gyakor- 
latából: éles kanyarokban vagy meredek hegyeken néha felvillan az , üzemanyagtartály 
üres" figyelmeztető lámpa. A segélykérő telefon keresése helyett inkább az szokott 
az ember eszébe jutni, hogy az üzemanyagmérő gyakran igen nagy hibákat ad, amikor az 
üzemanyag lötyög a tartályban. A történet tanulsága a következő: az érzékelő hibájának 
helyes kezeléséhez a rendszer érzékelő modelljének tartalmaznia kell a meghibásodás 
lehetőségét. 

Egy érzékelő legegyszerűbb hibamodellje egy bizonyos valószínűséggel megengedi, 
hogy az érzékelő teljesen helytelen értéket adjon vissza, függetlenül a világ valódi álla- 
potától. Például ha az akkumulátormérő 0-t visszaadva hibázik, azt mondhatjuk, hogy 


P(AMérő, — OJAkkumulátor, — 5) — 0.03 


ami feltételezhetően sokkal nagyobb, mint az a valószínűség, amit az egyszerű Gauss- 
hibamodell rendelne hozzá. Hívjuk ezt az átmenetihiba-modellnek (transient failure 
model). Hogyan segít ez, amikor a 0 jelzéssel kerülünk szembe? Feltételezve, hogy az 
az előre jelzett valószínűség, hogy az akkumulátor lemerült, az eddigi jelzések alapján 
sokkal kisebb, mint 0.03, akkor az AMérőx; — 0 megfigyelés legjobb magyarázata az, 
hogy az érzékelő időlegesen meghibásodott. Szemléletesen úgy képzelhetjük el a bizo- 
nyosságot az akkumulátor feltöltöttségéről, mint aminek van egy bizonyos mennyiségű 
a:tehetetlensége", ami segít úrrá lenni a mérőjelzés időleges zavarain. A 15.12. (b) ábra 
felső görbéjén látható, hogy az átmenetihiba-modell képes átmeneti hibákat kezelni a 
bizonyosság katasztrofális változásai nélkül. 

Ennyit hát az időleges zavarokról. Mi a helyzet az érzékelő állandó meghibásodásá- 
val? Sajnos, az ilyenfajta meghibásodások túlságosan is gyakoriak. Ha az érzékelő húsz 


1 
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5-ös jelzést ad, amit húsz 0-s jelzés követ, akkor az előző bekezdésben leírt átmenetihi- 
ba-modell azt fogja eredményezni, hogy a robot fokozatosan azt kezdi hinni, hogy az 
akkumulátora lemerült, amikor valójában az is lehet, hogy az érzékelő hibásodott meg. 
A 15.12. (b) ábrán látható alsó görbe mutatja a bizonyosság , pályagörbét" erre az esetre. 
A t — 25 időpontra — 5 darab 0 jelzésre — a robot meg van győződve. hogy az akkumulá- 
tora üres. Nyilvánvaló. hogy jobban szeretnénk, ha a robot azt hinné. hogy az akkumu- 
látor mérője romlott el - ha valóban ez a valószínűbb esemény. 

Nem meglepő, hogy egy tartós hiba kezeléséhez szükségünk lesz egy tartóshiba- 
modellre (persistent failure model), ami leírja, hogyan működik az érzékelő normális 
körülmények között és meghibásodás után. Ennek eléréséhez ki kell egészítenünk a rend- 
szer rejtett állapotát egy további változóval, mondjuk egy AMHibás-sal, ami megadja az 
akkumulátormérő állapotát. A hiba tartós megmaradását egy nyíllal kell modellezni, ami 
az AMHibásg-t az AMHibás,-hez kapcsolja. Ennek a megmaradási nyílnak (persistence 
arc) olyan FVT-je van, ami minden időlépésben megengedi a meghibásodást egy kis 
valószínűséggel, mondjuk 0,001-gyel, de leírja, hogy ha egy érzékelő elromlott, akkor az 
rossz is marad. Amikor az érzékelő rendben van, akkor az AMérő érzékelő modellje meg- 
egyezik az átmenetihiba-modellel; amikor az érzékelő rossz, az AMérő mindig 0, függet- 
lenül az akkumulátor aktuális töltöttségétől. 

Az akkumulátor érzékelőjének tartóshiba-modelilje a 15.13. (a) ábrán látható. A tel- 
jesítménye két adatsoron (az időleges zavarjelnél és a tartós meghibásodáson) a 15.13. 
(b) ábrán látható. Számos dolgot érdemes megfigyelni ezeken a görbéken. Először is, 
hogy az időleges zavarjelnél az érzékelő hibájának a valószínűsége jelentősen meg- 
emelkedik a második 0 jelzés után, de azonnal visszaesik, ahogy egy 5-öst megfigyelt. 
Másodszor, hogy tartós hibánál az érzékelő hibájának a valószínűsége gyorsan meg- 
emelkedik 1 közelébe, és ott marad. Végül, hogy amikortól az érzékelőt hibásnak hiszi, 
a robot csak azt tételezheti fel, hogy az akkumulátor , normális" sebességgel veszti el 
töltését, ahogy az E(Akkumulátor]...) fokozatosan csökkenő szintje ezt mutatja. 
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15.13. ábra. (a) Az érzékelő állapotváltozóját bemutató DBH-részlet. Ez a változó szükséges az akku- 
mulátormérő végleges hibájának a modellezésére. (b) Felső görbék: az Akkumulátor, vátható értékének 
a pályagörbéje az ,átmeneti hibájú" és a tartós híbájú megfigyelési sorozatoknál. Alsó görbék: az 
AMHibás valószínűségének pályagörbéi a két megfigyelési sorozatnál. 
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Eddig csupán felületesen érintettük a komplex folyamatok reprezentálásának problé- 
máját. Az állapotátmenet-modellek változatossága óriási, magában foglalva egymástól 
olyan távol eső témákat, mint például az emberi endokrin rendszer (hormonális műkö- 
dés) és az autópályákon közlekedő járművek modellezését. Az érzékelő modellezés 
egymagában is hatalmas terület, de még az olyan nehezen megfogható jelenségek, mint 
például az érzékelő elállítódása, hírtelen dekalibrálása és a külső körülményeknek (mint 
az időjárásnak) a hatásai az érzékelő jelzésein is kezelhetők explicit reprezentációkkal 
a dinamikus Bayes-hálóknál. 


Egzakt következtetés DBH-kban 


Miután felvázoltunk néhány ötletet komplex folyamatok DBH-kkal történő reprezen- 
tálásáról, most a következtetés kérdését vizsgáljuk meg. Bizonyos értelemben ezt a kér- 
dést már megválaszoltuk: a dinamikus Bayes-hálók Bayes-hálók, és nekünk már vannak 
algoritmusaink Bayes-hálóban történő következtetésre. Adott megfigyeléssorozat esetén 
a teljes Bayes-hálós reprezentáció felépíthető a szeletek megismétlésével, ameddig a há- 
ló elég nagy nem lesz a megfigyelések befogadásához, ahogy a 15.14. ábrán látható. Ezt 
a technikát kibontásnak (unrolling) nevezik. (Technikailag a DBH ekvivalens egy egy 
irányban végtelen hálóval, amit végtelen számú kibontással kapunk. Az utolsó meg- 
figyelés után hozzáadott szeleteknek nincs hatása a következtetésre a megfigyelési peri- 
ódusban, ezért elhagyhatók.) Ha a DBH-t már kibontottuk, alkalmazhatók a következte- 
tő algoritmusok: változó eliminálás. egyesítési fa módszere stb. (lásd 14. fejezet). 

Sajnos a kibontás naiv alkalmazása nem volna valami hatékony. Ha szűrést vagy 
simítást szeretnénk elvégezni megfigyelések ej., hosszú sorozatán, akkor a kibontott 
háló tárigénye 0(/) lenne, és korlát nélkül nőne, amint még több megfigyelést adnánk 
hozzá. Ráadásul ha egyszerűen újra lefuttatjuk a következtető algoritmust minden idő- 
pontban, amikor megfigyelés érkezik, a következtetési ideje frissítésenként szintén O(f) 
szerint fog növekedni. 

A 15.2. alfejezetre visszatekintve látjuk, hogy állandó idő- és tárigény elérhető a szű- 
rési frissítésnél, ha a számítások rekurzív módon végezhetők. Lényegében a szűrési 
frissítés (15.3) egyenlete az előző időponthoz tartozó állapotváltozók kiösszegzését 
(summing out) végzi el, hogy megkapja az új időponthoz tartozó eloszlást. Változók ki- 
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15.14. ábra. Egy dinamikus Bayes-háló kibontása: a szeletek ismétlődnek befogadva a megfigyelési 
sorozatot (a halvány csomópontok). További szeleteknek már nincs hatása a megfigyelési perióduson 
belüli következtetésre. Ha a DBH-t kibontottik, bármely következtetési algoritmus használható — válto- 
ző eliminálás. egyesítési fa módszerek és így tovább -, ami a 14. fejezetben szerepel. 
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összegzése pedig pontosan az, amit a változóeliminálás (variable elimination) algorit- 
musa elvégez (lásd 14.10. ábra), és megmutatható, hogy a változó eliminálás időrendi vál- 
tozókon futva pontosan a szűrés rekurzív frissítésének (15.3) egyenlet szerinti működését 
utánozza. A módosított algoritmus egyszerre legfeljebb két szeletet tart a memóriában: 
kezdve a 0. szelettel, hozzáadjuk az 1. szeletet, kiösszegezzük a 0. szeletet, aztán hozzá- 
adjuk a 2. szeletet, aztán kiösszegezzük az 1. szeletet és így tovább. Ezzel a módszerrel 
elérhető az állandó idő- és tárigény a szűrési frissítésnél. (Ugyanez a teljesítmény elér- 
hető az egyesítési fa algoritmusának megfelelő módosításaival.) A 15.10. feladat kéri 
ennek a ténynek az ellenőrzését az esernyős hálóra. 

Eddig tartottak a jó hírek, most következnek a rosszak: megmutatható, hogy egy frissí- 
tés idő- és tárkomplexitásának az , állandója" majdnem minden esetben exponenciális az 
állapotváltozók számában. Az történik ugyanis, hogy amint a változó eliminálás halad, 
a tényezők megnőnek, magukban foglalva az összes állapotváltozót (vagy pontosabban 
azokat az állapotváltozókat, amelyeknek van szülőjük az előző időszeletben). A maximá- 
lis tényezőméret O(d""!), a frissítés költsége pedig O(d""?). 

Természetesen ez sokkal kevesebb, mint az RMM frissítésének költsége, ami 04"), 
de nagyszámú változónál még mindig kivitelezhetetlenül nagy. Ezt a súlyos tényt nehéz 
elfogadni. Ugyanis a következőt jelenti: annak ellenére, hogy a DBH-k felhasználhatók 
olyan nagyon komplex időbeli folyamatok reprezentálására, amelyek számos, ritkán 
összekapcsolt változóval rendelkeznek, nem vagyunk képesek hatékonyan és pontosan 
következtetni ezekről a folyamatokról. A DBH-modell, ami az összes változó feletti 
a priori együttes eloszlást reprezentálja, faktorizálható az őt alkotó FVT-kre, de az a pos- 
teriori együttes eloszlás a megfigyelési szekvencián vett feltétellel — azaz az előre üzenet 
- általában már nem faktorizálható. Eddig senki sem talált megoldást erre a problémára, 
annak ellenére, hogy megoldást a tudomány és mérnöki tervezés fontos területei tudnák 
nagyon jól hasznosítani. Így közelítő módszerekre kell szorítkoznunk. 


Közelítő következtetés DBH-kban 


ra) és a Markov lánc Monte Carlo módszert (MCMC, lásd 14.15. ábra). A kettő közül 
az első igazítható legkönnyebben a DBH-keretbe. Látni fogjuk azonban, hogy egy gya- 
korlati módszer kialakulásához a standard valószínűségi súlyozó algoritmuson számos 
javításra van szükség. 

Emlékezzünk vissza, hogy a valószínűségi súlyozás a működése során a nem bizonyí- 
tékváltozókat mintavételezi azok topológiai sorrendjében. minden mintát azzal a valószí- 
nűséggel súlyozva, amennyire egyezik a megfigyelt bizonyítékváltozókkal. Ahogyan 
mazhatnánk egy kibontott DBH-ra, de ugyanazok a problémák jelentkeznének, neveze- 
tesen, hogy a megfigyeléssorozat növekedésével a frissítésenkénti idő- és tárigény növe- 
kedne. A probléma az, hogy az alapalgoritmus az egyes mintákat egymás után sorban 
végigfuttatja a háló teljes hosszában. Ehelyett egyszerűen az összes N mintát együtt fut- 
tathatnánk a DBH-n keresztül, szeletenként egyszerre haladva. (Azaz a mintavételeket 
az újragenerálás költségének elkerülése miatt nyilvántartanánk és fokozatosan 
frissítenénk — a ford.) A módosított algoritmus illeszkedik a szűrési algoritmus általá- 
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nos mintájához, az N mintával mint előrefelé üzenettel. Az első kulcsgondolat az, hogy 
ekkor a mintákat magukat használjuk az állapoteloszlás egy közelítő reprezentáció- 
Jjaként. Ez eleget tesz a frissítésenkénti , állandó" időigénynek, bár az állandó értéke 
a minták számától függ, aminek elég nagynak kell lenni a valódi a posteriori eloszlás 
elfogadható közelítéséhez. Szintén nincs szükség a DBH kibontására, mivel csak az 
aktuális és a következő szeletet kell memóriában tartani. 

A valószínűségi súlyozás tárgyalásakor a 14. fejezetben rámutattunk, hogy az algo- 
ritmus pontossága leromlik, ha a bizonyítékváltozók ,lentebbiek" a mintavételezett 
változóknál, mivel ekkor a minták generálására nincsen hatással a bizonyíték. Egy 
DBH tipikus struktúráját megnézve — mondjuk az esernyős DBH-t a 15.14. ábrán — lát- 
juk. hogy a korai állapotváltozók mintavételezésénél valóban nem hasznosulnak a későb- 
bi bizonyítékok. Valójában, még tüzetesebben megnézve azt láthatjuk, hogy az állapot- 
változók egyikének sincs egyetlen bizonyítékváltozó sem az ősei között! Így, bár az egyes 
minták súlya függeni fog a bizonyítékoktól, a generált minták aktuális halmaza teljesen 
független lesz a bizonyítékoktól. Például még ha a főnök mindennap el is hozza az es- 
ernyőjét, a mintavételi folyamat ekkor is hallucinálhat véget nem érő kánikulát. A gya- 
korlatban ez azt jelenti, hogy a minták azon aránya, ami elfogadhatóan közel marad az 
események valódi sorához, exponenciálisan csökken 7-vel, a megfigyelés sorozat hosz- 
szával; máshogy fogalmazva egy adott pontossági szint fenntartásához, a minták számát 
exponenciálisan növelni kell " függvényében. Mivel egy valós időben működő szűrő 
algoritmus csak rögzített számú mintát tud használni, a gyakorlatban az történik, hogy 
igen kis számú frissítési lépés után a hiba határtalanul megnő. 

Világos, hogy jobb megoldásra van szükségünk. A második kulcsgondolat az, hogy 
a minták halmazát az állapottér nagy valószínűségű részeire koncentráljuk. Ez megte- 
hető a megfigyelések szerint nagyon alacsony súlyú minták eldobásával, miközben 
megsokszorozzuk a nagy súlyúakat. Ezen a módon a minták populációja elfogadha- 
tóan közel marad a valósághoz. Ha úgy gondolunk a mintákra, mint egy eszközre az 
a posteriori eloszlás modellezéséhez, akkor van értelme több mintát használni az álla- 
pottér azon részeiben, ahol az a posteriori valószínűség nagyobb. 

Az algoritmusok egy családját, a részecskeszűrést (particle filtering) pontosan 
ennek elvégzésére tervezték. A részecskeszűrés a következőképpen működik: először 
egy N mintájú populációt alkotunk a 0. időpontbeli P(Xg) a priori eloszlás mintavétele- 
zéséből. Ezután minden időpontban egy frissítési ciklus ismétlődik: 





" Minden mintát előreterjesztünk mintavételezve az X,, y következő állapot értéket felté- 
ve, hogy a minta aktuális értéke x, adott, és felhasználva a P(X, , jIx,) állapotátmenet- 
modellt. 

s" Minden mintát súlyozunk azzal a P(e,, 1Ix,.1) valószínűséggel, amit az új bizonyí- 
tékhoz rendel. 

" A populációt újra mintavételezzük, hogy egy N mintájú új populációt generáljunk. 
Minden új mintát a jelenlegi populációból választunk ki; egy konkrét minta kivá- 
lasztásának a valószínűsége arányos a súlyával. Az új minták súlyozatlanok. 


Az algoritmus részletesen a 15.15. ábrán látható, és működését az esernyős DBH ese- 
tén a 15.16. ábra szemlélteti. 

Megmutatjuk, hogy ez az algoritmus konzisztens — így helyes valószínűségeket ad, 
ahogy N a végtelenbe tart — meggondolva, hogy mi történik egy frissítési ciklus alatt. 


"81 
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function RÉSZECSKE-SZŰRÉS (e. N. db) returns egy mintahalmaz a következő időpontra 
inputs: e, az új beérkező bizonyíték 
N: a fenntartani kívánt mintaszám 
dbh: egy DBH egy P(Xg) a priori eloszlással, P(XIXg) állapotátmenet-modellel és 
P(EjIXI) érzékelő modellel 
static: S, a minták egy N méretű vektora, kezdetben P(Xo)-ból generált 
local variables: W, a súlyok egy N méretű vektora 





fori — 1 toN do 
SA — sorsolt minta P(XIXg — S[/1)-ből 
WIil — PtelX, — ST) 
§§ €— SÚLYOZOTT-MINTA-VISSZATÉTELLEL(N. 5. W 
return § 











15.15. ábra, A részecskeszűrés algoritmus megvalósítása egy rekurzív frissítési művelettel és állapottal 
(ami a minták halmaza). A mintavételező lépések mindegyike az aktuális szelet változóinak a mintavé- 
telezését jelenti egy topológiai sorrendben. hasonlóan. mint a PRIOR-MINTA-ban. A SÚLYOZOTT-MINTA- 
VISSZATÉTELLEL művelet megvalósítható O(N) várható futási idővel. 





Feltesszük, hogy a mintapopuláció a t időpontbeli f, ., előre üzenet egy helyes reprezen- 
tációjaként indul. Az N(x.le,.) jelölést használva azon minták számára, amelyek az e ,, 
megfigyelések feldolgozása után az x, állapotban vannak, azt kapjuk, hogy 


NCxle1.)/N — Pcxle1:) (15.20 


nagy N-ekre. Most minden mintát előreterjesztünk mintavételezve az állapotváltozókat 
at 1 időponban az adott t időponthoz tartozó mintabeli értékek mellett. Az egyes x, 
állapotokból az x,.4 állapotot elérő minták száma az átmenet-valószínűség és az x, 
populáció számának a szorzata; így az x,,a állapotot elérő minták teljes száma 


Néxyalep) PCxalxJNxe,.) 
osi 


ESŐ 14 





(a)  Továbbterjesztés (b) Súlyozás (c) Mintavétel 


15.16. ábra. A részecskeszűrés frissítési ciklusa az esernyő DBH-nál WV — 10 esetén. bemutatva minden 
egyes állapot mintapopulációját. (a) A r időpontban 8 minta jelez Eső-t és 2 -Eső-t. Mindegyiket tovább- 
terjesztjük a következő állapotátmenet-modell szerinti mintavételezésével. A : 4 ) időpontban 6 minta 
jelez Eső-t és 4 -Eső-t. (b) A 1 4 1 időpontban -Esernyő a megfigyelés értéke, Mindegyik mintát súlyo- 
zzuk a mintának a megfigyelésre vett feltételes valószínűségével, amit a körök nagysága jelez. (c) Egy 
új 10-es mintahalmaz generálódott az aktuális halmazból történő súlyozott sorsolással, 2 olyan mintát 
eredményezve, ami Eső-t jelez, és 8 olyat, ami -Eső-t. 
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Most minden egyes mintát súlyozunk a : -t 1 időpontbeli bizonyíték valószínűségével. 
Egy X.41 állapotban lévő minta P(e,,1Ix.41) súlyt kap. Az x,,4 állapotban lévő minták 
teljes súlya az e, , , megfigyelése után ezért 


WG eletre — Per NCs Jer: 


jön. Mivel minden egyes minta a súlyával arányos valószí- 
nűséggel ismétlődik, az újramintavételezés után az X,, , állapotban lévő minták száma 
arányos az Xx.4y állapotban lévő minták teljes súlyával az újramintavételezés előtt: 


NCxyyaler:r D/A 7 eWűxyyalei1) 
— aPCerya XDA ale1: 
7 aPtegalx122 PxalxoNésles:) 


x, 
— aNPtegalx1 2 PO Pesze) (15.21. miatt) 





ki 
— a Pteike PCzixPPtxle1 
Ax 
7 P(xyyile1r41) (15.3 miatt) 


Azaz a mintapopuláció egy frissítési ciklus után helyesen reprezentálja a f 4 1 időpont- 
beli előrefelé üzenetet. 

A részecskeszűrés így konzisztens, de hatékony-e? A gyakorlat azt mutatja, hogy 
a válasz igen: a részecskeszűrés, úgy tűnik, az igazi a posteriori eloszlás egy jó közelíté- 
sét tartja fenn állandó számú mintát használva. Azonban jelenleg nincs elméleti garancia; 
a részecskeszűrés jelenleg aktívan kutatott terület. Számos javítást és változatot javasol- 
tak, és az alkalmazások köre is egyre bővül. Mivel ez egy mintavételező algoritmus, 
A részecskeszűrés könnyen felhasználható hibrid és folytonos DBH-kban, lehetővé téve 
az alkalmazását akár olyan területeken is, mint komplex mintázatok követése videofel- 
vételben (Isard és Blake, 1996) és tőzsdei előrejelzés (de Freitas és társai, 2000). 
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Ebben az alfejezetben az időbeli valószínűségi modellek egyik legfontosabb alkalma- 
zását, a beszédfelismerést (speech recognition) tekintjük át. A feladat egy beszélő ál- 
tal elmondott szósorozat azonosítása az adott akusztikus jelből. A beszéd az emberek 
közötti kommunikációnak a domináns modalitása, és a megbízható számítógépes 
beszédfelismerés felmérhetetlenül fontos lenne. Még ennél is hasznosabb volna a beszéd- 
megértés (speech understanding) — az elhangzott beszéd jelentésének a meghatározása. 
Ennek tárgyalására a 22. fejezetig kell várnunk. 

A beszéd jelenti az első találkozásunkat a valódi érzékelők szolgáltatta adatok nyers, 
tisztítatlan világával. Ezek az adatok zajosak, a szó szoros értelmében: a zaj lehet 
háttérzaj és lehet a digitalizálási folyamat okozta melléktermék; eltérések lehetnek a 
szavak kiejtési módjában még ugyanannál a beszélőnél is; különböző szavak hangzása 
ugyanaz lehet és így tovább. Ezen okok miatt a beszédfelismerésre mint valószínűségi 
következtetési problémára kezdtek el tekinteni. 
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A legáltalánosabb szinten a valószínűségi következtetési problémát a következőkép- 
pen definiálhatjuk. Legyen a Szavak egy valószínűségi változó az összes lehetséges 
szószekvencia felett, ami elhangozhat, és legyen a je! a megfigyelt akusztikusjel-szek- 
vencia. Ekkor az elhangzottak legvalószínűbb értelmezése a Szavak azon értéke, ami 
maximalizálja a P(szavakljel) értéket. Amint az gyakori eset, a Bayes-szabály alkalma- 
zása hasznos: 


P(szavakljel) — aP(jellszavak) P(szavak) 


A P(jellszavak) alkotják az ún. akusztikai modellt (acoustic model). Ez írja le a sza- 
vak hangzását — a , ceiling (mennyezet)" egy lágy ,.c"-vel kezdődik és ugyanúgy hang- 
zik, mint a , sealing (pecsételés/tömítés/fókavadászat)". (Az azonos hangzású szavakat 
homofon (homophone) szavaknak nevezzük.) A P(szavak) értékei képezik az ún. 
nyelvi modellt (language model). Ez adja meg az a priori valószínűségét minden egyes 
kijelentésnek — például hogy a , magas mennyezet (high ceiling)" sokkal valószínűbb 
szókapcsolat, mint a , magas pecsételés (high sealing)". 

A beszédfelismerő rendszerekben használt nyelvi modellek gyakran igen egysze- 
rűek. A fejezetben később leírt bigram (bigram) modell minden lehetséges esetre 
megadja annak a valószínűségét, hogy egy szó egy másik szót követ. Az akusztikai 
model! sokkal bonyolultabb. Az alapjait egy fontos felfedezés alkotja a fonológia 
(phonology) (a nyelvi hangok tanulmányozása) területéről, nevezetesen, hogy az em- 
beriség minden nyelve egy 40-50 hangból álló korlátos választékkal él, amelyeket 
beszédhangoknak (phones) hívunk. Egy beszédhang nagyjából az a hang, amely egy 
egyedi mással- vagy magánhangzónak felel meg. A helyzetet komplikálja valame- 
lyest, hogy az olyan betűkombinációk, mint ,th" vagy ,ng" egyedi beszédhangot 
eredményeznek, viszont egyes betűk többféle beszédhanghoz vezetnek, a környeze- 
tüktől függően (például az , a" betű a , rat" és a , rate" szóban). Az angol nyelv összes 
beszédhangja, példákkal együtt, a 15.17. ábrán látható. A fonéma (phoneme) a leg- 
kisebb hangi egység, ami önálló jelentéssel bír egy adott nyelv használói számára. 
Például az angolban a ,t" beszédhang a ,.stick" szóban ugyanaz a fonéma, mint a ,€" 
beszédhang a , tick" szóban, de a thai nyelvben ezek megkülönböztethetők, mint két 
különböző fonéma. 

A beszédhangok létezése lehetővé teszi az akusztikai modell két részre bontását. 
Az első rész a kiejtést (pronunciation) kezeli, és minden egyes szóra megad egy 
valószínűség-eloszlást az összes lehetséges beszédhangsor felett. Például a ,.ceiling" 
szó kiejtése (s iy 1 ih ng], vagy néha (s iy 1 ix ng], vagy esetleg [s íy 1 en]. A beszéd- 
hangok közvetlenül nem megfigyelhetők, így nagyjából a beszéd egy olyan rejtett 
Markov-modellel reprezentálható, aminek X, állapotváltozója a t időpontban kimondott 
beszédhang. 

Az akusztikai modell második része a beszédhangok akusztikus jelként való meg- 
valósulási módjával foglalkozik: azaz a rejtett Markov-modell E, bizonyítékváltozó- 
ja adja meg az akusztikus jel ! időpontban megfigyelt jellemzőit, és az akusztikus 
modell adja meg az P(E]X,) feltételes valószínűséget, ahol X, az aktuális beszédhang. 
A modellnek lehetőséget kell adni eltérésekre a hangmagasságban, a sebességben és 
a hangerőben, és jelfeldolgozási (signal processing) technikákon alapul, hogy olyan 
jelreprezentációt biztosítson, ami megfelelően robusztus módon kezeli ezeket a fajta 
eltéréseket. 
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Magánhangzók B-N mássalhangzók P-Z mássalhangzók 
Beszédhang Példa ] Beszédhang Példa  ! Beszédhang Példa 
(iy) beat (61 bel (pl pet 

(in) bit (ch) Chet  f [r] rat 

[ey] bet [61] debt (51 set 

[ae] bat rag fat Csh shoe 
Tahi but (el get júl ten 

(80) bought [bh] hat [eh] tick 
[ow) bogt (hv] high [db] that 
fuh] book ] Ghi jet lax] butter 
[ey] bait (ki kick (v1 get 

(er] Bert u kt Wwi wet 

[az] buy Tel bottle] [wh] which 
(oyi boy (m) met bi yet 
Taxr] diner lem] bottom ( [7] 200 
[aw] down ] [n] net (zh] measure 
(ax] about ten) button 

fix) roses ] (nel sing 

[aa] cot fengl "Wwashing] (-1 (Szünet) 








15.17. ábra. A DARPA fonetikus ábécé, avagy ARPAbet, amely az amerikai angolban használt beszéd- 
hangokat sorolja fel. Számos alternatív felírás létezik, köztük az International Phonetic Alphabet (IPA), 
mely az összes ismert nyelv beszédhangját tartalmazza. 


A fejezet hátralevő része a modelleket és az algoritmusokat írja le lentről felfelé ha- 
ladva, az akusztikus jelekkel és a beszédhangokkal kezdve, majd az egyedi szavakkal 
és végül teljes sorozatokkal folytatva. Befejezésül áttekintjük, hogy ezek a modellek 
hogyan taníthatók, és mennyire működik jól a kapott rendszer. 


Beszédhangok 


A hanghullámok olyan periodikus nyomásváltozások, amelyek a levegőben terjednek. 
A hang egy mikrofonnal mérhető, aminek membránját elmozdítja a nyomásváltozás, és 
egy folytonosan változó áramot generál. Az áramerősséget — ami a hanghullám ampli- 
túdójához tartozik — egy analóg-digitális konverter méri diszkrét időintervallumonként 
a mintavételi frekvencia (sampling rate) szerint. Beszéd esetén a tipikus mintavételi 
frekvencia 8 és 16 kHz (azaz 8000-től 16 000-ig másodpercenként) között van. (Jó mi- 
nőségű zenei felvételeket mintavételeznek 44 kHz vagy még magasabb frekvenciával.) 
A mérés pontosságát az egyes mintavételi pontokban a kvantálási tényező 
(guantization factor) határozza meg; a beszédfelismerők tipikusan 8-12 bitet használ- 
nak. Ez azt jelenti, hogy a legkevésbé igényes rendszer, amely 8 kHz-es frekvenciával 
mintavételez, és 8 bites kvantálást használ, közel fél megabájtot igényel egy egyperces 
beszéd tárolásához. Ilyen nagy mennyiségű jelinformáció esetén kivitelezhetetlen létre- 
hozni és használni a P(jellbeszédhang) eloszlásokat, így az akusztikus jelnek tömörebb 
leírásait kell kifejlesztenünk. 

Elsőként azt vesszük figyelembe, hogy bár a beszédben a hangfrekvencia akár több 
kHz-es is lehet, a jel tartalmának a megváltozásai sokkal ritkábban fordulnak elő, talán 
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nem több mint 100 Hz-cel. Ezért a beszédrendszerek a jel tulajdonságait hosszabb idő- 
intervallumonként, úgynevezett keretenként (frames) összegzik. Egy 10 ms-os (80 
minta 8 kHz-es mintavétel mellett) keret elég rövidnek tűnik ahhoz, hogy csak néhány 
rövid idejű jelenség mosódjon el az összegzési folyamat miatt. Az egyes kereteken be- 
lüli folyamatot egy jellemző (feature) vektorral ábrázoljuk. Például jellemezni akarjuk 
az energia szintjét számos frekvenciasáv mindegyikében. Más fontos jellemzők a keret 
globális energiaszintje és a megelőző kerettől számított (energiajkülönbség. A jellem- 
zők kiemelése a beszédjelből hasonlít egy kicsit arra, ahogy a zenekar játékát figyelve 
megjegyezzük: , Most a vadászkürtök hangosan és a hegedűk halkan szólnak." A 15.18. 
ábrán láthatjuk az átalakítás lépéseit a nyers hangtól a keretek sorozatáig. Figyeljük 
meg, hogy a keretek átlapolódnak; ez megvéd minket attól, hogy pont a keret határán 
fellépő fontos akusztikus események információját elveszítsük. 

A példánkban csupán három jeggyel rendelkező keretet mutattunk. Valós rendszerek 
jellemzők tucatjaival vagy akár százaival dolgoznak. Például n darab jellemző esetén, 
amikor mindegyik 256 lehetséges értéket vehet fel, egy keret egy ponttal adható meg 
egy -dimenziós térben, és 256" lehetséges keret létezik. n 5 2 esetén kivitelezhetetlen 
volna a P(jellemzőklbeszédhang) eloszlásnak egy explicit táblázatként történő ábrázo- 
lása, így további tömörítésre van szükségünk. Két lehetséges megközelítés létezik: 


. A vektorkvantálás (VK) (vector guantization, VO) módszere felosztja az n di- 
menziós teret mondjuk 256 partícióra, C1-től C256-ig címkézve. Ekkor az egyes 
kereteket inkább egy egyedi címkével, mint egy n számból álló vektorral lehet jelle- 
mezni. Így a P(VOlbeszédhang) eloszlás táblázatos formája 256 valószínűséget 
tartalmaz minden egyes beszédhangra. Nagy rendszerekben a vektorkvantálás már 
nem népszerű. 

s A jellemzők terének diszkretizálása helyett parametrikus folytonos eloszlásokat 
használhatunk a P(jeltemzőklbeszédhang) leírásához. Például használhatunk min- 
den beszédhanghoz egy Gauss-eloszlást, beszédhangonként különböző átlaggal 
és kovarianciamátrixszal. Ez jól működik, ha az egyes beszédhangok akusztikus 
megvalósulása a jellemzők terében egyetlen területen csoportosul. A gyakorlatban 
egy hanghoz több területen való csoportosulás is tartozik, és Gauss-eloszlások 
keverékét (mixture of Gaussians) kell használni. Egy keverék k egyedi eloszlás 
súlyozott összege, így a P(jellemzőklbeszédhang) eloszláshoz k súly, k n elemű 


Analóg akusztikus jel: 


Mintavételes, kvantált 
digitális jel: 


10 15 38 ABN, FA 2 73 


Keretek jellemzőkkel: TTEJ TÜTTT 


15.18. ábra. Az akusztikus jel átalakítása keretek sorozatává; mindegyik keretet három akusztikus jellem- 
zővel írunk le 
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átlagvektor és k n? méretű kovarianciamátrix tartozik, ami O(i kn) paraméter min- 
den beszédhangra. 


Természetesen bizonyos információ elvész a feldolgozás során, ami a teljes beszédjel- 
től egy VK címkéig vagy a keverékparaméterek egy halmazáig tart. A jelfeldolgozás 
művészete abban rejlik, hogy úgy válasszuk meg a jellemzőket és a tartományokat 
(vagy a Gauss-eloszlásokat), hogy a hasznos információ vesztesége minimális legyen. 
Egy adott beszédhang számos módon kiejthető: hangosan vagy halkan, gyorsan vagy 
lassan, magasan vagy mély hangon, csendben vagy háttérzajban és beszélők sok millió- 
ja által, mindegyikőjük különböző kiejtésével és eltérő hangképző szerveivel. 

Még két további finomítást kell elvégeznünk az eddig leírt egyszerű modellen. Az el- 
ső a beszédhangok időbeli szerkezetével foglalkozik. Normális beszédben a legtöbb be- 
szédhangnak a terjedelme 50-100 ezredmásodperc vagy 5-10 keret. A P(jellemzőklbe- 
szédhang) valószínűségi modell ugyanaz ezen keretek mindegyikére, pedig a legtöbb 
beszédhangnak jelentős belső struktúrája van. Például a [t] egyike a zárhangoknak 
(stop consonants), amelyekben a levegő áramlása megszűnik egy rövid időre egy ha- 
tározott kibocsátás előtt. Az akusztikus jelet megvizsgálva azt látjuk, hogy egy [t]-nek 
a kezdete hangtalan, közepén egy kis kirobbanással és (általában) egy sziszegéssel 
a végén. A beszédhangoknak ez a belső struktúrája egy háromállapotú modellel ragad- 
ható meg; minden beszédhangnak van egy kezdeti, közép- és végállapota, és minden 
állapotnak megvan a saját eloszlása a jegyek felett. 

A második finomítás azzal a környezettel foglalkozik, amelyben a beszédhang 
elhangzik. Egy adott beszédhang hangzását megváltoztathatják a környező beszéd- 
hangok." Emlékezzünk arra, hogy a beszédhangok az ajkak, a nyelv és az álkapocs 
mozgása és a levegőnek a hangképző szerveken történő kényszerített átáramlása révén 
keletkezik. Ezen komplex mozgások koordinálásánál, amik másodpercenként öt vagy 
még több beszédhangot produkálnak, az agy már akkor elindít a második beszédhang- 
hoz tartozó műveletet, mielőtt az első befejeződött volna, így megváltoztatva az egyik 
vagy mindkét beszédhangot. Például a , sweet (édes)" kiejtésénél az ajkak kerekítettek 
az [s] előállítása közben számítva a következő (w]-re. Ezeket a koartikulációs hatá- 
sokat (coarticulation effects) részlegesen megragadja a hármashangzó (triphone) 
modell, amelyben az egyes beszédhangok akusztikai modellje függhet az előző és kö- 
vetkező beszédhangtól. Így a [w)] a , sweet"-ben úgy írható, hogy (w(s,iy)], azaz [w] egy 
(5) bal- és egy [iy] jobb-környezetben. 

A háromállapotú és hármashangzó modellek együttes hatása megnöveli az időbeli fo- 
lyamat lehetséges állapotainak a számát az eredeti beszédhang készletbeli n beszédhang- 
ról 313-ra (az ARPAbet-ben n sz 50). A tapasztalatok azt mutatják, hogy a megnövelt 
pontosság bőven ellensúlyozza a következtetés és a tanulás megnövekedett költségeit. 


§ A duális probléma - a beszélőazonosítás (speaker identification) pontosan ennek fordítottja, a közös 
elemeket hagyja el, és az egyéni különbségeket tartja meg, majd megpróbálja a különbségeket az egyéni 
beszédmodellekhez illeszteni. 

Ebben az értelemben a beszéd .beszédhangmodelljét" inkább hasznos közelítésnek kell tekinteni, és 
nem megváltoztathatatlan törvénynek. 
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Minden egyes szóra gondolhatunk úgy, mint ami meghatároz egy külön P(X/.,]szó) 
valószínűségi eloszlást, ahol X; megadja az í-edik keretben a beszédhang állapotát. Tipi- 
kusan ezt az eloszlást két részre osztjuk. A kiejtési modell (pronunication model) egy 
eloszlást ad meg a beszédhangsorok felett (figyelmen kívül hagyva az ütemet és a kerete- 
ket), majd a beszédhangmodell (phone model) leírja, ahogyan a beszédhangok lekép- 
ződnek a keretek szekvenciájára. 

Gondoljunk arra a szóra, hogy , tomato (paradicsom)". Gershwin szerint ezt úgy ejtik 
ki, hogy [t ow m ey t ow] (Gershwin, 1937), én viszont úgy ejtem, hogy [t ow m aa t owl. 
A 15.19. ábra felső részén látható egy olyan állapotátmenet-modell, ami gondoskodik 
erről a változatról. A modellen keresztül csak két út létezik, egy, ami a [t ow m ey t ow] 
beszédhang szekvenciához tartozik, és a másik a [t ow m aa t ow] szekvenciához. Egy 
út valószínűsége az útvonalat alkotó nyilakon szereplő valószínűségek szorzata: 


P((towmeyrowl], tomato") — P(Itowmaatowl!, tomato") — 0,5 


A fonetikai változékonyság második forrása a koartikuláció (coarticulation). Például a 
[t] beszédhangnál a nyelv a szájpadlásnál helyezkedik el, az [ow]-nál viszont a száj alján. 
Gyors beszédnél a nyelv sokszor közbülső pozícióba kerül, melynek eredménye inkább 
a [t ah], és nem a (t ow)]. A 15.19. ábra alsó része a , tomato" kiejtésének egy bonyolul- 
tabb modelljét mutatja, amely ezt a koartikulációs hatást figyelembe veszi. Ebben a mo- 
dellben négy különböző út van, és azt kapjuk, hogy: 


P((towmeytowl], tomato") — P([towmaatow)]], tomato") — 0,1 
P((tahmeytowl], 10mato") — P(Irahmaatowl]], tomato") — 04 


Hasonló modelleket lehetne konstruálni minden felismerni kívánt szóhoz. 

A báromállapotú beszédhangmodell állapotátmenet-diagramja a 15.20. ábrán látható. 
A modell egy konkrét beszédhanghoz tartozik, az (m]-hez, de az összes beszédhangnak 
hasonló topológiájú modellje van. Az ábrán láthatók az egyes beszédhang állapotokhoz 
kapcsolódó akusztikai modellek is, feltételezve, hogy a jelet egy VK címke reprezen- 
tálja. Például a modell szerint P(E, — CIX, — (mlkezde) — 0.5. Vegyük észre a hur- 
kokat az ábrán; például az (migözép állapot 0.9 valószínűséggel fennmarad, ami azt 
jelenti, hogy az [ml ze ép állapot várható időtartama 10 keret. A modellünkben az 
egyes beszédhangok hossza független a többi beszédhang hosszától; egy kifinomul- 
tabb modell képes lenne a gyors és lassú beszédet megkülönböztetni. 

Hasonló modelleket hozhatunk létre minden egyes beszédhangra, akár a hármashangzó 
környezet hatását is figyelembe véve. Minden szómodell, amikor a beszédhangmodellek- 
kel kombináljuk, egy RMM teljes specifikációját adja. A modell megadja a beszédhang 
állapotok közötti, keretről keretre történő átmeneteknek a valószínűségeit csakúgy, mint 
az akusztikus jegyek valószínűségeit minden egyes beszédhang állapothoz. 

Ha egyedülálló szavakat (isolated words) szeretnénk felismerni — azaz egyértelmű 
határokkal rendelkező és mindennemű környezeti összefüggés nélkül kiejtett szavakat -, 
akkor azt a szót kell megkeresnünk, amelyik maximalizálja azt, hogy 


Piszóles.) — aP(ep.Iszó)P(szó) 
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(a) Nyelvjárásbeli különbséget tekintetbe vevő modell: 











15.19. ábra, A ,tomato" szó két kiejtési modellje. Mindegyik modellt egy átmenetdiagramként ábrázoljuk, 
amiben az állapotokat körrel jelöljük, a megengedett átmeneteket pedig nyilakkal, rajtuk a kapcsolódó va- 
lószínűségekkel. (a) Egy nyelvjárásbeli különbségeket is tekintetbe vevő modell. A 0.5-ös értékek a két 
szerző preferált kiejtésein alapuló becslések. (b) Egy olyan modell, ami az első magánhangzón egy 
koartikulációs hatást is figyelembe vesz, megengedve az [ow] vagy az lah] beszédhangokat. 


Beszédhang RMM (ml-re: 





A kimenetelek valószínűségei a beszédhang RMM-ben: 


Kezdet: — Közép: Vég: 

CI-05 — CyO2 CO 
CX02 CGO7  C£05 
Cz:0.3 Cs: 0.1 C7:04 











15.20. ábra. Az [m] háromállapotú beszédhang egy RMM-je. Mindegyik állapotnak számos lehetséges 
kimenetele lehet, különálló valószínűségekkel. A C4, ..., Cj VK-címkék önkényesen lettek megválasztva. 


A P(szó) a priori valószínűség valódi szöveges adatból kapható meg. A P(e,.,szó) pe- 
dig az akusztikus jegyek sorozatának a valószínűsége a szómodell szerint. Ilyen 
valószínűségek kiszámítását a 15.2. alfejezet tárgyalta; nevezetesen a (15.15) egyenlet 
egy egyszerű rekurzív számítást definiál, lineáris költséggel 1-ben és a Markov-lánc 
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állapotainak számában. A legvalószínűbb szó megtalálásánál ezt a számítást minden 
lehetséges szóra elvégezhetjük, megszorozzuk az a priori valószínűséggel, és e szerint 
választjuk ki a legjobb szót. 


Mondatok 


Az emberi kommunikációban való részvételhez egy gépnek a folytonos beszédet 
(continuous speech) kell felismemie, és nem pusztán egyedülálló szavakat. Azt gondol- 
hatnánk, hogy a folytonos beszéd nem több, mint szavak sorozata, amelyek mindegyikére 
alkalmazhatjuk az algoritmust az előző fejezetből. Ez a megközelítés két ok miatt is 
bukásra van ítélve. Először is, már láttuk (a 638. oldalon), hogy a legvalószínűbb szavak 
sorozata nem a legvalószínűbb együttes szósorozat. Például a Take the Money and Run 
(Fogd a pénzt és fuss) c. filmben a banki alkalmazott félreérti Woody Allen irkafirka 
bankrablási üzenetét, és azt , I have a gub (Nálam van a slukker) "-nak olvassa (az ..I have 
a gun, vagyis , Nálam van a stukker" helyett — a ford.). Egy jobb nyelvi modell az ,,( have 
a gun"-t javasolná, mint aminek sokkal nagyobb a valószínűsége, még ha a legutolsó szó 
inkább ,.gub"-nak és nem ,.gun"-nak olvasható. A második probléma, amivel folytonos 
beszéd esetén szembesülnünk kell, a szegmentálás (segmentation) — annak az eldöntése, 
hogy hol van egy szónak a vége, és hol kezdődik a következő. Mindenki, aki megkísérelt 
egy idegen nyelvet megtanulni, méltányolni fogja a probléma nehézségét: először úgy 
tűnik, hogy a beszédben a szavak egybefolynak, majd fokozatosan tanulunk meg egyedi 
szavakat kiemelni a hangok egyvelegéből. Ebben az esetben az első benyomás korrekt; 
a spektrográfiai elemzés azt mutatja, hogy a folyamatos beszédben a szavak tényleg szü- 
netek nélkül követik egymást. A szavak határait annak ellenére tanuljuk meg megkülön- 
böztetni, hogy a szavakat nem választják szét csendszakaszok. 

Kezdjük a nyelvi modellel, aminek a beszédfelismerésben az a feladata, hogy való- 
színűséget rendeljen minden egyes szósorozathoz. Legyen wy ... w, az n szóból álló 
szósorozat, és legyen w; 8. szósorozat /-edik szava, akkor a szósorozat-valószínűséget 
az alábbi módon írhatjuk:8 


Pl...) — Poe Ptw2 IwPászlhpv2).. Pew he ..w1) — 
—- [72 Pow.) 


Ezen kifejezések többsége igen bonyolult és nehezen becsülhető vagy számítható. 
Szerencsére a képletet egyszerűbb kifejezéssel is közelíthetjük, miközben a nyelvi 
model! zömét mégis megragadjuk. Az egyik egyszerű, közkedvelt és hatékony eljárás 
a bigram (bigram) modell. Ez a modell a P(wilw,... w, 1)-et a P(wilw; ))-gyel közelí- 
ti. Más szóval, feltételezi, hogy a szósorozatokra teljesül az elsőrendű Markov-feltétel. 

A bigram modell nagy előnye, hogy a modell egyszerűen tanítható az egyes szópárok 
megszámolásával szósorozatok egy reprezentatív korpuszában és a valószínűségek 
ezen számok alapján történő megbecslésével. Így például, ha az , a" a mintakorpuszban 


§ valóban jobb lenne, ha minden valószínűséget egy adott helyzetre vonatkozó feltétel mellett lehetne figye- 
lembe venni. Kevés beszédfelismerő rendszer él ezzel a lehetőséggel, mert nehéz formálisan meghatározni, 
hogy mi számít adott helyzetnek. 
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10 000-szer fordul elő, és a , gun" azt 37-szer követi, akkor Pigun, la; ,) — 37/10 000, 
ahol a f a becsült valószínűség. Az ilyen tanítás befejeztével elvárnánk, hogy az, Ihave" 

és az , a gun" valószínűsége relatíve magas legyen, az ,.I has" és az , an gun" valószínű- 
sége viszont alacsony. A 15.21. ábra a jelen könyv (eredeti angol nyelvű kiadásának) 


szavaiból számított néhány bigram gyakoriságát mutatja. 
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15.21. ábra. Az unigram és bigram számlálóknak egy részleges táblázata a jelen könyv (eredeti angol 
nyelvű kiadásának) szavai alapján. A ..the" a leggyakoribb egyedülálló szó 33 508 előfordulással 
(513 893 összes szóból). A leggyakoribb bigram az ,of the", 3833 előfordulással. Néhány szám na- 
gyobb, mint várható (például 4-szer fordul elő az ,on is"), mivel a bigram számlálás figyelmen kívül 
hagyja az elválasztást: egy mondat végződhet , on"-ra és a következő kezdődhet ,is"-zel. 





A modellt ki lehet bővíteni trigrammá (trigram). amely a P(w.]Iw, pw, 2) mennyisé- 
geket használja. Ez egy hatékonyabb nyelvi modell, képes megadni, hogy az ,ate a 
banana (banánt ettem)" valószínűbb, mint az , ate a bandana (kendőt ettem)". A trigram 
modellben és kisebb mértékben a bigram és unigram modellekben is problémát jelente- 
nek a nulla értékű számlálók: nem szeretnénk egy szókombinációt lehetetlennek minő- 
síteni pusztán azért, mert nem fordulnak elő a tanító korpuszban. A simítás (smoothing) 
folyamata ilyen kombinációkhoz egy kis, pozitív valószínűséget rendel. Ezt a 952. olda- 
lon tárgyaljuk. 

A bigram és trigram modellek nem annyira kifinomultak. mint a 22. és 23. fejezet- 
ben szereplő nyelvi modellek némelyike, de jobban tekintetbe veszik a helyi összefüg- 
gések hatásait, és bizonyos helyi szintaxist sikeresen kifejeznek. Például az a tény, hogy 
az , 1 has" és a , man have" szópárok alacsony pontszámokat kapnak, az alany-állítmány 
egyeztetést fejezi ki. A probléma az, hogy ezeket a kapcsolatokat csak helyileg lehet 
észlelni: , the man have" alacsony pontszámot kap, de a , the man with yellow hat have" 
nincs büntetve. 

Most gondoljuk meg a nyelvi modell és a szómodellek egyesítését, hogy minden szó- 
sorozatot megfelelően tudjunk kezelni. Az egyszerűség kedvéért egy bigram nyelvi mo- 
dellt fogunk feltételezni. Egy ilyen modellel az összes szómodell (ami viszont kiejtési 
és beszédhangmodellekből áll) egyetlen nagy RMM-modellbe állítható össze. Az egy- 
szavas RMM-modell egy állapota egy keret, felcímkézve az aktuális beszédhanggal és 
beszédhangállapottal (például ImIkezde); egy folytonos beszédű RMM-ben egy állapot 
a szóval is fel van címkézve, mint például [mijó£zást. Ha minden szónak átlagban p há- 
romállapotú beszédhang szerepel a kiejtési modelljében, akkor W szó esetén a folyto- 
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nos beszédű RMM-nek 3pW állapota van. Átmenetek bekövetkezhetnek egy adott 
beszédhangon belül a beszédhang állapotai között, egy adott szó beszédhangjai tt, 
illetve egy szó utolsó állapota és egy másik szó kezdő állapota között. A szavak közti 
átmenetek a bigram modell szerinti valószínűséggel következnek be. 

Ha előállítottuk az egyesített RMM-modellt, akkor a felhasználásával elemezhetjük 
a folytonos beszédjelet. Különösen a (15.9) egyenletben megadott Viterbi-algoritmusnak 
vehetjük hasznát a legvalószínűbb állapotsorozat megtalálásában. Ebből az állapotsoro- 
zatból már kinyerhető a szósorozat egyszerűen az állapotok szócímkéinek kigyűjtésével. 
Így a Viterbi-algoritmus a szószegmentálás problémáját úgy oldja meg, hogy dinamikus 
programozást felhasználva (valójában) egyszerre figyelembe veszi az összes lehetséges 
szósorozatot és szóhatárt. 

"Vegyük észre, hogy nem azt mondtuk, hogy , kinyerhető a legvalószínűbb szósorozat". 
A legvalószínűbb szósorozat nem szükségképpen az, ami a legvalószínűbb állapotsoroza- 
tot tartalmazza. Ez amiatt van így, mert egy szósorozat valószínűsége az összes olyan 
állapotszekvencia valószínűségének összege, amely konzisztens ezzel a szósorozattal, 
Két szósorozatot összehasonlítva, mondjuk , a back" és , aback" szósorozatokat, előfordul- 
hat, hogy tíz alternatív állapotsorozat van az , a back"-hez, ezek mindegyike 0.03 való- 
színűséggel, de csak egyetlen állapotsorozat az , aback"-hez, viszont 0,20 valószínűséggel, 
A Viterbi-algoritmus az , aback"-t választja, pedig az , a back" valójában valószínűbb. 

A gyakorlatban ez a nehézség nem életveszélyes, de elég komoly ahhoz, hogy más 
módszereket is kipróbáljanak. A legáltalánosabb választás az At dekódoló (A? de- 
coder), ami leleményesen használja fel az A" keresést (lásd 4. fejezet) a legvalószínűbb 
szósorozat megtalálásában. Az ötlet az, hogy minden szósorozatot egy olyan gráfon át- 
vezető útnak fogunk fel, aminek a csomópontjai a szavakkal vannak felcímkézve. Egy 
csomópont gyermekei az összes olyan szó, amelyek utána következhetnek; így az ösz- 
szes n hosszúságú vagy rövidebb mondathoz tartozó gráfnak n szintje van, mindegyik 
W szélességű, ahol W a lehetséges szavak száma. A bigram modellnél a Wwj és w; cím- 
kéjű csomópontok közti nyílhoz rendelt g(w,w2) költséget a ogP(wolw) definiálja. 
Ekkor egy sorozat teljes útköltsége 





n n 
KöltségGyi ...wp) — 97—-logPéwzw; )——tog [[DOcihwz a) 
izi ízi 
Az útköltség ezen definíciója mellett, a legrövidebb út megtalálása pontosan megegye- 
zik a legvalószínűbb szósorozat megtalálásával. A keresés hatékonyságához egy jó 
húw) heurisztika is szükséges a szósorozat befejezéséhez szükséges költség megbecs- 
lésére. Nyilvánvalóan ennek főként a beszédjelnek ahhoz a részéhez kell kapcsolódnia, 
amit a jelenlegi úton fekvő szavak még nem fedtek le. Eddig még nem született külö- 
nösebben érdekes heurisztika erre a problémára. 


Egy beszédfelismerő építése 


Egy beszédfelismerő rendszer minősége az összes részének a minőségétől függ — a nyelvi 
modelltől, a szókiejtési modelltől, a beszédhangmodelltől és a jelfeldolgozó algoritmu- 
soktól, amelyek a spektrális jegyeket kinyerik az akusztikus jelből. Megtárgyaltuk, hogyan 
hozhatunk létre egy nyelvi modellt, és a jelfeldolgozás részletei más könyvekben is meg- 
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lek struktúrája — mint a paradicsom modelljei a 15.19. ábrán — általában kézi fejlesztésű. 
Nagy fonetikai szótárak most már elérhetők angol és más nyelvekhez. bár a pontosságuk 
nagymértékben változik. A háromállapotú beszédhangmodell struktúrája minden be- 
szédhangra ugyanaz, mint a 15.20. ábrán látható. Így már csak a valószínűségek marad- 
nak. Honnan szerezhetők be ezek, különösen hogy a modellek paraméterek százezreit 

Az egyetlen elfogadható módszer a modellek tanulása valódi beszédadatból, amiből 
bizonyosan nincsen hiány. A következő kérdés a tanulás mikéntje. A teljes választ a 20. 
fejezetben adjuk meg, de a fő elképzeléseket ítt is bemutathatjuk. Gondoljuk át a 
bigram nyelvi modellt; ennek megtanulását már elmagyaráztuk, ami a szópárok gyako- 
riságának a vizsgálatán alapult valódi szövegben. Megtehető ugyanez mondjuk a beszéd- 
hangok átmenet-valószínűségeire is a kiejtési modellben? A válasz igen, de csak akkor, 
ha valaki veszi a fáradságot, és végigjegyzeteli az összes előforduló szót a helyes beszéd- 
hangsorozattal. Ez egy bonyolult és számos hibalehetőséget magában rejtő feladat, de 
néhány standard adathalmazra elvégezték, amelyek több órás beszédet tartalmaznak. Ha 
ismerjük a beszédhang-szekvenciát, akkor a kiejtési modell átmenet-valószínűségeit meg- 
becsülhetjük a beszédhangpárokból. Hasonlóan, ha minden keretre ismert a beszédhang- 
állapot — egy még gyötrelmesebb kézi felcímkézés eredményeképpen — akkor megbecsül- 
hetjük a beszédhangmodell átmenet-valószínűségeit ís. Ha minden keretben ismerjük a 
beszédhangállapotot és az akusztikus jegyeket, akkor pedig megbecsülhetjük az akuszti- 
kai modellt, akár közvetlenül a gyakoriságokból (a VK modellek esetében) vagy statisz- 
tikai illesztési módszerekkel (a Gauss-modellek keveréke esetében; lásd 20. fejezet). 

A kézi címkézésű adatnak a költsége és a ritkasága, illetve az a tény, hogy az elérhe- 
tő kézi címkézésű adathalmazok nem feltétlenül reprezentálják a beszélők és az akusz- 
tikus feltételek azon típusait, amelyek egy új beszédfelismerési feladatban fellépnek, 
ezt a megközelítést bukásra ítélik. Szerencsére a várhatóérték-maximalizálás vagy EM 1 
algoritmus (expectation-maximization, EM) anélkül is megtanulja az RMM átmenet- 
valószínűségeit és érzékelő modelljeit, hogy címkézett udatot használna. Kézi címkézésű 
adatokból származó becsléseket felhasználhatunk a modell kezdeti beállítására; ezután az 
EM következik, és betanítja a modellt az éppen aktuális feladatra. Az ötlet egyszerű: egy 
adott RMM és egy megfigyeléssorozat esetén, felhasználhatjuk a 15.2. és a 15.3. alfejezet 
simító algoritmusait az egyes állapot-valószínűségek kiszámítására minden időpontban, 
illetve egy egyszerű kiterjesztéssel az állapot-állapot párok valószínűségét is az egymást 
követő időpontokban. Ezeket a valószínűségeket felfoghatjuk bizonytalan címkéknek. 
A bizonytalan címkékből megbecsülhetünk új átmenet- és érzékelési valószínűségeket, 
majd az EM eljárás megismétlődik. A módszer minden iterációban bizonyítottan növeli a 
modell adathoz való illeszkedését, és általában a kezdetben beállított kézi címkézésű becs- 
lések értékeinél, a paraméterértékek egy sokkal jobb halmazához konvergál. 

A legkorszerűbb beszédfelismerő rendszerek óriási adathalmazokat és hatalmas számí- 
tási erőforrásokat használnak fel a modelljeik tanításához. Egyedülálló szófelismerésnél, 
jó akusztikus feltételekkel (báttérzaj és visszhang nélkül), egy néhány ezres szótárnál és 
egy beszélő esetén, a pontosság 9992 feletti lehet. Folytonos beszédfelismerésnél és több 
különféle beszélő esetén, a 60-8090-os pontosság az általános, még jó akusztikus körül- 
mények esetén is. Háttérzajnál és telefonos átvitelnél a pontosság tovább romlik. Bár az 
üzembe helyezett rendszerek évtizedek óta javulnak, számos ötlet még kidolgozásra vár. 
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Ez a fejezet az ábrázolás és a következtetés általános problémáját tárgyalta időbeli való- 
színűségi folyamatok esetében. A legfőbb pontok a következők: 


s A világ változó állapotát valószínűségi változók halmazának a felhasználásával 
kezeljük, amelyek az állapotot ábrázolják minden időpontban. 

"  Kidolgozhatók olyan reprezentációk, amelyek eleget tesznek a Markov-tulajdonság- 
nak (Markov property), nevezetesen, hogy a jövő független a múlttól a jelen ismere- 
tében. Ez együttesen a folyamat stacionaritásának (stationary) feltevésével — azaz az- 
zal, hogy a dinamika az idővel nem változik — nagyban egyszerűsíti a reprenzentációt. 

s Egy időbeli valószíni modellt felfoghatunk egy állapotátmenet-modell (tran- 
sition model) és egy érzékelő modell (sensor model) együttesének, ahol az első 
az állapot alakulását, a második pedig a megfigyelés folyamatát írja le. 

" Időbeli modellekben az alapvető következtetési feladatok a szűrés (filtering), az 
előrejelzés (prediction), a simítás (smoothing) és a legvalószínűbb magyarázat 
kiszámítása (most likely explanation). Ezek mindegyike elvégezhető egyszerű, re- 
kurzív algoritmusokkal, melyek futási ideje a szekvencia hosszában lineáris. 

" Időbeli modellek három családját tanulmányoztuk részletesebben: a rejtett Markov- 
modelleket (hidden Markov modell), a Kalman-szűrőket (Kalman filters), és a 
dinamikus Bayes-hálókat (dynamic Bayesian networks) (ami magában foglalja 
a másik kettőt, mint speciális esetet). 

5" A beszédfelismerés (speech recognition) és a követés (tracking) az időbeli való- 
színűségi modellek két fontos alkalmazási területe. 

s Hacsak nincsenek speciális feltételezéseink, mint a Kalman-szűrőknél, egzakt követ- 
keztetés több állapotváltozó esetén nem kivitelezhető. A gyakorlatban a részecske- 
szűrő (particle filtering) algoritmus tűnik egy hatékony közelítő algoritmusnak. 








Irodalmi és történeti megjegyzések 


Számos alapötlet dinamikus rendszerek állapotának a becslésére a matematikus C. F. 
Gausstól származik, aki egy determinisztikus legkisebb-négyzeteken alapuló algorit- 
must alkotott meg az égitestek pályájának a megbecslésére csillagászati megfigyelések- 
ből (Gauss, 1809). Az orosz matematikus A. A. Markov fejlesztette ki a később róla 
elnevezett Markov-feltételezést a sztochasztikus folyamatokat vizsgálva; az elsőrendű 
Markov-láncot maga Markov alkalmazta először a Jevgenyij Anyegin szövegének betű- 
szekvencia-elemzésénél (Markov, 1913). Jelentős titkosított munka folyt a szűrés prob- 
lémáján a második világháború alatt folytonos idejű folyamatok esetében (Wiener, 
1942) és diszkrét idejű folyamatoknál is (Kolmogorov, 1941). Bár ez a munka fontos 
technikai fejlődést eredményezett a következő 20 évben, a felhasznált frekvenciatarto- 
mánybeli reprezentáció több számítást is elég nehézkessé tett. A sztochasztikus folya- 
matok közvetlen állapottérbeli modellezése egyszerűbbnek bizonyult, ahogy azt 
Swerling és Kalman munkái megmutatták (Swerling, 1959; Kalman, 1960). Az utóbbi 
munka vezette be a most Kalman-szűrésnek nevezett technikát előrefelé következtetés 
elvégzésére lineáris rendszerekben Gauss-zaj mellett. Rauch és társai fontos eredménye- 
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ket értek el a simításhoz kapcsolódóan, a megkapóan elnevezett Rauch-Tung-Striebel- 
simítás még ma is szabványtechnika (Rauch és társai, 1965). Számos korai eredményt 
gyűjtöttek össze a (Gelb, 1974) kiadványban. Bar-Shalom és Fortmann egy modernebb 
tárgyalást kínál bayesi vonásokkal, miközben számos hivatkozást is ad a hatalmas 
mennyiségű szakirodalomra (Bar-Shalom és Fortmann, 1988). Chatfield az idősor ana- 
lízis , klasszikus" megközelítését fedi le (Chatfield, 19899. 

A Kalman-szűrés számos alkalmazásában nem csak a bizonytalan érzékeléssel és a 
dinamikával kell foglalkozni, hanem bizonytalan azonosítással is; azaz ha több objek- 
tumot kell megfigyelni, a rendszernek meg kell határozni, hogy melyik megfigyelést 
melyik objektum generálta, mielőtt az állapotbecsléseket felfrissíthetné. Ez az adattár- 
sítás (data association) problémája (Bar-Shalom és Fortmann, 1988; Bar-Shalom, 
1992). Azon esetben, amikor s megfigyelés és n követés van (ami egy igen szelíd eset), 
a megfigyelések n! lehetséges módon rendelhetők a követésekhez; a helyes valószínű- 
ségi kezelés mindet figyelembe venné, ami megmutathatóan NP-teljes (Cox, 1993; Cox 
és Hingorani, 1994). Az MCMC-alapú polinom idejű közelítő módszerek úgy tűnik, jól 
működnek a gyakorlatban (Pasula és társai, 1999). Érdekes, hogy az adattársítás prob- 
lémája egy elsőrendű nyelvben végzett valószínűségi következtetés egy esete; a legtöbb 
valószínűségi következtetési problémától eltérően, amelyek tisztán ítéletlogikai szinten 
vannak, az adattársítás objektumokat és azonossági relációt foglal magában. Ezért köz- 
vetlenül kapcsolódik a 14. fejezetben említett elsőrendű valószínűségi nyelvekhez. Új 
kutatások megmutatták, hogy általában az azonosság feletti érvelés és konkrétan az 
adattársítás elvégezhető az elsőrendű valószínűségi keretben (Pasula és Russell, 2001). 

A rejtett Markov-modellt és a kapcsolódó következtető és tanuló algoritmusokat, 
beleértve az előre-hátra algoritmust, Baum és Petrie fejlesztették ki (Baum és Petrie, 
1966). Ettől függetlenül hasonló ötletek megjelentek a Kalman-szűréssel foglalkozó 
kutatásnál is (Rauch és társai, 1965). Az előre-hátra algoritmus volt az egyik fő előz- 
ménye az EM algoritmus általános megfogalmazásának (Dempster és társai, 1977); lásd 
még 20. fejezet. Az állandó idejű simítás Bindernek és munkatársainak a munkájában 
jelenik meg. csakúgy mint az . oszd meg és uralkodj" algoritmus, amit a 15.3. feladat- 
ban mutatunk be (Binder és társai, 1997b). 

A dinamikus Bayes-hálókra tekinthetünk úgy, mint a Markov-folyamatok egy ritka 
kódolására, és az MI-n belül elsőként a következő munkákban használták fel: (Dean és 
Kanazawa, 1989b; Nicholson, 1992; Kjaerulff, 1992). A legutóbbi munkák egyike a 
HUGIN Bayes-hálós rendszer általános kiterjesztése, ami dinamikus Bayes-hálók generá- 
lásához és szerkesztéséhez biztosítja a szükséges eszközöket. A dinamikus Bayes-hálók 
népszerűvé váltak különböző komplex mozgási folyamatok modellezésére a számítógé- 
pes látás területén (Huang és társai, 1994; Intille és Bobick, 1999). A kapcsolatot az 
RMM-k és a DBH-k között, illetve az előre-hátra algoritmus és a Bayes-hálós terjesztés 
között Srnyth és társai tisztázták (Smyth és társai, 1997). Egy további egyeségesítés a 
Kalman-szűrőkkel (és más statisztikai modellekkel) Roweis és Ghahramani munkájában 
jelenik meg (Roweis és Ghahramani, 1999). 

A 15.5. fejezetben leírt részecskeszűrő algoritmusnak különösen érdekes története 
van. Az első szűrésre szolgáló mintavételi algoritmus a szabályozáselmélet területén 
született (Handschin és Mayne, 1969), és az újramintavételezés ötlete, ami a részecske- 
szűrés központi eleme egy szabályozástechnikával foglalkozó orosz folyóiratban jelent 
meg (Zaritskii és társai, 1975). Később többször újra felfedezték: a statisztika területén 
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mint szekvenciális fontossági mintavételezésű újramintavételezés (SUFM) (seguen- 
tial importance-sampling resampling, SIR) (Rubin, 1988; Liu és Chen, 1998), a sza- 
bályozáselmélet területén mint részecskeszűrés (Gordon és társai, 1993; Gordon, 1994), 
a mesterséges intelligencia területén mint a legjobb túlélése (survival of the fittest) 
(Kanazawa és társai, 1995) és a számítógépes látásban mint sűrítés (condensation) 
(Isard és Blake, 1996). Kanazawa munkája egy javítást ís tartalmazott, az úgynevezett 
bizonyítékmegfordítást (evidence reversal), ami által a t -- 1 időpontban az állapot 
mintavételezése a ? időpontbeli állapot és a t 4- 1 időpontbeti bizonyíték feltételek mel- 
lett történik (Kanazawa és társai, 1995). Ez lehetővé teszi, hogy a bizonyíték közvetle- 
nül befolyásolja a minták generálását és bizonyítottan csökkenti a közelítési hibát 
(Doucet, 1997). 

A közelítő szűrésre szolgáló módszerek között találjuk a lecsengő MCMC (decayed 
MCMC) algoritmust (Marthi és társai, 2002) és a faktorizált közelítés módszerét 
Boyen és társaitól (Boyen és társai, 1999). Mindkét módszer rendelkezik azzal a fontos 
tulajdonsággal, hogy a közelítési hiba nem nő az idővel. Variációs technikákat (lásd 14. 
fejezet) szintén fejlesztettek ki időbeli modellekre. Ghahramani és Jordan egy közelítő 
algoritmust ismertet faktoriális RMM-kre, így olyan DBH-ra, amiben két vagy több 
függetlenül fejlődő Markov-lánc egy közös megfigyelési folyammal van összekapcsol- 
va (Ghahramani és Jordan, 1997). Jordan és társai számos más alkalmazást is tárgyalnak 
(Jordan és társai, 1998). A keverési idők tulajdonságait Pak, valamint Luby és Vigoda 
tárgyalja (Pak, 2001; Luby és Vigoda, 1999). 

A beszédfelismerés őstörténete az 1920-as években kezdődött Radio Rexszel, a hang- 
vezérlésű játék kutyával. Rex ugrált az 500 Hz körüli hangfrekvenciákra válaszul, ami 
az [eh] magánhangzóhoz tartozik a , Rex!"-ben. Kissé komolyabb munka a második 
világháború után kezdődött. Az AT£T Bell Labsnál egy rendszert építettek egyedülál- 
ló számjegyek felismerésére akusztikus jellemzők egyszerű mintaillesztésével (Davis és 
társai, 1952). A beszédhang átmenet-valószínűségeket először egy, a londoni University 
College-ban épített rendszerben használtak (Fry, 1959; Denes, 1959). 1971-ben az 
Egyesült Államok Védelmi Minisztériumának Kutatási Ügynöksége (Defense Advanced 
Research Project Agency, DARPA) négy ötéves kutatási tervet kezdett el finanszírozni, 
hogy nagy teljesítményű beszédfelismerő rendszereket fejlesszenek ki. A győztes, és 
egyben az egyetlen rendszer, ami az 1000 szavas szótáron a kitűzött 9099-os pontossá- 
got elérte, a HARPY rendszer volt a CMU-ról (Lowerre, 1976; Lowerre és Reddy. 1980).? 
A HARPY végső változatát egy DRAGON nevű rendszerből származtatták, amit egy CMU- 
s diák, James Baker épített (Baker, 1975). A DRAGON volt az első rendszer, ami RMM- 
eket használt beszédre. Majdnem egy időben Jelinek az IBM-nél kifejlesztett egy másik 
RMM-alapú rendszert (Jelinek, 1976). Ettől az időponttól kezdve, a valószínűségi mód- 
szerek általában is, de az RMM-ek különösen egyre inkább dominálták a beszédfelisme- 
rés kutatását és fejlesztéseit. Az utóbbi éveket a gyarapodó fejlődés, a nagyobb adathal- 
mazok és modellek, és a szigorúbb verseny realisztikusabb beszédhelyzeteken jellemzi. 


9 A versenyben másodikként végző rendszernek, a HEARSAY-II-nek az MI más ágaira volt nagy hatása, mert 
a táblaarchitektúrát (blackboard architecture) használta (Erman és társai, 1980). Ez egy szabályalapú sza- 
kértői rendszer volt, több többé-kevésbé független moduláris tudásforrással (knowledge source) rendelkezett. 
amelyek egy közös tábla (blackboard) révén kommunikáltak egyméssal, olvashattak a tábláról és írhattak rá. 
A táblaarchitektúrát használó rendszerek a modern felhasználói felületek architektúráinak az alapjai. 
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Egyes kutatók megvizsgálták a DBH-k felhasználásának lehetőségét az RMM-ek he- 
lyett, azzal a céllal, hogy a DBH-k nagyobb kifejezőerejét kihasználva a beszédképző 
szervek komplex rejtett állapotából többet tudjanak megragadni (Zweig és Russell, 1998; 
Richardson és társai, 2000). 

A beszédfelismeréshez jó bevezető irodalom (Rabiner és Juang, 1993; Jelinek, 1997; 
Gold és Morgan, 2000; Huang és társai, 2001). A témához tartozó fontos cikkek gyűj- 
teménye (néhány áttekintő cikket is beleértve) (Waibel és Lee, 1990). Jelen fejezet anya- 
gát Kay, Gawron és Norvig áttekintő munkájára (Kay és társai, 1994), valamint Jurafsky 
és Martin egyik könyvére alapoztuk (Jurafsky és Martin, 2000). A beszédfelismerésről 
kutatási eredményeket közölnek a Computer Speech and Language, a Speech Communi- 
cation és az IEEE Transactions on Acoustics, Speech, and Signal Processing folyóiratok, 
valamint a DARPA Workshops on Speech and Natural Language Processing kiadványok, 
továbbá a Eurospeech, az ICSLP és az ASRU konferenciák kiadványai. 


Feladatok 


15.1. . Mutassa meg, hogy bármely másodrendű Markov-folyamatot át lehet írni el- 
sőrendű Markov-folyamattá az állapotváltozóknak egy megnövelt halmazát 
használva. Megtehető-e ez mindig takarékosan, azaz az állapotátmenet-modellt 
megadó paraméterek számának a növelése nélkül? 


15.2. Ebben a feladatban azt vizsgáljuk, hogy mi történik a valószínűségekkel az eser- 
nyős világban, ha az idősorok hossza a végtelenbe tart. 

(a) Tételezzük fel, hogy a napok olyan végtelen sorát figyeljük meg, amikor az 
esernyő mindig feltűnik. Mutassa meg, hogy a napok múlásával az eső 
valószínűsége az aktuális napon monoton növekszik egy határértékhez. 
Számítsa ki ezt a határértéket. 

(b) Most gondolja át az előrejelzés-t az egyre távolabbi jövőben, csupán a két 
első esernyő megfigyelés ismeretében. Először számolja ki a P(R2 , ]U4. U2) 
valószínűséget k — 1...20 esetén, és ábrázolja az eredményeket. A valószí- 
nűségnek láthatóan konvergálnia kell egy határértékhez. Számítsa ki a ha- 
tárérték pontos értékét. 


15.3. Ez a feladat a 15.4. ábrán leírt előre-hátra algoritmus egy tártakarékos változa- 
tát fejleszti ki. A P(X./e1.) valószínűséget szeretnénk kiszámítani k — L, ..., t-re. 
Ezt egy , oszd meg és uralkodj" séma szerint végezzük el. 

(a) Tételezzük fel az egyszerűség kedvéén, hogy t páratlan, és legyen a felező- 
pont A — (t -- 1)/2. Mutassa meg, hogy P(X.le1.,) kiszámítható k — I, ..., hr 
esetén csupán az f1.g kezdő előrefelé üzenetet, a b, , 1, visszafelé üzenetet és 
az e,.,, bizonyítékokat ismerve. 

(b) Mutassa meg, hogy a sorozat második felére is fennáll egy hasonló ered- 
mény. 

(c) Az (a) és (b) eredmények ismeretében egy rekurzív , oszd meg és uralkodj" 
algoritmust lehet létrehozni, először előrefelé haladva a sorozaton és aztán 
visszafelé a végétől, csak a szükséges üzeneteket tárolva középen és a 
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15.4. 


15.5. 


15.6. 


15.7. 


15.8. 


15.9. 


15. IDŐBELI VALÓSZÍNŰSÉGI KÖVETKEZTETES 


végeken. Aztán az algoritmus lefut mindkét félre. Írja le az algoritmust 
részletesen. 

(d) Számítsa ki az algoritmus tár- és időkomplexitását a sorozat hosszának, f-nek 
a függvényében. Hogyan változik ez, ha felosztjuk a bemenetet két részre? 


A 638. oldalon vázoltunk egy hibás eljárást a legvalószínűbb állapotszekvencia 
megtalálására egy adott megfigyelési szekvencia esetén. Az eljárás azon alapul, 
hogy megkeresi a legvalószínűbb állapotokat minden egyes időpontra, és vissza- 
ad egy ezen állapotokból álló sorozatot. Mutassa meg, hogy bizonyos időbeli 
valószínűségi modellekre és megfigyelési sorozatokra, ez az eljárás egy lehetet- 
Jen állapotsorozatot ad vissza (azaz amely sorozatnak az a posteriori valószínű- 
sége nulla). 


(Gyakran szeretnénk megfigyelni egy olyan folytonos állapotú rendszert, aminek 

a viselkedése megjósolhatatlanul vált k különböző , mód" között. Például egy 

repülőgép egy rakéta elkerülése közben különböző manővereket hajthat végre, 

melyeket a rakéta megpróbálhat követni. Egy ilyen váltó Kalman-szűrő Bayes- 
háló reprezentációja a 15.22. ábrán látható. 

(a) Tételezzük fel, hogy az S, diszkrét állapotnak k lehetséges értéke van, illetve, 
hogy a P(Xg) a priori folytonos állapotbecslés egy többváltozós Gauss-elosz- 
lás. Mutassa meg, hogy a P(XI) előrejelzés Gauss-eloszlások keveréke 
(mixture of Gaussians) — azaz Gauss-eloszlások súlyozott összege, ahol a 
súlyok 1-re összegződnek. 

(b) Mutassa meg, hogy ha a jelenlegi folytonos állapot becslése, P(Xlej.), m 
Gauss-eloszlás keveréke, akkor általános esetben a P(X,, rJer-41) frissített 
állapotbecslés km Gauss-eloszlás keveréke lesz. 

(c) Az időbeli folyamatnak milyen jellegét reprezentálják a súlyok a Gauss-ke- 
verékben? 

Az (a) és (b) eredmények együtt azt mutatják, hogy az a posteriori eloszlás rep- 

rezentációja korlátozás nélkül nő, még a váltó Kalman-szűrők esetében is, ame- 

lyek a legegyszerűbb hibrid dinamikus modellek. 





Pótolja a hiányzó lépést a (15.17) egyenlet levezetésében, az első frissítési lé- 


pést az egydimenziós Kalman-szűrőnél. 


Vizsgáljuk meg a szórásnégyzet-frissítés alakulását a (15.18) egyenletben. 

(a)  Ábrázolja a c? értékét a t függvényében, adott o? és 0? értékek mellett. 

(b) Mutassa meg, hogy a frissítésnek létezik ez 0? határértéke úgy, hogy 
t — 00 esetén c? — 07, és számítsa ki ezt a of értéket. 

(c) Adjon kvalitatív magyarázatot arra, hogy mi történik, ha [3 5 0és oz c 0. 


Mutassa meg, hogyan reprezentálna egy RMM-et egy rekurzív relációs valószí- 
nűségi modellként, amint azt a 14.6. fejezetben javasoltuk. 


Ebben a feladatban részletesebben elemezzük az akkumulátorérzékelő tartóshiba- 
modellt (lásd 15.13. (a) ábra). 
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5. ha 


15.22. ábra. Egy váltó Kalman-szűrő Bayes-háló reprezentációja. Az 5, váltó változó egy diszkrét álla- 
Potváltozó, aminek az értéke meghatározza az X, folytonos állapotváltozók átmeneti modelljét. Minden 
i diszkrét állapotra a P(X, , IX, S, — 1) állapotátmenet-modell egy lineáris Gauss-modell, pontosan úgy, 
mint egy szabályos Kalman-szűrőben. A diszkrét állapotok közti P(S,, IS) állapotátmenet-modellt egy 
mátrixnak tekinthetjük, ahogyan egy rejtett Markov-modellben. 





(a) A 15.13. (b) ábra véget ér t — 32-nél. Írja le kvalitatívan, mi történik 
1 — 00 esetén, ha az érzékelő továbbra is 0-t mutat. 

(b) Tegyük fel, hogy a külső hőmérséklet befolyásolja az akkumulátor érzéke- 
lőjét, méghozzá olyan módon, hogy a hőmérséklet emelkedésével az átme- 
neti hibák valószínűbbekké válnak. Mutassa meg, hogyan egészítené ki a 
15.13. (a) ábra DBH-struktúráját, és magyarázza el az esetlegesen szükséges 
változtatásokat az FVT-kben. 

(c) Az új hálóstruktúra esetén felhasználhatja-e a robot az akkumulátormérése- 
ket az aktuális hőmérséklet kikövetkeztetésére? 


15.10. Gondoljuk meg a változó eliminálás algoritmusának az alkalmazását az esernyős 
DBH három szeletre történő kibontása esetén a P(R:IU4, U2, U3) kérdés meg- 
válaszolására. Mutassa meg, hogy az algoritmus komplexitása - a legnagyobb 
tényező mérete — ugyanaz, függetlenül attól, hogy az eső változókat előrefelé 
vagy visszafelé sorrendben elimináljuk. 


15.AI. A 15.19. ábra , tomato" modellje megengedi a koartikulációt az első magán- 
hangzón két lehetséges beszédhangot kínálva fel. Egy alternatív megközelítés a 
háromállapotú model! használata, amelyben az [ow(t,m)] beszédhang automati- 
kusan magában foglalja a magánhangzó változását. Rajzoljon egy teljes három- 
állapotú modellt a , tomato"-ra, ideértve a tájszólásos változatokat. 


15.12. Számolja ki a legvalószínűbb utat a 15.20. ábra RMM-én keresztül a (Cj, C2, Cs, 
C4. Cs, CG C-l kibocsátási sorozat esetén. Adja meg ennek valószínűségét is. 


16. EGYSZERŰ DÖNTÉSEK MEGHOZATALA 


Ebben a fejezetben láthatjuk, hogyan kell egy ágensnek döntéseket úgy meghoznia, 
hogy elérje, amit akar — az esetek nagy részében legalábbis. 


Ebben a fejezetben visszatérünk a hasznosságelmélet gondolatához, amit a 13. fejezet- 
ben vezettünk be. Megmutatjuk a hasznosságelméletnek a valószínűség-számítással való 
összekapcsolását egy döntéselméleti ágens létrehozásához, amely a meggyőződéseinek 
És célkitűzéseinek megfelelő racionális döntéseket képes hozni. Az ilyen ágensek képe- 
sek döntéseket hozni olyan esetekben is, amikor a bizonytalanság és az ellentétes célok 
egy logikai ágens számára nem tennék lehetővé a döntést. Egy célorientált ágens valójá- 
ban az állapotokat két csoportba, egy jó (cél) és egy rossz (nem cél) csoportba sorolja be, 
míg egy döntéselméleti ágens az állapotok jóságát egy folytonos mértékkel fejezi ki. 

A 16.I. alfejezet a döntéselmélet alapvető elveit vezeti be: a várható hasznosság 
maximálását. A 16.2. alfejezet megmutatja, hogy bármely racionális ágens viselkedése 
leírható egy hasznosságfüggvény feltételezésével és egy azon alapuló maximálással. 
A 16.3. alfejezet részletesebben megvizsgálja a hasznosságfüggvény tulajdonságait, kü- 
lönösen ezek kapcsolatát olyan egyedi mennyiségekhez, mint a pénz. A 16.4. alfejezet 
ismerteti, hogyan lehet a több mennyiségtől függő hasznosságfüggvényeket kezelni. 
A 16.5. alfejezet leírja a döntéshozó rendszerek megvalósítását. Nevezetesen, bevezetjük 
a döntési hálózatok (decision networks) formalizmust — más néven hatásdiagramot, 
(influence diagram) -, ami kiterjeszti a valószínűségi hálózatokat, hogy a , cselekvéseket" 
és a ,hasznosságokat" is tudják kezelni. A fejezet többi része azokat a kérdéseket vizs- 
gálja, amelyek a döntéselméletnek a szakértői rendszerekkel kapcsolatos alkalmazásakor 
lépnek fel. 





16.1. MEGGYŐZŐDÉSEK ÉS KÍVÁNSÁGOK [; 
ÖSSZEKAPCSOLÁSA BIZONYTALANSÁG ESETÉN 


Arnauld francia filozófus az 1662-ben írt Port-Royal Logic c. művében azt írta, hogy 


Annak megítéléséhez, hogy valaki elérje a jót, és elkerülje a gonoszt, nemcsak a jót és a gonoszt 
kell önmagában megfontolni, hanem annak valószínűségét is, hogy ezek megtörténnek-e vagy sem; 
És azt az arányt kell megnézni, amely ezek együtteséhez tartozik. 


A kortárs tudományos szövegek inkább hasznosságról beszélnek, mint jóról és gonosz- 
ról, de az elvek ugyanazok. Az ágens preferenciáit a világ állapotai között egy hasz- 
nosságfüggvény (utility function) adja meg, ami az egyes állapotok kívánatosságának 
kifejezésére minden állapothoz egyetlen számot rendel. A hasznosságokat a cselekedetek 
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következményeinek a valószínűségével kombinálva kapjuk az egyes cselekedetekhez 
tartozó várható hasznosságot. 

Egy S állapotnak a döntést meghozó ágens szempontja szerinti hasznosságára az 
U(5) jelölést fogjuk használni. Mostani vizsgálódásunknál az állapotokat a világ teljes 
pillanatfelvételeinek fogjuk tekinteni, hasonlóan a 10. fejezetben szereplő szituációk- 
hoz (situations). Bár ez egyszerűsíti a kezdeti fejtegetésünket, a hasznosság definiálá- 
sa minden egyes állapotra külön-külön elég nehézkessé válhat. A 16.4. alfejezetben 
látni fogjuk, hogy az állapotok hogyan bonthatók fel bizonyos körülmények között 
a hasznosság hozzárendelése érdekében. 

Egy nemdeterminisztikus A cselekvésnek az Eredmény(A) állapotok a lehetséges kö- 
vetkezményei, ahol az / index a különböző következményeken fut végig. Az A végre- 
hajtása előtt az ágens egy P(Eredmény(A)iTesz(A), E) valószínűséget rendel minden 
egyes következményhez, ahol az E az ágens által a világról elérhető tényeket jelöli, és 
a Tesz(A) egy állítás, hogy az A cselekvés végrehajtódik a jelenlegi állapotban. Ekkor 
a következő formulával kiszámíthatjuk a cselekvés EU(AJE) várható hasznosságát 
(expected utility) adott tények esetén: 





EU(AJE) — ) ) P(EredménykA)ITesz(A), E) WEredmény4A)) (16.1) 
í 


A maximális várható hasznosság (MVH) (maximum expected utility, MEU) elve 
azt mondja ki, hogy egy racionális ágensnek azt a cselekvést kell választania, ami ma- 
ximalizálja az ágens várható hasznosságát. Ha cselekvések egy legjobb sorozatát 
szeretnénk kiválasztani ennek az egyenletnek a felhasználásával, akkor az összes lehet- 
séges cselekvéssorozatot számba kellene venni, és a legjobbat kiválasztani, ami hosszú 
sorozatok esetén nyilvánvalóan nem lehetséges. Ezért ez a fejezet egyszerű döntésekre 
(általában egyetlen cselekvésre vonatkozó döntésekre) koncentrál, és a következő feje- 
zet mutat be új technikákat cselekvéssorozatok hatékony kezelésére. 

Bizonyos értelemben az MVH-elv felfogható a teljes MI meghatározásának. Hiszen 
egy intelligens ágensnek mindössze annyit kell tennie, hogy kiszámítja a különféle 
mennyiségeket, maximalizálja a hasznosságot a cselekvései felett, és kész. Ám ez nem 
jelenti, hogy ezzel a definícióval az MI problémaköre meg lenne oldva! 

Ámbár az MVH-elv bármely döntési helyzet esetén meghatározza a helyes cselek- 
vést, a szükséges számítások lehetnek kivitelezhetetlenek, és néha maga a probléma 
megfogalmazása is bonyolult. A világ kezdeti állapotának ismerete érzékelést, tanulást, 
tudásreprezentációt és következtetést igényel. A P(Eredmény(A)lTesz(A), E) kiszámí- 
tása a világ teljes okozati modelljét igényli, és — ahogyan azt a 14. fejezetben láttuk — 
NP-teljes számítást a valószínűségi hálózatokban. Az egyes állapotok U(Eredmény4A)) 
hasznosságának a kiszámítása gyakran keresést vagy tervezést igényel, mivel az ágens 
nem tudja, hogy egy állapot mennyire jó addig, ameddig nem tudja, hogy hova is kerül- 
het ebből az állapotból. Így a döntéselmélet nem csodaszer, ami megoldja az MI-prob- 
lémát. Másrészről azonban, ez egy olyan keretet ad, amelyben áttekinthető egy MI- 
rendszer összes részének a beilleszkedése. 

Az MVH-elv egyértelműen kapcsolódik a 2. fejezetben felvetett teljesítménymértékek 
elképzeléshez. Az alapötlet nagyon egyszerű. Tekintsük azokat a lehetséges környezeteket, 
amelyek érzékeléssel és memóriával rendelkező ágenseket tesznek lehetővé, és gondoljuk 
át azt, hogy milyen lehetséges ágenseket tudnánk tervezni. Ha egy ágens maximalizálja 
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a hasznosságfüggvényét, és az helyesen tükrözi a teljesítmény mértékét, amivel a visel- 
kedését megítélik, akkor ez a lehető legmagasabb teljesítménypontszámot éri el, ha a 
hasznosságot azon lehetséges környezetek felett átlagoljuk, amelyekbe az ágens ke- 
rülhet. Ez az alapvető igazolása az MVH-elvnek. Bár az állítás tautológiának tűnhet, 
valójában nagyon fontos átmenetet jelent a racionalitás globális, külső kritériumaitól — 
a múltbeli környezetek felett vett teljesítménytől — egy lokális, belső kritériumig, ami 
a következő állapotra vonatkozó hasznosságfüggvény maximalizálását jelenti. 

Ebben a fejezetben csak az egyszeri vagy egylépéses döntésekkel (one-shot 
decisions) foglalkozunk, bár a 2. fejezet a teljesítménymértékeket a múltbeli környe- 
Zetek felett definiálja, amelyek általában számos döntést tartalmaznak. A következő 
fejezetben, ami a szekvenciális döntésekkel (seguential decisions) foglalkozik, meg- 
mutatjuk, hogy ez a két nézet hogyan békíthető össze. 


16.2. A HASZNOSSÁGELMÉLET ALAPJAI 


Ránézésre az MVH-elv ésszerű módszernek látszik döntések meghozatalára, de az nem 
világos, hogy vajon ez-e az egyetlen lehetőség. Végül is, a hasznosság átlagának maximá- 
lása miért is lenne olyan különleges? Miért nem maximalizáljuk a lehetséges hasznossá- 
gok köbeinek összegét, vagy miért nem minimalizáljuk a lehetséges veszteségek maxi- 
mumát? Hasonlóan, miért nem cselekedhet az ágens racionálisan, ha csupán az állapotok 
közötti preferenciáit rögzítené, és nem rendelne hozzájuk numerikus értéket? Végül, egy- 
általán miért kell léteznie egy megkövetelt tulajdonságokkal rendelkező hasznosságfügg- 
vénynek? Talán egy racionális ágensnek olyan bonyolult a preferenciarendszere, hogy azt 
nem lehet ilyen egyszerűen az egyes állapotokhoz rendelt valós számokkal kifejezni. 


Megkötések a racionális preferenciákra 


Ezek a kérdések megválaszolhatók, ha leírjuk a preferenciákra vonatkozó azon megkö- 
téseket, amelyekkel egy racionális ágensnek rendelkeznie kell, majd ezután megmutat- 
juk, hogy az MVH-elyv ezekből a megkötésekből levezethető. Az ágens preferenciáit a 
következő jelöléssel írjuk le: 


A-B A preferált 8-hez képest 
ArsB az ágens egyformán preferálja A-t és B-t 
AzB az ágens A-t preferálja B-hez képest, vagy egyformán preferálja A-t és B-t 


Természetesen tisztázni kell, hogy mit is jelölhet A és B. Ha az ágens cselekvései de- 
terminisztikusak, akkor A és B tipikusan a cselekvések konkrét, teljesen specifikált 
eredményállapotai. Az általánosabb. nemdeterminisztikus esetben A és 8 szerencsejá- 
tékok (lotteries). Egy szerencsejáték alapvetően egy valószínűségi eloszlás az aktuális 
következmények halmaza felett (melyek a szerencsejáték , díjai"). Az L szerencse- 
játékot a C, ..., C,, következményekkel, amelyek pj, ..., pn valószínűségekkel követ- 
kezhetnek be, a következőképpen jelöljük: 


£7 (pr Cp Pa. Cz; .. Po Ca) 





16.2. A HASZNOSSÁGELMÉLET ALAPJAI 679 





A 
lg 1g 
egyenlő 
B c jé) 
Nő ú 

lg a 
(1-px1-a) c 

(a) (b) 


16.1. ábra. (a) A cserék egy teljes ciklusa, bemutatva, hogy a nemtranzitív A 3 B 3- C 3- A preferenciák 
irracionális viselkedést eredményeznek. (b) A felbonthatósági axióma. 


(Az egyetlen következménnyel rendelkező szerencsejáték A-val vagy [1, AJ-val jelöl- 
hető.) Általában egy szerencsejáték bármely következménye lehet egy atomi állapot 
vagy egy másik szerencsejáték. Az elsődleges kérdés a hasznosságelmélet számára an- 
nak megértése, ahogyan az összetett szerencsejátékok közötti preferenciák viszonyul- 
nak ezen szerencsejátékokat meghatározó állapotok közötti preferenciákhoz. 

Ennek eléréséhez ésszerű megkötéseket írunk elő a preferenciarelációkra, hasonlóan 
ahhoz, ahogyan racionális kényszereket vártunk el a meggyőződés mértékeivel kapcso- 
latban a valószínűség axiómáinak a származtatásánál a 13. fejezetben. Egy ésszerű 
megkötés, hogy a preferenciák tranzitívak (transitive) legyenek: azaz ha A :- B és 
B - C, akkor elvárhatjuk, hogy A — C. A tranzitívitás indoklásaként megmutatjuk. 
hogy egy ágens, amelynek a preferenciái nem tranzitívak, irracionálisan viselkedne. Té- 
telezzük például fel, hogy egy ágens preferenciái nem tranzitívak: A 5 B 5 C- A, ahol 
A, B és C áruk, amik szabadon cserélhetők. Ha az ágensnél jelenleg A van, akkor felkí- 
nálhatjuk C-t cserébe A-ért és egy kis pénzért. Ha az ágens jobban szereti C-t, akkor 
hajlandó lesz pénzt is áldozni C megszerzésére. Ezután felkínálhatjuk 8-t C-ért, még 
több pénzt begyűjtve, és végül elcseréljük B-t A-ért. Ezzel visszaértünk a kezdeti álla- 
potba, azt leszámítva, hogy az ágensnek kevesebb a pénze (16.1. (a) ábra). Ezt a ciklust 
addig folytathatjuk, ameddig az ágens összes pénze el nem fogy. Indokoltnak látszik azt 
állítani, hogy az ágens ebben a helyzetben nem cselekedett racionálisan. 

A következő hat megkötést a hasznosságelmélet axiómáinak szokás tekinteni. Ezek 
a preferenciákra és a szerencsejátékokra vonatkozó legnyilvánvalóbb szemantikai meg- 
kötéseket határozzák meg. 
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s  Sorrendezhetőség (orderability). Bármely két állapot esetén az ágensnek vagy prefe- 
rálnia kell az egyiket a másikkal szemben, vagy egyformán preferáltnak kell minősítenie 
mindkettőt. Azaz az ágens nem kerülheti el a döntést. Ahogyan az 557-558. oldalon 
tárgyaltuk, egy fogadás visszautasítása az idő folyásának a felfüggesztéséhez hasonló. 


(A-B V(B-AJV(Ar B) 


: Tranzitivitás (transitivity). Bármely három állapot esetén, ha az ágens preferálja 
A-t B-vel szemben, és B-t C-vel szemben, akkor az ágensnek preferálnia kell A-t is 
C-vel szemben. 


(A5 BY A (BC) 5 (A- 0) 


s Folytonosság (continuity). Ha valamely B állapot A és C között helyezkedik el a 
preferenciák szempontjából, akkor létezik egy p valószínűség, amely mellett a racio- 
nális ágens számára közömbössé válik, hogy a biztos B-t kapja, vagy egy olyan sze- 
rencsejátékot, amiben p valószínűséggel A. I — p valószínűséggel pedig C nyerhető. 


A3B3-Cs5 9PIlp,A;1-p, CB 


"  Helyettesíthetőség (substitutability). Ha egy ágens az A és B szerencsejátékot egy- 
formán preferálja, akkor az ágens két összetettebb szerencsejátékot is egyformán 
preferál, amelyek csak abban különböznek, hogy az egyikben A B-re van cserélve. 
Ez a szerencsejátékokbeli valószínűségektől és más kimenetektől függetlenül igaz. 


AsB: mp, A;1-p, CI Wp.B;1-p, C) 


"  Monotonitás (monotonicity). Tételezzük fel, hogy két szerencsejátéknak ugyanaz 
a két kimenetele van, A és B. Ha az ágens A-t preferálja B-vel szemben, akkor az 
ágensnek azt a szerencsejátékot kelt preferálnia, ami nagyobb valószínűséggel ered- 
ményezi A-t (és fordítva is). 

ArB3P2g6[p.A;1-p, BIZ [d. A: 1-9, B] 

s Felbonthatóság (Decomposability): Összetett szerencsejátékok egyszerűbbekre bont- 
hatók a valószínűség-számítás szabályai szerint. Ezt , a hazárdjáték unalmas" szabálynak 
nevezték el, mivel ez azt mondja ki, hogy két egymást követő szerencsejátékot össze le- 
het olvasztani egyetlen ekvivalens szerencsejátékba, ahogyan azt a l6.1. ábra mutatja. ! 


[p. A; 1— p. [g, B: 1— a, CII —- [p. A: (1 — p)a. B: (1 -pX(i — 9), CI 


És aztán jött a hasznosság 


Vegyük észre, hogy a hasznosságelmélet axiómái nem mondanak semmit a hasznosság- 
ról. Kizárólag a preferenciákról szólnak. Azaz a racionális ágens alapvető tulajdonsá- 
gainak a preferenciákat tételezzük fel. A hasznosságfüggvény létezése a hasznosság- 
axiómákból következik: 


A hazárdjáték élvezetét ekkor úgy modellezhetjük, hogy belefoglalhatjuk a hazárdjátékjátszás eseménye- 
állapotleírásokba; például a , 10 dollár és hazárdjátékjátszás" preferált lehet a ,,10 dollár bazárdjátékjátszás 
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1. A hasznosság elv (utility principle) 
Ha az ágens preferenciái eleget tesznek a hasznosság axiómáinak, akkor létezik egy, 
az állapotokon értelmezett U valós értékű függvény, mellyel U(A) 5 U(B) akkor és 
csak akkor, ha A preferált 8-vel szemben, és U(A) — U(B) akkor és csak akkor, ha 
az ágens számára A és B egyformán preferált. 


UA) 5 UB 547 B 
UA) — UBB) 5 A-B 


2. A maximális várható hasznosság elve (maximum Expected Utility principle) 
Egy szerencsejáték hasznossága az egyes kimenetelek valószínűségeivel szorzott 
kimenetelhasznosságok összege. 


Up S. Pn SD 72 PIUS 
Más szóval, amint a lehetséges kimenet. i állapotoknak a valószínűségei és hasznossá- 
gai specifikáltak, az ezeket tartalmazó összetett szerencsejáték hasznossága teljesen 
meghatározott. Mivel egy nemdeterminisztikus cselekmény kimenetele egy szerencse- 
játék, ez egy MVH-alapú döntési szabályt jelent a (16.1) egyenlet szerint. 

Fontos megjegyezni, hogy a hasznosságfüggvény léte, ami leírja az ágens preferen- 
ciáit, nem jelenti azt szükségszerűen, hogy az ágens explicit módon maximalizál egy 
hasznosságfüggvényt a mérlegelései során. Amint azt a 2. fejezetben megmutattuk, 
racionális viselkedés számos módon előállítható, némelyik sokkal hatékonyabb, mint 
a hasznosság maximalizálásának explicit elvégzése. Az ágens preferenciáinak meg- 
figyelésével azonban lehetségessé válik a hasznosságfüggvény megkonstruálása, ami 
az ágens elérni szándékozott céljait reprezentálja. 








16.3. HASZHOSSÁGFÜGGVÉNYEK 


A hasznosság egy függvény, ami valós számokat rendel az állapotokhoz. Vajon ez min- 
den, amit a hasznosságfüggvényről el lehet mondani? Szigorúan nézve, igen, ennyi. 
A korábban felsorolt megkötéseknek eleget téve az ágensnek tetszőleges preferenciái 
lehetnek. Például az ágens preferálhatja, hogy a bankbetétjein elhelyezett dollárok 
száma prímszám legyen; ekkor, ha 16 dollárja volna, 3-at elajándékozna. Lehet, hogy 
egy 1973-as ütött-kopott Ford Pintót jobban szeret, mint egy csillogó új Mercedest. 
A preferenciák kapcsolatban állhatnak egymással: például lehet, hogy csak akkor prefe- 
rál prímszámú dollárt, ha Pintója van, de amikor Mercedese van, akkor a több dollárt 
jobban szereti, mint a kevesebbet. 

Ha az összes hasznosságfüggvény ilyen tetszőleges volna, mint ez, akkor viszont a 
hasznosságelméletnek nem lenne sok haszna, mivel meg kellene figyelnünk az ágens 
preferenciáit minden lehetséges körülmény esetén, mielőtt a viselkedésével kapcsolat- 
ban bármilyen előrejelzésre is képesek lennénk. Szerencsére az igazi ágensek preferen- 
ciái sokkal rendszerezettebbek. Ennek megfelelően szisztematikus módszerek léteznek 
a hasznosságfüggvények megtervezésére, amelyeket aztán egy mesterséges ágensbe be- 
építve az ágens a helyes, általunk elvárt viselkedést fogja produkálni. 
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A pénz hasznossága 


A hasznosságelmélet a közgazdaságtanból származik, a közgazdaságtan pedig egy nyil- 
vánvaló jelöltet kínál a hasznosság mérésére: a pénzt (vagy pontosabban az ágens tel- 
jes nettó vagyonát). A pénz majdnem univerzális felcserélhetősége bármely árura és 
szolgáltatásra azt mutatja, hogy a pénz jelentős szerepet játszik az emberi hasznosság- 
függvényekben. (Valójában, a legtöbb ember a közgazdaságtant a pénz tanulmányozá- 
sához köti, pedig a közgazdaság szó gyökere a gazdálkodásra vonatkozik, míg jelenleg 
a hangsúly a választások kezelésén van.) 

Ha csak azokat a cselekvéseket vesszük figyelembe, amelyek az ágens pénzmennyi- 
ségét befolyásolják, akkor általában az lesz a tapasztalat, hogy az ágens a több pénzt 
előnyben részesíti a kevesebbel szemben, ha egyéb dolgok egyenlők. Azt mondjuk, 
hogy az ágens monoton preferenciát (monotonic preference) mutat egy adott össze- 
gű pénz esetén. Azonban ez nem elegendő annak garantálására, hogy a pénzt egy hasz- 
nosságfüggvénynek tekinthessük, mivel ez semmit sem mond azon szerencsejátékok 
közötti preferenciákról, amelyek kimenetele pénz. 

Tételezzük fel, hogy ön győzedelmeskedett a versenytársak felett egy televíziós já- 
tékban. A házigazda most választásra kéri fel: elviheti az 1 000 000 dolláros díjat, vagy 
felteheti egy pénzfeldobásos hazárdjátékon. Ha fej, nem kap semmit, ha írás, akkor kap 
3 000 000 dollárt. Ha hasonló a többi emberhez, akkor vonakodna játszani, és zsebre 
vágná a milliót. Ez irracionális volna? 

Feltéve, hogy hisz az érme szabályos voltában, a játék várható pénzügyi értéke 
(VPÉ) (expected monetary value) 7 (0 dollár) 4-— 5 ( 3.000 000 dollár) — 1 500 000 dol- 
lár, és az eredeti díj, a VPÉ-je természetesen i 000000 dollár, ami kisebb. De ez nem je- 
lenti szükségszerűen, hogy a hazárdjáték elfogadása a jobb döntés. Tételezzük fel, hogy 
5,, jelöli az n dollárt birtokló állapotot, és a jelenlegi vagyon k dollár. Ekkor a két 
cselekedetnek, a hazárdjáték elfogadásának vagy visszautasításának a várható hasz- 
nossága: 


EUElfogad) — 5 U(Sp) 4-5 U(CSr3 000 000) 

EWKElutasít) — U(Sr44 000 000) 
Annak eldöntéséhez, hogy mit is tegyünk, az egyes kimeneteli állapotokhoz hasznossá- 
got kell rendelnünk. A hasznosság nem közvetlenül arányos a pénzügyi értékkel, mi- 
vel a hasznosság — az okozott pozitív változás az életstílusban — az első millió dollár 
esetén nagyon nagy (vagy legalábbis azt mondják), ezzel szemben a további milliók 
hasznossága sokkal kisebb. Tételezzük fel, hogy 5-ös hasznosságot rendel a jelenlegi 
(S,) pénzügyi helyzethez, 10-et az 5443 000 000 állapothoz, 8-at az S, , 500000 állapothoz. 
Ekkor a racionális döntés az elutasítás lenne, mivel az elfogadás várható hasznossága 
7,5 (kisebb, mint az elutasításhoz tartozó 8). Most tételezze fel, hogy már van a szám- 
láján 500 000 000 dollár (és a játékban való részvétel csak a móka kedvéért történik). 
Ebben az esetben a hazárdjáték valószínűleg elfogadható, feltéve, hogy a több pénzt 
preferálja a kevesebbel szemben, mivel az 503-adik millió haszna valószínűleg ugyan- 
akkora, mint az 501-edik millióé. 

A valóságos hasznossági függvényekről szóló úttörő jelentőségű tanulmányban 
Grayson azt találta, hogy a pénz hasznossága majdnem teljesen arányos a mennyiségé- 
nek logaritmusával (Grayson, 1960). (Ezt először Bernoulli vetette fel [Bernoulli, 
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1783]; lásd 16.3. feladat.) Egy ilyen görbe, egy bizonyos Beard úré, a 16.2. (a) ábrán 
látható. A Beard úrtól kapott preferenciák konzisztensek a következő hasznossági függ- 
vénnyel: 


U(Srn) — —263.31 - 22.09 logí -H 150 000) 


az n — -150 000 dollár és n — 800 000 dollár közötti tartományban. 

Azt nem tételezhetjük fel, hogy ez egy univerzális hasznosságfüggvénye a vagyoni 
értéknek, de valószínű, hogy a legtöbb embernek olyan hasznosságfüggvénye van, ami 
konkáv a pozitív tartományban. Adósságba keveredni általában vészesnek tartott dolog, 
de a preferenciák a különböző adósságszintek között a pozitív tartománybeli konkávitás 
megfordulását is mutathatják. Például ha valakinek már van 10 000 000 dollár adósá- 
ga, akkor lehet, hogy igencsak részt vesz egy olyan pénzfeldobásos hazárdjátékban, 
ahol 10 000 000 dollár a nyeremény, ha fej, és 20 000 000 dollár a veszteség, ha írás.? 
Ez egy S alakú görbét eredményez, amit a 16.2. (b) ábra mutat. 


U u 


(a) (b) 


16.2. ábra. A pénz hasznossága. (a) Empirikus adat Beard úrtói egy korlátos tartományban. (b) Egy tipi- 
kus görbe a teljes tartományban. 


Ha csak a görbe pozitív részét vizsgáljuk, ahol a meredekség csökken, akkor itt bár- 
mely L szerencsejáték esetén a várható hasznosság kisebb, mint annak a biztos ese- 
ménynek a hasznossága, amikor az átadott pénzügyi érték a várható pénzügyi értékkel 
egyezik meg. 

UL) c USypénY 
Azaz az ilyen alakú görbével rendelkező ágens kockázatkerülő (risk-averse): előnyben 
részesít egy biztos eseményt egy szerencsejátékkal szemben, még akkor is, ha a biztos 
összeg kisebb, mint a szerencsejáték várható pénzügyi értéke. Másfelől, a 16.2. (b) áb- 
rán a nagy adóságokhoz tartozó , elkeseredett" régióban a viselkedés kockázatkereső 
(risk-seeking). Azt az értéket, amit az ágens a szerencsejáték helyett elfogad, a játék 
determinisztikus ekvivalensének (certainty eguivalent) nevezzük. A tanulmányok 


2 Az ilyen viselkedést elkeseredettnek nevezhetjük, mindazonáltal teljesen racionális, ha valaki kilátástalan 
helyzetben van. 
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azt mutatják, hogy a legtöbb ember elfogad körülbelül 400 dollárt egy olyan szerencse- 
játékért cserébe, ami 2 valószínűséggel eredményez 1000 dollárt és 0 dollárt — azaz en- 
nek a szerencsejátéknak a determinisztikus ekvivalense 400 dollár. A szerencsejáték 
várható pénzügyi értéke és a determinisztikus ekvivalense közötti értéket biztosítási 
prémiumnak (insurance premium) hívjuk. A kockázatkerülés az alapja a biztosítási 
üzletágnak, mivel ez azt jelenti, hogy a biztosítási prémium pozitív. Az emberek inkább 
fizetnek egy alacsonyabb biztosítási díjat, mintsem hogy kockára tegyék a házuk teljes 
árát egy lehetséges tűzeset miatt. Viszont a biztosítási társaságok szemszögéből a ház 
teljes ára igen kicsi a cég összes vagyonához képest. Emiatt a biztosító hasznossági gör- 
béje megközelítően lineáris ebben a kicsiny régióban, és a biztosítás a társaságnak alig 
kerül valamibe. 

Vegyük észre, hogy a kis vagyoni változások az aktuális vagyoni helyzethez képest 
közel lineárisak a görbe bármely szakaszán. A lineáris görbével rendelkező ágenst 
kockázatsemlegesnek í(risk-neutral) nevezzük. Ezért kis összegű hazárdjátékok ese- 
tén kockázatsemlegességet várhatunk el. Egy bizonyos értelemben ez igazolja azt az 
egyszerűsített eljárást, ami kis összegű szerencsejátékokkal segítette valószínűségek 
megbecsülését, és igazolta a valószínűség-számítás axiómáit a 13. fejezetben. 


Hasznosságskálák és a hasznosság megbecslése 


A hasznosságaxiómák, ha az ágens viselkedési preferenciái rögzítettek, nem határoznak 
meg egy kitüntetett hasznosságfüggvényt. Például az U(S) hasznosságfüggvényt a kö- 
vetkező alakra transzformálhatjuk: 


US) - kr 4 kg US) 


ahol k, egy állandó és ka egy tetszőleges pozitív állandó. Nyilvánvaló, hogy ez a line- 
áris transzformáció nem befolyásolja az ágens viselkedését. 

Determinisztikus környezetekben, ahol állapotok vannak, és nincsenek szerencsejáté- 
kok, a viselkedés nem fog megváltozni semmilyen monoton transzformációra. Például 
vehetjük a köbét az összes hasznosságnak anélkül, hogy ez a cselekmények preferencia- 
rendezését befolyásolná. Egy determinisztikus környezetben lévő ágens esetén azt mond- 
juk, hogy az ágensnek értékfüggvénye (value function) vagy sorrendezett hasznosság- 
függvénye (ordinal utility function) van; a függvény valójában csak az állapotok sor- 
rendezését biztosítja, és nem ad értelmezhető numerikus értékeket. Ezt a különbségtételt 
láttuk a 6. fejezetben a játékok esetén: determinisztikus játékokban, mint a sakk, a kiérté- 
kelő függvények értékfüggvények, míg nemdeterminisztikus játékokban, mint az ostábla, 
ezek valódi hasznosságfüggvények. 


Emberi ítélethozatal és a hibázás lehetősége 


A döntéselmélet egy normatív elmélet (normative theory): azt írja elő, hogy az ágensnek hogyan 
ketl cselekednie. A közgazdaságtan elméletének alkalmazását nagyban javítaná, ha ez egyben egy 
leíró (descriptive) elmélet is volna az aktuális emberi döntéshozatalról. Azonban kísérleti bizonyí- 
tékok vannak arra, hogy az emberek szisztematikusan megsértik a hasznosságelmélet axiómát. Egy 
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példát a pszichológus Tversky és Kahneman adnak a közgazdász Allais példája alapján CTversky és 
Kahneman, 1982; Allais, 1953). A kísérleti személyeknek kétszer kell választaniuk, az A és a B sze- 
rencsejáték, majd a C és a D szerencsejáték között. 


A: 4000 dollár 8090 eséllyel €C: 4000 dollár 2099 eséllyel 
B: 3000 dollár 1004 eséllyel D: 3009 dollár 2597 eséllyek 


A többség B-t választja A-val szemben, és C-t D-vel szemben. De ha elfogadjuk, hogy U(0 dol- 
lár) — 0, akkor az első választás arra utal, hogy 0,8U(4000 dollár) c U(3000 dollár), míg a máso- 
dik választás pontosan a fordítottjára. Másképpen fogalmazva, nincs olyan hasznosságfüggvény, 
ami ezekkel a választásokkal konzisztens lenne. Az egyik lehetséges következtetés, hogy az embe- 
rek egyszerűen irracionálisak a hasznosságelmélet axiómái alapján. Egy alternatív nézet, hogy az 
elemzés nem veszi figyelembe a megbánást (regret) — azt az érzést, amiről az emberek tudják, hogy 
választanak, majd vesztenek. Más szavakkal, ha A-t választja, 2096 esélye van, hogy nem lesz pén- 
ze, és úgy érzi magát, mint egy komplett idióta. 

Kahneman és Tversky továbbment, és kifejlesztett egy leíró elméletet, ami megmagyarázza, 
hogy az emberek miért kerülik a kockázatot nagy valószínűségű eseményeknél, viszont miért haj- 
landók nagyobb kockázatot vállalni valószínűtlen jutalmakkal. A kapcsolat az MI és ezen tapasz- 
talat között az, hogy az ágensünk döntései csak annyira jók, amennyire jók a preferenciák, amin 
alapulnak. Ha az emberi informátoraink ellentmondásos preferenciákhoz ragaszkodnak. akkor az 
ágensünk semmit sem tud tenni, hogy konzisztens legyen velük. 

Szerencsére, az emberek által hozott preferenciaítéletek gyakran könnyen felülbírálhatók későb- 
bi megfontolások alapján. Keeney és Raiffa egy korai munkájukban a Harvard Business Schoolon 
a pénz hasznosságának a megbecslése kapcsán a következőt írta (Keeney és Raiffa, 1976. 210. o): 


Kísérleti vizsgálatok nagy része mutatta ki, hogy súlyos hiányosságok vannak a becslési pro- 
tokollban. A kísérleti személyek kicsiben hajlamosak túlságosan kockázatkerülővé válni és 
ezért... az illesztett hasznosságfüggvények elfogadhatatlanul nagy kockázati prémiumot 
mutatnak a nagy tartományú szerencsejátékokra. ...A kísérleti személyek azonban rendezni 
tudják az inkonzisztenciájukat, és úgy érzik, hogy valami fontosat tanultak arról, hogyan akar- 
nak viselkedni. Eredményképpen néhányan lemondták a gépjármű baleseti biztosításukat és 
több időszakos életbiztosítást kötöttek meg. 





Az emberi (irracionalitás még ma is intenzív vizsgálatok tárgya. 


A hasznosságok megbecsülésére egy megoldás, hogy választunk egy skálát a ,.lehe- 
tő legnagyobb díj" U(S) — ur és a , lehető legnagyobb katasztrófa" U(S) — u alapján. 
Normált hasznosságok (normalized utilities) esetén a skála uj — O és ur — 1. A köz- 
beeső kimenetelek hasznosságának a megbecslése úgy történik, hogy az ágenst megké- 
rik, jelezze a preferenciáját az S kimeneteli állapot és egy [p. ur; (1—p). u ; ] standard 
szerencsejáték (standard lottery) között. A p valószínűséget addig módosítják, amíg 
az ágens nem preferálja egyformán 5-et és a standard szerencsejátékot, Normalizált 
hasznosságokat feltételezve S hasznossága p. 

Orvosi, szállítási és környezetvédelmi problémáknál, egyebek között, emberek élete 
forog kockán. Ezekben az esetekben u ; a közvetlen halálesethez (esetleg halálesetekhez) 
hozzárendelt érték. Ámbár senkinek sem könnyű értékeket rendelni emberi életekhez, az 1 
tény, hogy szünet nélkül kompromisszumokat kötünk. A repülőgépeket csak adott időkö- 
zönként vetik alá ellenőrzéseknek, amit az utazások és megtett kilométerek határoznak 
meg, nem pedig minden utazás után. A költségcsökkentések miatt a gépkocsik karosz- 
szériája viszonylag vékony fémből készül, a balesetek túlélési arányának csökkenése 
ellenére. Az ólmozott üzemanyag még mindig igen elterjedt, ámbár jól ismert, hogy az 
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egészségre káros. Így paradox módon az az ellenkezés, hogy , az élet pénzben nem kife- 
jezhető", azt eredményezi, hogy az élet afulértékelt. Ross Shachter egy kormányhivatallal 
kapcsolatos élményéről számol be, amely hivatal megrendelt egy tanulmányt az azbeszt 
iskolákból történő eltávolításáról. A tanulmány egy adott pénzösszeget rendelt az iskolás- 
korú gyerekek életéhez, és úgy érvelt, hogy ezen feltevés mellett a racionális döntés az 
azbeszt eltávolítása. A kormányhivatal, morálisan felháborodva teljes mértékben elutasí- 
totta a jelentést. Ezzel egyben az azbeszt eltávolítása ellen is döntöttek. 

Történtek próbálkozások arra nézve, hogy kiderítsék, mennyi értéket tulajdonítanak 
az emberek az életüknek. Az orvosi és biztonsági elemzésekben két elterjedt , pénzne- 
met" használnak, a mikrohalált (micromort) (az egymilliomod esélyét az elhalálozás- 
nak) és a OALY-t, vagy szabványos minőségű életévet (ami ekvivalens egy évvel, jó 
vagyoni helyzetben, betegségektől mentesen). Számos, személyek igen széles körét 
vizsgáló tanulmány azt mutatta, hogy a mikrohalál 20 dollárt ér (1980-ban). Azt már 
láttuk, hogy a hasznosságfüggvény nemlineáris, ezért ez nem jelenti azt, hogy a döntés- 
hozó megölné magát 20 millió dollárért. Újra hangsúlyozandó, hogy a hasznossággörbe 
lokális linearitása azt jelenti, hogy a mikrohalál és a OALY értékei kis relatív kockáza- 
tok és jutalmak esetén hasznosak. 


16.4. TÖBBVÁLTOZÓS HASZNOSSÁGFÜGGVÉNYEK 


A közérdekű ügyeknél történő döntéshozatal mind dollármilliókhoz, mind emberek éle- 
téhez és halálához is kapcsolódik. Például annak eldöntésekor, hogy rákkeltő anyagok 
milyen koncentrációi engedhetők meg a környezetben, a döntéshozóknak mérlegelniük 
kell a halál megelőzését és azokat a közgazdasági nehézségeket, amelyek bizonyos ter- 
mékek és folyamatok megszüntetése miatt jelentkezhetnek. Egy új repülőtér elhelyezé- 
se esetén meg kell fontolni az építkezés okozta felfordulást; a telkek értékét; a népesebb 
központoktól való távolságot; a reptér zaját; a biztonsági kérdéseket a helyi földrajzi és 
az időjárási viszonyok tekintetében és így tovább. Az ehhez hasonló problémákat, ahol 
a kimenetelt két vagy több attribútum jellemez a többattribútumú hasznosságelmélet 
(multiattribute utility theory) kezeli. 

Jelölje X — XI, X2, ..., Xn az attribútumokat, az attribútumértékek vektorát pedig 
Xx — (xj, X2, ..., Xp). Általában minden attribútumról feltételezzük, hogy diszkrét vagy 
folytonos értékekkel rendelkezik. Az egyszerűség kedvéért feltételezzük, hogy az att- 
ribútumokat úgy határoztuk meg, hogy a nagyobb attribútumértékek nagyobb hasz- 
nosságértékékhez tartoznak, ha minden más változatlan. Például a repülőtér probléma 
esetén minél nagyobb a ZajMentesség értéke, annál jobb a megoldás. Bizonyos esetek- 
ben szükséges lehet az értéktartomány felosztása, ahol a hasznosságértékek az egyes 
tartományokban monoton módon változnak. 

Elsőként azokat az eseteket vizsgáljuk meg, amikor döntéseket anélkül hozhatunk, 
hogy az attribútumértékeket egyetlen hasznosságértékké egyesítenénk. Majd azokat az 
eseteket vizsgáljuk, ahol az egyes attribútumkombinációk hasznosságát nagyon tömö- 
ren lehet megadni. 
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Dominancia 


Tételezzük fel, hogy az Sj reptér kevesebbe kerül, kisebb zajjal jár és biztonságosabb ís, 
mint 52. Ekkor az mondjuk, hogy S) szigorúan dominálja (strict dominance) 5--t. 
Általában, ha egy lehetőség minden attribútumának kisebb az értéke, mint egy másik 
lehetőségé, akkor nem szükséges tovább vizsgálódni. A szigorú dominancia gyakran 
nagyon hasznos, mert leszűkíti a választási lehetőségeket a valódi jelöltekre, bár ritkán 
eredményez egyetlen választási lehetőséget. A 16.3. (a) ábra egy sematikus helyzetet 
mutat egy kétattribútumos esetben. 


X 


Ez a régió 
dominálja A-t 





16.3. ábra Szigorú dominancia. (a) Determinisztikus: A-t szigorúan dominálja B, de sem €, sem D nem. 
(b) Bizonytalan: A-t szigorúan dominálja B, de C nem. 


Mindez remekül használható determinisztikus esetekben, ahol a tulajdonságértékek 
biztosan ismertek. De mi történik abban az általános esetben, ahol a cselekvések kime- 
netele bizonytalan? A szigorú dominancia közvetlen analógiája könnyen megalkotható, 
ha a bizonytalanság ellenére, S; minden lehetséges kimenetele szigorúan dominálja §7 
minden lehetséges kimenetelét. (Ezt mutatja a 16.3. (b) ábra sematikus ábrázolása.) Ter- 
mészetesen ez valószínűleg sokkal ritkábban fordul elő, mint a determinisztikus esetben. 

Szerencsére létezik egy használhatóbb általánosítás, az úgynevezett sztochasztikus 
dominancia (stochastic dominance), ami valós problémáknál is gyakran előfordul. 
A sztochasztikus dominanciát könnyebb megérteni egyetlen változó esetében. Tételezzük 
fel, hogy a reptér költsége az S) helyen egyenletes eloszlású 2.8 és 4.8 milliárd dollár kö- 
zött, és az 5, helyszínen a költség egyenletes eloszlású 3.0 és 5,2 milliárd dollár között. 
A 16.4. (a) ábra ezen költségek elosztásait mutatja, ahol a költségek negatív értékként 
szerepelnek. Ekkor csupán azt az információt ismerve, hogy a hasznosság csökken a 
költségekkel, azt mondhatjuk, hogy S, sztochasztikusan dominálja S2-t — azaz 52 el- 
hagyható. Fontos felismerni, hogy ez nem következik a várható költségek összehason- 
lításából. Például ha tudnánk, hogy S, költsége pontosan 3,8 milliárd dollár, akkor a 
pénz hasznosságára vonatkozó további információk nélkül nem tudnánk döntést hozni. 





3 Furcsának tűnhet, hogy az 5; költségéről lévő több információ az ágens döntésképességét csökkenti. A para- 
doxonra magyarázatot kapunk, ha figyelembe vesszük, hogy az egzakt költséginformáció hiányában meghozott 
döntés kisebb valószínűséggel a legnagyobb hasznosságú. 
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16.4. ábra. Sztochasztikus dominancia. (a) 5, sztochasztikusan dominálja 52-t a költségek vonatkozásá- 
ban. (b) S, és $2 negatív költségeinek eloszlásfüggvényei. 


Az attribútumok eloszlásai közötti pontos kapcsolat, amely a sztochasztikus domi- 
nancia megállapításához szükséges, legkönnyebben az eloszlásfüggvény megvizsgálá- 
sával látható, ahogy azt a 16.3. (b) ábra is illusztrálja. Az eloszlásfüggvény annak a va- 
lószínűségét méri, hogy a költség kisebb-e egy adott összegnél, vagy egyenlő vele — az- 
az az eloszlásfüggvény az eredeti eloszlást integrálja. Ha S, eloszlásfüggvénye mindig 
jobbra esik $2 eloszlásfüggvényétől, akkor sztochasztikus szemszögből S; olcsóbb, 
mint 2. Formálisan, ha az Aj és az A; cselekvések a pj(x) és a pa(x) valószínűség-el- 
oszlásokra vezetnek az X attribútumon értelmezve, akkor A sztochasztikusan dominál- 
ja Azt az X-en, ha 


x 

vx f neddv s f/praday 

—o0 —o0 

A definíció fontosságát az optimális döntés megválasztásában a következő tulajdonság 
adja: ha Ay sztochasztikusan dominálja A2-t, akkor bármely U(x) monoton nem csökke- 
nő hasznosságfüggvény esetén, Az várható hasznossága legalább olyan nagy, mint Az 
várható hasznossága. Azaz, ha egy cselekvést egy másik cselekvés minden attribútum 
esetén sztochasztikusan dominál, akkor az első cselekvés figyelmen kívül hagyható. 

Úgy tűnhet, hogy a sztochasztikus dominancia meglehetősen matematikai megköze- 
lítést igényel, meghatározása pedig nagy mennyiségű, valószínűséggel kapcsolatos szá- 
mítást. Valójában azonban számos esetben igen könnyen eldönthető. Tételezzük fel 
például, hogy az építési költség a népesebb központoktól való távolságtól függ. A költ- 
ség maga bizonytalan, de a nagyobb távolság nagyobb költséget jelent. Ha S, közelebbi, 
mint 52, akkor S, dominálni fogja 52-t a költség tekintetében. Bár ismertetésüktől elte- 
kintünk, de léteznek algoritmusok, amelyek képesek kezelni az ilyen kvalitatív informá- 
ciókat is a bizonytalan változók közötti kapcsolatokról a kvalitatív valószínűségi hálók 
(gualitative probabilistic networks) felhasználásával, lehetővé téve, hogy egy rendszer 
a sztochasztikus dominancia alapján hozzon racionális döntéseket anélkül, hogy bármi- 
lyen numerikus értéket használna. 
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A preferenciák rendszere és a többattribútumos 
hasznosság 


Tételezzük fel, hogy n attribútumunk van, ahol mindegyiknek d különböző értéke le- 
het. A teljes UGxy. ..., xn) hasznosságfüggvény megadásához legrosszabb esetben d" 
érték szükséges. Ez a legrosszabb eset abban a helyzetben áll fent, amikor az ágens 
preferenciáiban nincs semmilyen szabályszerűség. A többattribútumos hasznosság- 
elmélet azon a feltételezésen alapul, hogy a legtöbb hasznosságfüggvény sokkal na- 
gyobb strukturáltsággal rendelkezik. Az elfogadott alapvető megközelítés az, hogy 
a viselkedés preferenciáiban várható szabályszerűségeket azonosítunk, és az úgyneve- 
zett reprezentációs tételeket (representation theorems) felhasználva megmutatjuk, 
hogy az adott preferenciarendszerrel rendelkező ágens leírható a következő hasznos- 
ságfüggvénnyel: 


UC sss Xp) — FLAG, fel 


ahol f remélhetőleg olyan egyszerű függvény, mint az összeadás. Látható, hogy ez ahhoz 
hasonló, ahogy a valószínűségi hálókat használtuk az együttes valószínűségeloszlás- 
függvény felbontására. 


Preferenciák bizonytalanság nélkül 


Kezdjük a determinisztikus esettel. Emlékezzünk vissza, hogy determinisztikus környe- 
Zetben az ágensnek egy értékfüggvénye van, : a cél ennek a tömör reprezentálása. A de- 
terminisztikus preferenciastruktúrában megtalálható alapvető szabályszerűséget prefe- 
renciafüggetlenségnek (preference independence) nevezzük. Két attribútum, XI és 
X; preferenciálisan független X3-tól, ha a preferencia (xy, x2, xz) és (xf, x4, xj) között 
nem függ Xz konkrét értékétől. 

Visszatérve a repülőteres problémára, ha egyebek mellett a Zaj, a Költség és a Ha- 
lálesetek figyelembe veendő attribútumok voltak, felvethető, hogy a Zaj és a Költség 
preferenciálisan független a Halálesetek-től. Ekkor például, ha előnyben részesítjük azt 
az állapotot, ahol 20 000 ember lakik a repülési útvonal közelében, és az építési költség 
4 milliárd dollár, azzal az állapottal szemben, ahol 70 000 ember lakik a repülési útvo- 
nalon, és az építési költség 3.7 milliárd dollár, ha a biztonsági szint mindkét esetben 
0,06 haláleset millió utas kilométerenként, akkor a preferenciánk a biztonsági szint 0,13 
vagy 0.01 értéke esetében is ugyanaz lenne; és ugyanaz a függetlenség állna fenn bár- 
mely más Zaj, Költség értékpárra. Az is nyilvánvaló. hogy a Költség és a Halálesetek 
preferenciálisan függetlenek a Zaj-tól, és a Zaj és a Halálesetek preferenciálisan függet- 
lenek a Költség-től. Ekkor azt mondjuk, hogy a (Zaj, Költség, Halálesetek) kölcsönösen 
preferenciálisan függetlenek (KPF) (mutual preferential independence, MPI). A KPF 
azt állítja, hogy bár lehet, hogy mindegyik attribútum fontos, ez nem befolyásolja a többi 
attribútum közötti kompromisszumkötést. 

A kölcsönös preferenciális függetlenség olyasvalami, mint egy hosszúra sikeredett 
szókapcsolat, de a közgazdász Debreu egy figyelemre méltó tételének köszönhetően ez 
alapján az ágens értékfüggvényét nagyon egyszerű formában felírhatjuk (Debreu, 
1960): 
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Ha az XI, X,, tulajdonságok kölcsönösen preferenciátisan függetlenek, akkor az 
ágens viselkedési preferenciája leírható a következő függvény maximatizálásával: 


Von sa) EVIL) 
ahol minden egyes V; egy értékfüggvény, amely csak az X; attribútumnak a függvénye. 
Például igen valószínű, hogy a repülőtéri döntés meghozható a következő értékfügg- 
vény alapján: 


W(Zaj, Költség, Halálesetek) — — Zaj x 109 - Költség - Halálesetek x 10? 





Az ilyen típusú értékfüggvényt additív értékfüggvénynek (additíve value function) 
nevezzük. Az additív értékfüggvények egy teljesen illeszkedő módszert adnak az ágens 
értékfüggvényének a leírására, és számos valósvilág-beli helyzetben érvényesek. Még 
ha a KPF nem is teljesül teljes mértékben, ahogy ez az attribútumok szélső értékei ese- 
tén megtörténhet, egy additív értékfüggvény még mindig jó közelítését adhatja az ágens 
preferenciáinak. Ez különösen igaz, ha a KPF csupán azon attribútumtartományokban 
sérül, amelyek a gyakorlatban csak kis valószínűséggel fordulnak elő. 


Preferenciák bizonytalansággal 


Ha a tárgytartományban bizonytalanság is jelen van, a szerencsejátékok közötti prefe- 
renciákat is át kell gondolni, és a hasznosságfüggvény kiadódó tulajdonságait is meg 
kell érteni, nem csak az értékfüggvényekét. Ennek a problémának a matematikája igen 
bonyolulttá válik, ezért a főbb eredmények közül csak egyet mutatunk be, hogy érzé- 
keltessük az elérhető eredményeket. Az olvasónak a (Keeney és Raiffa, 1976) irodal- 
mat ajánljuk, ami a terület igen alapos áttekintése. 

A basznosságfüggetlenség (utility independence) alapvető fogalma a preferenciák 
függetlenségét terjeszti ki szerencsejátékokra: az attribútumok X halmaza hasznosság- 
független az attribútumok Y halmazától, ha az X attribútumokon alapuló szerencsejáté- 
kok közötti preferenciák függetlenek az Y-beli attribútumokhoz rendelt értékektől. Egy 
tulajdonsághalmaz kölcsönösen hasznosságfüggetlen (KHF) (mutually utility-inde- 
pendent, MUJ), ha minden részhalmaz hasznosságfüggetlen a többi attribútumtól. Ismé- 
telten értelmesnek tűnik feltételezni, hogy a repülőtéri építkezés attribútumai KHF-ek. 

A KHF-ből következik, hogy az ágens viselkedése leírható egy multiplikatív hasz- 
nosságfüggvénnyel (muttiplicatiíve utility function) (Keeney, 1974). A szorzatalakú 
hasznosságfüggvény általános alakját egy példán mutatjuk be három attribútum esetén. 
Az egyszerűség kedvéért, az UXX;) jelölésére az U;-t használjuk: 


U — kjUj 4 kata 4 kzUz 4 kiko Uj U2 4 kokzU2Uz 4 kak U3Uj 4 kgkokz UV U2U3 


Bár ez nem tűnik egyszerűnek, három, egyenként egyetlen attribútumhoz kapcsolódó 
hasznosságfüggvényt tartalmaz, és csupán három állandót. Általában az n attribútumot 
tartalmazó KHF-et kielégítő problémát n számú, egyetlen attribútumú hasznossággal és 
n számú állandóval lehet modellezni. Minden egyes. egyetlen attribútumot leíró hasz- 
nosságfüggvényt a többi attribútumtól függetlenül lehet megtervezni, és ez a kombiná- 
ció garantáltan előállítja a teljes preferenciarendszert. Hogy tisztán additív függvényt 
kaphassunk, további feltételek szükségesek. 
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16.5. DÖNTÉSI HÁLÓK 


Ebben az alfejezetben egy általános mechanizmust fogunk megvizsgálni a racionális 
döntések meghozatalára. A felhasznált eszközt gyakran hatásdiagramnak (influence 
diagram) hívják (Howard és Matheson, 1984), de mi a többet sugalló döntési hálók 
(decision networks) elnevezést fogjuk használni. A döntési hálók a cselekvésekhez és 
a basznosságokhoz szükséges újabb csomóponttípusok hozzáadásával továbbfejlesztett 
valószínűségi hálók. A repülőtéri elhelyezési problémát fogjuk használni példának. 


Döntési problémák reprezentálása döntési hálókkal 


Egy döntési háló a legáltalánosabb formájában az ágens jelenlegi állapotáról tartalmaz 
információkat, megadja az ágens lehetséges cselekvéseit, azt az állapotot, amit az ágens 
cselekvése eredményez, és ennek az állapotnak a hasznosságát. Tehát alapot szolgáltat 
az olyan hasznosságelvű ágensek megépítéséhez, amilyeneket a 2.4. alfejezetben vezet- 
tünk be először. A 16.5. ábra egy döntési hálót mutat a repülőtér helyszíne megválasz- 
tásának problémájához. Ez bemutatja a három felhasználásra kerülő csomóponttípust: 


5 A véletlen csomópontok (chance nodes) (ovális) valószínűségi változókat jelölnek, 
pont úgy, ahogy a valószínűségi hálókban. Az ágens lehet bizonytalan az építési 
költségekben, a légi forgalom szintjében és a pereskedés lehetősége miatt, valamint 
a Halálesetek, a Zaj és a teljes Költség változókban, amelyek mindegyike szintén 
függ a kiválasztott helyszíntől. Minden egyes véletlen csomópontnak van egy felté- 
teles valószínűségi táblája (FVT), ami a szülőcsomópontok állapotaival indexelt. 
A döntési hálókban a szülőcsomópontok lehetnek döntési csomópontok és véletlen 
csomópontok. Kiemelendő, hogy a jelenlegi-állapot véletlen csomópontok bárme- 
lyike része lehet egy nagyobb valószínűségi hálónak, ami az építkezés költségét, a 
légi forgalom nagyságát vagy a perek lehetőségét becsüli meg. 

" A döntési csomópontok (decision nodes) (négyszögek) azokat a beavatkozási pon- 
tokat reprezentálják, ahol a döntéshozónak lehetősége van a cselekvésre. Ebben az 
esetben a ReptérHelyszíne különböző értékeket vehet fel a megfontolás alatt álló 
helyszíneknek megfelelően. A választás befolyásolni fogja a kiadódó költséget, a 
biztonságot és a repülőtér által keltett zajt. Ebben a fejezetben feltételezzük. hogy 
egyetlen döntéssel foglalkozunk (azaz egyetlen ilyen csomópont létezik). A 17. fe- 
jezet tárgyalja azokat az eseteket, ahol több mint egy döntést kell meghozni. 

s A hasznosságcsomópontok (utility nodes) (rombusz) az ágens hasznosságfüggvé- 
nyét reprezentálják." A hasznosságcsomópontnak szülője az összes olyan változó, 
amelyek által leírt kimeneteli állapotok közvetlenül befolyásolják a hasznosságot. 
A hasznosságcsomóponthoz tartozik egy leírás, ami az ágens hasznosságát adja meg 
egy szülői attribútumokon definiált függvénnyel. A leírás lehet a függvény egy táb- 
lázatos megadása, vagy lehet egy parametrikus additív vagy lineáris függvény. 


9 Ezeket a csomópontokat gyakran értékcsomópontoknak (value nodes) nevezik az irodalomban. Mi jobb- 
nak láttuk megtartani a különbséget a hasznosság- és az értékfüggvények között, ahogyan ezt korábban índo- 
koltuk, ezért lehet, hogy a kimeneti állapot egy szerencsejátékot reprezentál. 
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E 


16.5. ábra. Egy egyszerű döntési hálózat a repülőtér-elhelyezési problémára 


Sok esetben csupán egy egyszerűsített formát használunk. A jelölés ugyanaz marad, de 
az a véletlen csomópont, ami a kimeneti állapotot jelöli, elmarad. Ehelyett, a hasznos- 
ságcsomópontot közvetlenül a jelenlegi állapot csomópontokhoz és a döntési csomó- 
ponthoz kötik. Ebben az esetben a hasznosságcsomópont ahelyett, hogy az állapotokon 
definiált hasznosságfüggvényt reprezentálná, az egyes cselekvésekre vonatkozó várha- 
tó hasznosságokat reprezentálja, ahogy azt a (16.1) egyenlet definiálja. Ezért az ilyen 
táblákat cselekvéshasznosság tábláknak (action-utility tables) nevezzük. A 16.6. áb- 
ra a repülőtér probléma cselekvéshasznosság-reprezentációját mutatja. 

Láthatjuk, hogy mivel a Zaj, a Halálesetek és a Költség véletlen csomópontok a 16.5. 
ábrán a jövőbeli állapotokra vonatkoznak, ezek soha nem kaphatnak értéket, mint tény- 
változók. Így az egyszerűsített verzió, amiből elhagytuk ezeket a csomópontokat, minden 
olyan esetben használható, amikor az általánosabb forma használható. Bár az egyszerűsí- 
tett forma kevesebb csomópontot tartalmaz, az elhelyezés kimeneteleihez kapcsolódó 
közvetlen leírások elhagyása azt eredményezi, hogy kevésbé rugalmas a körülmények 
esetleges változásaira. Például a 16.5. ábrán a repülőgép zajszintjében bekövetkező vál- 
tozást a Zaj csomópont feltételes valószínűségi táblájának megfelelő megváltoztatásá- 
val lehet modellezni, ezzel szemben a zajszennyezés fontosságának a megváltozását a 
hasznosságfüggvényben a hasznosságtábla megváltoztatásával modellezhetjük. Másfe- 
lől a cselekvéshasznosság diagramban — 16.6. ábra — létrejövő minden ilyenfajta változ- 
tatást a cselekvéshasznosság táblázat megváltoztatásának kell tükröznie. Lényegében 
a cselekvéshasznosság forma az eredeti forma egy szerkesztett verziója. 


Döntési hálók kiértékelése 


A cselekvéseket úgy választjuk ki, hogy a döntési hálót kiértékeljük a döntési csomó- 
pont minden lehetséges beállítására. Ha egyszer a döntési csomópontot beállítottuk, 
úgy fog viselkedni. mint egy véletlen csomópont, amit egy tényváltozónak állítottunk 
be. A döntési háló kiértékelését a következő algoritmus végzi: 
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ReptérHelyszíne 


16.6. ábra. A repülőtér-elhelyezési probléma egy egyszerűsített reprezentációja. A kimeneti állapotok- 
hoz tartozó véletlen csomópontok hatását kiszámítottuk, majd a csomópontokat elhagytuk. 


1. Állítsa be a tényváltozókat a jelenlegi állapotra. 
2. A döntési csomópont minden egyes értékére: 
(a) Állítsa be a döntési csomópontot erre az értékre. 
(b)  Számítsa ki az a posteriori valószínűségeket a hasznosságcsomópont szüleire, 
egy szabványos valószínűségi következtető algoritmust használva. 
(c)  Számítsa ki a cselekvés hasznosságát. 
3. Térjen vissza a legnagyobb hasznosságértékkel. 


Ez a valószínűségi hálók következtető algoritmusának egy nyilvánvaló kiterjesztése, és 
közvetlenül beilleszthető az ágens 13.1. ábrán megadott tervezésébe. A 17. fejezetben 
látni fogjuk, hogy több egymást követő cselekvés lehetősége a problémát sokkal érde- 
kesebbé teszi. 


16.6. AZ INFORMÁCIÓ ÉRTÉKE 


Az előző elemzésben feltételeztük, hogy minden lényeges információ, de legalábbis 
minden elérhető információ az ágens rendelkezésére áll. Gyakorlatban ez aligha történ- 
het meg. A döntéshozatal egyik legfontosabb része, hogy tudjuk, milyen kérdést kell fel- 
tenni. Például az orvos nem várhatja el, hogy rendelkezésére álljon minden lehetséges 
diagnosztikai teszt és kérdés eredménye, amikor a páciens először belép a rendelőbe." 
A tesztek gyakran költségesek és néha veszélyesek (mind közvetlenül, mind az általuk 
okozott késedelmek miatt). A fontosságuk két tényezőn múlik: egyrészt azon, hogy je- 
lentősen jobb kezelés válik-e lehetővé a teszteredmények alapján, másrészt a különbö- 
ző teszteredmények valószínűségén. 


5 Az Egyesült Államokban az egyetlen kérdés, amit ez előtt mindig megkérdeznek, hogy a páciensnek van-e 
biztosítása. 
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Ez az alfejezet az információérték-elmélettel (information value theory) foglalko- 
zik, ami lehetővé teszi az ágens számára annak kiválasztását, hogy milyen információt 
szerezzen meg. Az információ megszerzése érzékelési cselekvésekkel (sensing action) 
történik, ahogy a 12. fejezetben leírtuk. Mivel az ágens hasznosságfüggvénye ritkán 
vonatkozik az ágens belső állapotaira, jóllehet az érzékelési cselekvés célja a belső álla- 
pot megváltoztatása, ezért az érzékelési cselekvéseket az ágens ezt követő műveleteire 
gyakorolt hatása alapján kell kiértékelnünk. Az információérték-elmélet ezért a több- 
lépcsős döntéshozatal egy speciális fajtája. 


Egy egyszerű példa 


Tételezzük fel, hogy egy olajtársaság egy tengeri fúróhely létesítésére szeretne jogokat 
vásárolni, n darab megkülönböztethetetlen terület közül választva. Tételezzük továbbá 
fel, hogy kizárólag csak az egyik terület tartalmaz olajat C dollár értékben, és hogy a 
területek ára C/n dollár. Ha a társaság kockázatsemleges, akkor közömbös lesz számá- 
ra, hogy vásárol-e területet, vagy sem. 

Most tételezzük fel, hogy a szeizmológusok felkínálják a 3-as számú területre vonat- 
kozó kutatásaik eredményét a társaságnak, ami világosan megmutatja, hogy a terület 
tartalmaz-e olajat, vagy sem. Mennyit legyen hajlandó fizetni a társaság ezért az infor- 
mációért? E kérdés megválaszolásának az a módja. hogy megvizsgáljuk. hogy mit tenne 
a társaság, ha meglenne az információja: 


s. 1/n valószínűséggel a 3-as terület felmérése azt fogja mutatni, hogy a terület tartal- 
maz olajat. Ebben az esetben a társaság megvásárolja a 3-as területet C/n dollárért, 
és nyeresége C — C/n — (n - DC/n dollár lesz. 

.  (1— 1)/n valószínűséggel a felmérés azt fogja mutatni, hogy a terület nem tartalmaz 
olajat, amely esetben a társaság egy másik területet vásárol meg. Ekkor az olajterü- 
let eltalálásának a valószínűsége a többi mező között 1/n-ről 1/(n — 1)-re változik, 
így a társaság várható nyeresége C/(n — 1) - C/n - C/n(n — 1) dollár lesz. 


Most már kiszámíthatjuk a várható nyereséget, ha ismerjük a kutatás eredményét: 


141-DC n-L CC en 

n n n n(n—-b) 
Tehát a társaságnak hajlandónak kell lennie, hogy akár C/n dollárt fizessen a szeiz- 
mológusnak az információért: az információ annyit ér, mint maga a terület. 

Az információ értéke abból a tényből származik, hogy az információval valaki az 
aktuális helyzetben sokkal alkalmasabb cselekedeteket tud megválasztani. Az informá- 
cióval lehetségessé válik a helyzetek megkülönböztetése, ezzel szemben az információ 
nélkül a lehetséges helyzetek feletti átlagot nézve kell cselekedni. Általánosan fogal- 
mazva, az információ értékét a várható értékek különbsége definiálja az információ 
megszerzése előtt és után. 
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Egy általános képlet 


Az információ értékére egyszerű általános formulát adni. Rendszerint feltesszük, hogy pon- 
tos bizonyítékaink vannak egyes E; valószínűségi változók értékeiről, így a teljes informá- 
ció értéke (value of perfect information) (TTÉ) elnevezést használjuk.§ Legyen az ágens 
jelenlegi tudása E. Ekkor az a: pillanatnyi legjobb cselekvés értékét a következő definiálja: 


EU(ajE) — max DJ U(Eredmény (A))P(Eredmény (A) ITesz(A), E) 
űj 


és a legjobb cselekvés értéke (az E; új bizonyíték megszerzése után) 
EU(ox JE, E;) - max 3 U(Eredmény (A)pP(Eredmény (A)ITesz(A), E, E) 
[/ 


De E; egy valószínűségi változó, aminek az értéke jelenteg nem ismert, így átlagolnunk 
kell az összes lehetséges ej értékre, amelyeket E; értékeként az Ej-re vonatkozó jelen- 
legi hiedelmünket felhasználva megkaphatunk. Az E; megszerzésének értékét a követ- 
kezőképpen definiáljuk: 


TIÉ(Ej) — DP(Ej- KIEJEUtos, JE,Ej eg) EU(alE) 


A formula megértése érdekében gondoljuk át azt az egyszerű esetet, mikor csak két 
cselekvés, A, és Az közül lehet választani. A cselekvések jelenleg várható hasznosságai 
Uj és U2. Az E; információ új várható hasznosságokat. Uf-et és U3-t fog eredményez- 
ni a cselekvésekre, de E; megszerzése előtt már ismerjük a függetlennek feltételezett 
Uj és U; lehetséges értékeinek valószínűség-eloszlásait. 

Tegyük fel, hogy Aj és Az két különböző utat jelent a hegyeken keresztül, téli idő- 
ben. A, egy kényelmes, egyenes autópálya egy alacsony hágón át, míg A; egy tekervé- 
nyes földút a csúcson keresztül. Csak ezt az információt ismerve Az egyértelműen 
előnyben részesíthető, mivel elég valószínű, hogy a második utat lavinák zárják le, mi- 
közben az első úton valószínűleg nincsenek torlódások. U) ezért egyértelműen na- 
gyobb. mint (9. Az utak aktuális állapotáról Ej műholdjelentéseket kaphatunk. melyek 
UI és UZ új várható értékeket adnak az átkelőkre vonatkozóan. A várható hasznosság- 
értékek eloszlását a 16.7. (a) ábra mutatja. Nyilvánvalóan ebben az esetben a költségek 
miatt nem éri meg a műholdas jelentéseket kikérni, mivel nagyon valószínűtlen, hogy 
ezek a jelentések a terv megváltozását eredményeznék. A tervek változatlansága mel- 
lett azonban az információnak nincs értéke. 

Most tételezzük fel, hogy két, kissé eltérő hosszúságú kanyargós földút közül válasz- 
tunk, és súlyosan sérült utasokat viszünk. Ekkor bár lehet, hogy U) és U2 elég közel 
esnek egymáshoz, az Uj és U3 széles tartományon belül vehetnek fel értékeket. Jelen- 
tős esélye van annak, hogy a második út tiszta lesz, míg az első le lesz zárva, és ebben 
az esetben a hasznosságok különbsége nagyon nagy lesz. A TIÉ formula azt jelzi, hogy 
a műholdjelentéseket megéri kikérni. Ezt a helyzetet a 16.7. (b) ábra mutatja. 

Tételezzük most azt fel, hogy nyári időben választunk a két földút közül, amikor 
a lavinák igen valószínűtlenek. Ebben az esetben a műholdjelentések azt mutathatják, 





§ Egy X változóra vonatkozó nem teljes információt modellezhetünk egy Y változóról szóló teljes informá- 
cióval, ahol az F változó valószínűségi kapcsolatban van X-szel. Erre ad példát a 16.11. feladat. 
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P(UIE) P(UIE) P(UIEp 





[/A UV U. ÚU, 
(a) b (c) 
16.7. ábra. Három általános eset az információ értékére. Az (a) esetben A, majdnem teljes bizonyosság- 
gal jobb marad A2-höz képest, így az információ nem szükséges. A (b) esetben a választás nem egyértel- 
mű, és az információ döntő fontosságú. A (c) esetben a választás bizonytalan, de igazából nem számít, 
így az információ is kevésbé értékes. 


hogy az egyik útvonal látványosabb, mint a másik, a virágzó hegyi rétek miatt, vagy 
talán csak nedvesebb az arra kanyargó patakok miatt. Ekkor igen valószínű, hogy ha 
megkapjuk ezt az információt, megváltoztatjuk a tervünket. Azonban ebben az esetben, 
a különbség a két út között még mindig igen kicsi, így nem foglalkozunk a jelentések 
megszerzésével. Ezt a helyzetet a 16.7. (c) ábra mutatja. 

Összegzésül azt mondhatjuk, hogy az információnak annyiban van értéke, amennyire 
valószínű, hogy a terv megváltozását okozza, és amennyire az új terv jelentősen jobb 
lesz, mint a régi. 


Az információ értékének tulajdonságai 


Érdekes kérdés, hogy lehetséges-e az, hogy az információ káros — lehet-e az információ- 
nak negatív várható értéke? Az a megérzésünk, hogy ez lehetetlen. Végül is legrosszabb 
esetben az információ egyszerűen figyelmen kívül hagyható, és úgy tehetünk, mintha 
soha nem kaptuk volna meg. Ezt igazolja a következő tétel, ami bármely döntéselméleti 
ágensre alkalmazható. Az információ értéke nem negatív: 


vj, E TIÉED 20 
A tétel közvetlenül következik a TIÉ definíciójából, a bizonyítást gyakorló feladatként 
az olvasóra bízzuk (16.12. feladat). Fontos emlékezni arra, hogy a TIÉ a jelenlegi infor- 
mációs állapottól függ, ezért szerepel ez az alsó indexben. Ez megváltozhat, amint több 
információt szerzünk. Szélsőséges esetben nulla is lehet, ha a kérdéses változó értéke 
már ismert. Így a TIÉ nem additív. Azaz 

TIÉF(E;, Ex) 7 TIÉAE) 4 TIÉEp (általánosságban) 
Azonban a TTÉ sorrendfüggetlen, aminek intuitíve nyilvánvalónak kell lennie. Azaz, 

TIÉF(E;, Ex) — TIÉR(Ep) 4 TIÉz, E (Ep — TIÉF (Ep -- TIÉK, F(Ep) 


A sorrendfüggetlenség megkülönbözteti az érzékelési és ahagyományos cselekvéseket, 
és egyszerűsíti egy érzékelési cselekvéssorozat értékének a kiszámítását. 
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Egy információgyűjtő ágens megvalósítása 


Egy értelmes ágensnek a felhasználóhoz ésszerű sorrendben kell kérdéseket intéznie, 
nem szabad lényegtelen kérdéseket feltennie, az információ fontosságát a költségéhez 
kell viszonyítania, és a megfelelő ponton abba kell hagynia a kérdezősködést. Mindezen 
képességek elérhetők az információérték használatának a segítségével. 

A 16.8. ábra egy olyan ágens teljes vázát mutatja, ami mielőtt cselekedne, képes 
intelligensen információkat gyűjteni. Időlegesen tétetezzük fel, hogy minden megfígyel- 
hető E; tényváltozóhoz létezik egy hozzárendelt költség, Költség(E). ami a bizonyíték 
tesztek, tanácsadók, kérdések és bármi egyéb módszer segítségével ! történő megszerzé- 
sének a költsége. Az ágens a legértékesebb információt kéri el, a költségeket is figye- 
lembe véve. Feltételezzük, hogy a Kérés(E;) cselekvés eredménye az, hogy a következő 
érzéketés az ő értéket szolgáltatja. Ha nincs olyan megfigyelés, ami megérné a költsé- 
gét, az ágens egy nem információgyűjtő cselekvést választ ki. 





fonction INFORMÁCIÓ-GYŰJTŐ-ÁGENS[ észlelés) returns egy műveler 
static: D, egy döntési hálózat 


olvassuk az észlelést a D döntési hálóba 


j — TIÉ(EJ-t maximalizáló érték - Költség(Ej) 
ir TIE 5 5 Költség(Ep) 
then return KÉRDEZ(E) 
else return a D-beli legjobb művelet 





16.8. ábra. Egy egyszerű információgyűjtő ágens váza. Az ágens folyamatosan a legnagyobb informá- 
cióértékű megfigyelést választja, mindaddig. amíg a következő megfigyelés költsége kisebb, mint a vár- 
ható haszna. 


Az itt megadott ágens az információgyűjtés úgynevezett rövidlátó (myopic) formáját 
valósítja meg. Ez azért van, mert az ágens a 7IÉ formulát rövidlátó módon használja, 
azaz úgy számítja ki az információ értékét, mintha csak egyetlen tényváltozót szerezne 
meg. Ha nincsen olyan tényváltozó, ami sokat segítene, lehet, hogy a rövidlátó ágens 
kapkodó módon belekezd egy cselekvésbe, pedig jobb lett volna előbb lekérdezni két 
vagy három változót, és csak aztán cselekedni. A rövidlátó szabályozás ugyanazon a 
heurisztikán alapul, mint a mohó keresés, és a gyakorlatban gyakran jól működik. (Pél- 
dául kimutatták, hogy diagnosztikai tesztek kiválasztásában jobb a teljesítménye, mint 
az orvosszakértőknek.) Azonban egy teljesen racionális információgyűjtő ágensnek 
végig kell gondolnia az összes lehetséges információkérés-szekvenciát, ami egy külső 
akcióban végződik, és ezeknek a kéréseknek az összes lehetséges kimenetelét. Mivel a 
második kérés értéke függ az első kérés kimenetelétől, az ágensnek fel kell derítenie 
a feltételes tervek terét, amint azt a 12. fejezetben leírtuk. 
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Az 1950-es és az 1960-as években kifejlődött döntéselemzés (decision analysis) a 
döntéselmélet alkalmazását tanulmányozza konkrét döntési problémákon. Fő alkalmazá- 
si területe a kiemelt fontosságú területeken meghozandó döntések segítése, ahol a tétek 
igen nagyok, ilyen területek például az üzleti élet, a kormányzati munka, a törvényho- 
Zás, a katonai stratégia, az orvosi diagnosztika és a közegészségügy, a mérnöki tervezés 
és az erőforrás-gazdálkodás. A folyamat magában foglalja a lehetséges cselekvések és 
kimenetelek gondos tanulmányozását csakúgy, mint a kimenetelek közötti preferenciá- 
két. A döntéselemzésben hagyományosan két szerepet tételeznek fel: a döntéshozó 
(decision maker) a kimenetelek közötti preferenciákat határozza meg, a döntéselem- 
ző (decision analyst) pedig a lehetséges cselekvéseket, kimeneteleket veszi számba, és 
kikérdezi a preferenciákat a döntéshozótól, hogy meghatározza a legjobb cselekvést. 
Az 1980-as évek elejéig a döntéselemzés célját abban látták, hogy az embereket segít- 
sék olyan döntések meghozatalában, amik a tényleges preferenciáiknak felelnek meg. 
Manapság egyre több és több döntési folyamat automatizált, és a döntéselemzést annak 
biztosítására használják, hogy az automatizált folyamatok megfelelően alakuljanak. 

Ahogy erről a 14. fejezetben szóltunk, a korai szakértői rendszerekkel kapcsolatos 
kutatás inkább kérdések megválaszolására irányult, mint döntések meghozatalára. 
Azok a rendszerek, amelyek cselekvéseket javasoltak a véleménynyilvánítás helyett, 
valójában ha-akkor szabályokkal érték ezt el, nem pedig a kimenetelek és preferenci- 
ák közvetlen reprezentációjával. A valószínűségi hálók megjelenése az 1980-as évek 
vége körül azonban lehetővé tette olyan nagy rendszerek megépítését, amelyek helyes 
valószínűségi következtetéseket származtattak a tényekből. A döntési hálók megje- 
lenése azt jelentette, hogy olyan szakértői rendszereket lehet kifejleszteni, amelyek 
optimális döntéseket javasolnak a felhasználó preferenciáinak és az elérhető tények- 
nek megfelelően. 

Egy rendszer, ami a hasznosságokat közvetlenül tartalmazza, elkerülheti a tanácsadói 
folyamatok egy gyakori csapdáját: a valószínűség és a fontosság összekeverését. Meg- 
szokott módszer volt például a korai orvosszakértői rendszerekben, hogy a lehetséges 
diagnózisokat a valószínűségük alapján sorba állították, és a legvalószínűbbet jelentet- 
ték. Sajnos ez végzetes lehet! Általában a páciensek többségénél a két legvalószínűbb 
diagnózis többnyire az, hogy , semmi baj sincs" és , megfázott", ha azonban a harma- 
dik legvalószínűbb diagnózis egy páciensnél a tüdőrák, az már aggodalomra ad okot. 
Nyilvánvaló, hogy a teszteknek és a kezeléseknek mind a valószínűségektől, mind a 
hasznosságoktól kell függeniük. 

A következőkben leírunk egy döntéselméleti szakértői rendszerhez tartozó tudásmér- 
nöki folyamatot. Példaként egy orvosi problémát ismertetünk, amiben kezeléseket kell 
megválasztani bizonyos veleszületett szívrendellenességek esetén (Lucas, 1996). 

A gyermekek 0.8 százaléka szívrendellenességgel születik, ami többnyire aortaszűkü- 
let (aortic coarctation). Ez a rendellenesség sebészi beavatkozással, érműtéttel! (kitágít- 
ják az aortát egy ballont helyezve az artériába) vagy gyógyszerrel kezelhető. A feladat a 
kezelés megválasztása és annak eldöntése, hogy mikor végezzék el: minél fiatalabb egy 
gyermek, annál nagyobb a kockázata bizonyos kezeléseknek, de túl sokáig sem szabad 
várni. A problémához egy döntéselméleti szakértői rendszer készíthető egy olyan csapat- 
tal, amelynek legalább egy orvosszakértő (egy gyermekkardiológus) és egy tudásmérnök 
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tagja van. A folyamat a következő lépésekre bontható (amelyek összehasonlíthatók a lo- 
gikai rendszerek tervezésének lépéseivel a 8.4. alfejezetben). 

Alkosson meg egy oksági modellt. Határozza meg a lehetséges tüneteket, rendelle- 
nességeket, kezeléseket és kimeneteleket. Aztán jelezze közöttük haladó nyilakkal, 
hogy melyik rendellenesség milyen tüneteket okozhat, és melyik kezelés milyen rend- 
ellenességekre hatásos. Ezek egy része a tárgyterületi szakértő számára ismert lesz, más 
részük a szakirodalomból származhatnak. Gyakran a modell jól fog illeszkedni a szak- 
könyvek leírásaiban szereplő informális diagramokhoz. 

Egyszerűsítse a kvalitatív döntési modellt. Mivel a modellt kezelések közötti vá- 
lasztásra tervezzük használni, és nem más célokra (mint például bizonyos rendellenes- 
ségek/tünetek kombinációihoz rendelhető együttes valószínűiségek kiszámítására), így 
gyakran elhagyhatunk változókat, amelyek nem befolyásolják a kezelések megválasztá- 
sát. Gyakran a változókat fel kell bontani vagy össze kell olvasztani, hogy megfeleljen a 
szakértő gondolkodásmódjának. Például az eredeti aortaszűíkületi modellben szerepelt 
egy Kezelés változó műtét, érsebészet vagy gyógyszeres kezelés értékekkel, és egy önálló 
változó a kezelés Időzítés-ére. Azonban a szakértőnek nehéz volt ezeket külön kezelni, 
ezért össze kellett olvasztani, így a Kezelés olyan értékeket vehet fel, mint műtét egy hó- 
napon belül. Ezt a modellt mutatja be a 16.9. ábra. 

Rögzítse a valószínűségeket. A valószínűségek betegek adatbázisából, szakirodalmi 
tanulmányokból vagy szakértők szubjektív becsléseiből származhatnak. Azokban az ese- 
tekben, amikor nem megfelelő formában érhetők el a szakirodalomban a valószínűségek, 
akkor Bayes-szabállyal és vetítéssel számíthatjuk ki a kívánt értékeket. Bebizonyosodott, 
hogy a szakértők leginkább egy ok hatásának a valószínűségét tudják megbecsülni (pél- 
dául P(nehézlégzéslszívelégtelenség) sokkal inkább, mint a másik irányban. 

Rögzítse a hasznosságokat. Kevés számú kimenetel esetén ezek felsorolhatók és 
egyenként kiértékelhetők. Meghatározhatunk egy skálát a legrosszabbtól a legjobb 
kimenetelig, mindegyikhez egy numerikus értéket rendelve, például —1000-et az elha- 
lálozáshoz és 0-t a teljes felépüléshez. Ekkor a többi kimenetel már ezen a skálán elhe- 
lyezhető. Ezt elvégezheti egy szakértő, de jobb, ha a betegek (vagy gyermekek esetén 
a szüleik) is részt vesznek ebben, mivel a különböző embereknek különböző preferen- 
ciáik vannak. Exponenciálisan sok kimenetel esetén szükségünk van olyan módszerekre, 
hogy többattribútumú hasznosságfüggvényekke! kombinálhassuk őket. Például feltehet- 
jük. hogy a különböző komplikációk negatív hasznossága additív. 

Ellenőrizze és finomítsa a modellt. A rendszer kiértékeléséhez szükségünk van 
helyes (bemenet, kimenet) párokra; az úgynevezett referenciákra (gold standard), ami- 
hez lehet hasonlítani. Ez orvosszakértő rendszerek esetén azt jelenti, hogy összehívjuk 
az elérhető legjobb orvosszakértőket, néhány beteg esetét megmutatjuk nekik, diagnó- 
zis felállítására és kezelési javaslat meghatározására kérjük őket. Majd megnézzük, 
hogy a rendszer mennyire illeszkedik a javaslataikhoz. Ha csak kevéssé, akkor megpró- 
báljuk a rosszul teljesítő részeket azonosítani és megjavítani. Hasznos lehet a rendszert 
, visszafelé" tesztelni. Ahelyett hogy a rendszerbe a tüneteket vinnénk be, és diagnózist 
kérnék, vigyük be a diagnózist, mint például szívelégtelenség, és vizsgáljuk meg a tü- 
netek, mint például szapora szívverés, jósolt valószínűségeit, és hasonlítsuk ezt össze 
szakirodalmi adatokkal. 

Végezzen érzékenységvizsgálatot. Ez a fontos lépés azt ellenőrzi, hogy a legjobb 
döntés érzékeny-e a megadott valószínűségek és hasznosságok kis változására, ehhez 
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16.9. ábra. Az aortaszűkület hatásdiagramja (Peter Lucas hozzájárulásával) 


szisztematikusan változtassuk meg ezeket a paramétereket, és futtassuk le a kiértékelést 
újra. Ha kis változások jelentősen eltérő döntést eredményeznek, akkor lehet, hogy 
megéri több energiát rászánni, hogy pontosabb adatokat gyűjtsünk. Ha minden változ- 
tatás ugyanahhoz a döntéshez vezet, akkor a felhasználó biztos lehet, hogy ez a helyes 
döntés. Az érzékenységvizsgálat különösen fontos lehet, mivel az egyik fő kritikája a 
szakértői rendszerek valószínűségi megközelítésének, hogy nagyon nehéz a szükséges 
numerikus valószínűségek megbecslése. Az érzékenységvizsgálat gyakran kimutatja, 
hogy sok numerikus értéket elég közelítőleg meghatározni. Például bizonytalanok lehe- 
tünk a P(tachycardia) a priori valószínűségben, de ha kipróbálunk különböző értékeket 
erre a valószínűségre, és minden egyes esetben a javasolt cselekmény a hatásdiagram 
alapján ugyanaz, akkor kevésbé kell foglalkoznunk ezzel az ismerethiánnyal. 
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Ez a fejezet megmutatta, hogy hogyan kombinálhatjuk össze a hasznosságelméletet a 
valószínűségekkel, lehetővé téve az ágensnek olyan cselekvések kiválasztását, amelyek 
maximalizálni fogják a várható teljesítményét. 


s A valószínűség-elmélet (probability theory) előírja, hogy az ágens a tényei alap- 
ján milyen hiedelmekkel rendelkezzen, a hasznosságelmélet (utility theory) azt írja 
elő, hogy az ágens mit akar, a döntéselmélet (decision theory) pedig összeilleszti a 
kettőt, és előírja, hogy az ágens mit tegyen. 

s A döntéselmélet felhasználásával építhetünk egy olyan rendszert, ami a döntések 
meghozatalakor figyelembe veszi az összes lehetséges cselekvést, és azt választja ki, 
ami a legjobb várható kimenetelt adja. Egy ilyen rendszert racionális ágensnek 
(rational agent) nevezhetünk. 

s A hasznosságelmélet megmutatja, hogy az ágens, amelynek szerencsejátékok közötti 
preferenciái eleget tesznek bizonyos egyszerű axiómáknak, leírható egy hasznosság- 
függvénnyel; továbbá az ágens a cselekvéseit úgy választja meg, mintha a várható 
hasznosságát maximalizálná. 

§ A többattribútumú hasznosságelmélet (multiattribute utility theory) olyan 
hasznosságokkal foglalkozik, amelyek az állapotok több, különböző attribútumától 
függnek. A sztochasztikus dominancia (stochastic dominance) egy különösen 
hasznos technika egyértelmű döntések meghozatalára még az attribútumok pontos 
hasznosságértékei nélkül is. 

s A döntési hálók (decision networks) egy egyszerű formalizmust biztosítanak a dön- 
tési problémák leírására és megoldására. Ezek a valószínűségi hálók magától értetődő 
kiterjesztései döntési és hasznossági csomópontokkal a véletlen csomópontokon túl. 

s Bizonyos esetekben a probléma megoldásához hozzátartozik a többletinformáció 
megszerzése a döntés meghozatala előtt. Az információ értékét (value of informa- 
tion) úgy definiáljuk, mint a várható hasznosság javulását az információ nélküli 
helyzethez hasonlítva. 

s Azok a szakértő rendszerek (expert systems), amelyek hasznosságinformációkat 
is tartalmaznak, többletképességgel rendelkeznek a tisztán következtető rendszerek- 
hez képest. Azon túl, hogy döntéseket tudnak hozni, dönthetnek az információ meg- 
szerzéséről annak értéke alapján, és kiszámíthatják döntéseiknek a valószínűségek 
és hasznosságok kis megváltozására vonatkozó érzékenységét. 


Irodalmi és történeti megjegyzések 


A maximális várható hasznosság elvének az egyik legkorábbi, bár végtelen hasznossá- 
gokat is tartalmazó szokatlan alkalmazása Pascal fogadása volt, melyet először mint a 
Port-Roval Logic egy részét Arnauld közölt (Arnauld, 1662). Daniel Bernoulli volt az 
első, a szentpétervári paradoxont vizsgálva, aki felismerte a szerencsejátékokra vonat- 
kozó preferenciák felmérésének a fontosságát, megállapítva, hogy ,egy dolog értékét 
nem az árának kell meghatároznia, hanem a hasznosságának, amit eredményez" 
(Daniel Bernoulli, 1738, eredeti kiemelés). Jeremy Bentham javasolta a hedonisztikus 
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kalkulust (hedonistic calculus) az , örömök" és , bánatok" összehasonlítására. amellett 
érvelve, hogy minden döntésnek (nem csak a pénzügyieknek) redukálhatónak kell len- 
nie hasznosságok összehasonlítására (Bentham, 1823). 

A numerikus hasznosságok származtatása a preferenciákból Ramseynél jelent meg 
először (Ramsey, 1931); a jelenlegi szövegben a preferenciákra megadott axiómák 
megfogalmazásukban közelebb állnak azokhoz az axiómákhoz, amelyek egy újrafelfe- 
dezés során a Theory of Games and Economic Behaviorben (Neumann és Morgenstern, 
1944) jelentek meg. Ezeknek az axiómáknak kiváló bemutatását adja Howard a kocká- 
Zatpreferenciák tárgyalása során (Howard, 1977). Ramsey szubjektív valószínűségeket 
(nem pontosan hasznosságokat) vezetett le az ágens preferenciáiból; mostanában 
Savage és Jeffrey vitt végbe hasonló konstrukciót (Savage, 1954; Jeffrey, 1983). Von 
Winterfeldt és Edwards modernebb szempontból ismerteti a döntéselemzést és annak 
az emberi preferenciastruktúrákkal való kapcsolatát (Von Winterfeldt és Edwards, 1986). 
A mikrohalál hasznosságmértéket Howard elemzi (Howard, 1989). Az Economist egy 
1994-es felmérése egy emberi élet értékét 750 000 és 2,6 millió dollár közzé teszi. 
Azonban Richard Thaler irracionális variánsokat talált arra nézve, hogy mennyit hajlan- 
dó valaki fizetni, hogy elkerüljön egy halálos kockázatot, ahhoz képest, hogy mennyiért 
hajlandó felvállalni ugyanazt a kockázatot. 1/1000 esély esetén a válaszadó maximum 
200 dollárt fizetne, hogy elkerülje a kockázatot. míg 50,000 dollárért sem hajlandó fel- 
vállalni ezt a kockázatot (Thaler, 1992). 

A OALY-t sokkal szélesebb körben használták orvosi és társadalmi döntések meg- 
hozatalánál, mint a mikrohalált, lásd (Russell, 1990), ami jellemző példája azoknak az 
érveléseknek, hogy a OALY-t használó várható hasznosság növekedésének alapján a 
közegészségügyben alapos változtatásokra van szükség. 

A Decisions with Multiple Objectives: Preferences and Value Tradeofjfs (Keeney és 
Raiffa, 1976) c. könyv részletes bevezetést ad a többattribútumú hasznosságelméletbe. Ez 
olyan módszerek korai számítógépes megvalósítását írja le, amelyekkel a többattribútumú 
hasznosságfüggvényhez a szükséges paraméterek kikérdezhetők, és hosszasan tárgyalja az 
elmélet valós alkalmazásait. Az MI-n belül a legelső hivatkozás az MVH elvre Wellman 
cikke volt (Wellman, 1985), amely egy URP-nek (Utility Reasoning Package) nevezett 
rendszert tartalmaz, ami képes kezelni a preferenciák függetlenségéről és feltételes függet- 
lenségéről szóló állításokat, hogy elemezze a döntési probléma struktúráját. A sztochaszti- 
kus dominanciát a kvalitatív valószínűségi modelle! Wellman vizsgálta alaposan (Well- 
man, 1988; 1990a). Wellman és Doyle egy előzetes vázlatát adja annak, hogy hogyan lehet 
felhasználni hasznosság-függetlenség relációk komplex halmazát a hasznosságfüggvény 
strukturált modelljének megalkotásához, hasonlóan ahhoz, ahogyan a valószínűségi háló 
az együttes valószínűségeloszlás-függvény strukturált modelljét adja (Wellman és Doyle, 
1992). Bacchus és Grove, valamint La Mura és Shoham további eredményeket közöl ez- 
Zel kapcsolatban (Bacchus és Grove, 1995; 1996; La Mura és Shoham, 1999). 

A döntéselmélet már az 1950-es évek óta szabványos eszköz a közgazdaságtanban, 
a pénzügyben és a menedzsment tudományban. Az 1980-as évekig az egyszerű dönté- 
si szituációk reprezentálására a döntési fák voltak a fő eszközök. A döntési hálókat 
vagy hatásdiagramokat Howard és Matheson vezette be (Howard és Matheson, 1984), 
bár a szükséges fogalmakat már korábban kifejlesztette egy csoport (benne Howard és 
Matheson) az SRI-nél (Miller és társai, 1976). Howard és Matheson eljárása azonban 
egy közbenső lépést, a döntési hálónak egy döntési fára történő átírását tartalmazta, 
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ahol általános esetben a fa exponenciális méretű volt. Shachter kifejlesztett egy eljárást, 
ami közvetlenül a döntési hálókon alapult anélkül, hogy egy közbeeső döntési fát hoz- 
na létre (Shachter, 1986). Ez az algoritmus volt az első, amely teljes következtetést tu- 
dott elvégezni többszörösen összekötött Bayes-hálókban. Egy mostani munkában Nilsson 
és Lauritzen összekapcsolta a döntési hálókhoz tartozó algoritmusokat a Bayes-hálóknál 
kifejlesztett klaszterezési algoritmusokkal (Nilsson és Lauritzen, 2000). Oliver és Smith 
gyűjteménye számos hasznos cikket tartalmaz a döntési hálókról, mint ahogy a Nerworks 
folyóirat 1990-es különkiadása is hasznos cikkekből áll (Oliver és Smith, 1990). Dön- 
tési hálókról és hasznosságmodellezésről szóló cikkek a Management Science-ben is 
rendszeresen megjelennek. 

Az információérték-elméletet Ron Howard elemezte először (Howard, 1966). Ez a 
cikke a következő megjegyzéssel ér véget: , Ha az információérték-elmélet és a hozzá 
kapcsolódó döntéselméleti struktúrák a jövőben nem képezik igen nagy részét a mérnö- 
kök képzésének, akkor a mérnöki szakma azt fogja látni, hogy hagyományos szerepét, 
a tudományos és közgazdasági erőforrásoknak az emberiség előnyére történő kezelését, 
egy másik szakma elorozta." A hivatkozott forradalom a vezetési módszerekben a mai 
napig nem következett be, bár ez változhat amint az információérték-elmélet felhaszná- 
lása a bayesi szakértő rendszerekben elterjedtebbé válik. 

Az orvosi döntéseknél történő korai alkalmazásoktól eltekintve meglepően kevés 
MI-kutató alkalmazta a 13. fejezetben tárgyalt döntéselméleti eszközöket. A kevés ki- 
vételek egyike Jerry Feldman volt, aki a döntéselméletet a látás problémájára (Feldman 
és Yakimovsky, 1974) és a tervkészítés problémájára (Feldman és Sproull, 1977) alkal- 
mazta. Az 1980-as években aztán hirtelen újra megnőtt az érdeklődés az MI részéről a 
valószínűségi módszerek iránt, a döntéselméleti szakértő rendszerek széles körben el- 
terjedtekké váltak (Horvitz és társai, 1988) - valójában 1991-től még az Artificial 
Intelligence fedőlapja ís egy döntési hálót ábrázolt, bár élve művészi szabadságukkal 
egyes nyilak irányát megváltoztatták. 


Feladatok 


16.1. (David Heckerman alapján, de a magyar kiadású Guinness Rekordok Könyvére 
alapozva [Guinness Rekordok Könyve 1991, Solaris Kft., Budapest].) Ez a 
feladat az Almanac Game-hez kapcsolódik, amit döntéselemzők használnak a 
numerikus becslések kalibrálására. Adjon becslést az alábbi problémákra, azaz 
azt a számot adja meg, amiről úgy gondolja, hogy ugyanolyan valószínűséggel 
lehet túl nagy is, mint túl kicsi. Próbálja meg eltalálni a 25 percentilises becslést 
is, azaz azt a számot, amiről úgy gondolja, hogy 254 esélye van, hogy túl nagy 
lesz. és 7596 esélye, hogy túl kicsi. Ugyanígy tippelje meg a 75 percentilísest is. 
(Így minden egyes kérdésre három becslést kell megadnia összesen - egy 
kisebbet, a mediánt és egy nagyobb értéket.) 

(a) Melyik évben születtek meg az első (névadó) sziámi ikrek? 

(b) Hány helyi értékig képes valaki emlékezetből visszaidézni a x számot? 

(c) Hány rák volt az eddig megfigyelt legnagyobb krill rajban? 

(d) A kőkorszak óta — a háborúktól és a katasztrófáktó! eltekintve — az elhalá- 
lozások hány százalékáért felelős a maláriaszúnyog? 
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16. EGYSZERŰ DÖNTÉSEK MEGHOZATALA 


Az állatkertekben végzett mérések szerint egy kifejlett csimpánz hányszor 
erősebb egy átlagos normális férfinál? 

Az eddigi legmagasabb felállított karácsonyfa magassága? 

Milyen hosszú a Csendes-óceánt átszelő legrövidebb hajóút hossza? 

A Föld átlagos sűrűsége hányszorosa a vízének? 

Egy évben átlagosan hány esetben észlelnek szeizmikus tevékenységet, 
ebből mennyi érezheto, és mennyi okoz kárt? 

Milyen magas a hőmérséklet a Holdon a legjobban napsütötte helyen 
(Egyenlítőre merőlegesen)? 


A helyes válaszok a fejezet utolsó feladata után találhatók meg. A döntés- 
elemzés szempontjából nem az az érdekes, hogy az ön mediántippjei 
milyen közel vannak a valódi válaszokhoz, hanem inkább az, hogy milyen 
gyakran van a valódi érték az ön által tippelt 259b-os és 7599-os határ 
között. Ha ez az esetek felénél így van, akkor a határai pontosak. De ha ön 
az emberek többségéhez hasonló, akkor a kelleténél magabiztosabb, és az 
esetek felénél kevesebbszer lesz az igazi érték az ön által tippelt határokon 
belül. Ezen gyakorlással , javíthat", és így hasznosabb információt nyújthat 
a döntéshozáshoz. Próbálja ki ezt a második kérdéssort, hogy lássa, be- 
következett-e valamilyen javulás: 


Becslések szerint Picasso hány képet, illetve vázlatot festett az élete során? 
Hány statiszta szerepel Sir Richard Attenborough Ghandi c., 1982-ben 
készült filmjének temetési jelenetében? 

Milyen magas a világ legmagasabb építménye (varsói rádiótorony)? 
Milyen hosszú a transzszibériai vasútpálya? 

Hány utas fordult meg az O"Hara chicagói repülőtéren 1988-ban? 

A világ leglassabban mozgó mechanikus szerkezete (óra) hány év alatt tesz 
meg egy fordulatot? 

A dobozos sör piacra dobásának éve? 

A világ legnagyobb , tojásgyárában", a Croton Egg Farmon Amerikában a 
cég tyúkjai hány tojást tojnak naponta? 

Milyen volt a népsűrűség 1968-ban Macaó portugál tartományban, a világ 
legsűrűbben lakott helyén? 

A Man-szigeten ülésezik a megszakítás nélkül leghosszabb ideje fennálló 
törvényhozás. Az idén hány éves? 

Mikor helyezték üzembe az első forgalomirányító jelzőlámpákat (London- 
ban)? 

Mikor alakult a Nemzetközi Labdarúgó Szövetség (a FIFA)? 


Az állami szerencsejáték 1 dollárba kerül. Két lehetséges díj van: 10 dollár 1/50 
valószínűséggel és 1 000 000 dollár 1/2 000 000 valószínűséggel. Mennyi a 
szerencsejátékjegy várható pénzügyi értéke? Mikor racionális (ha van ilyen helyzet 
egyáltalán) jegyet vásárolni? Pontosabban — mutassa ezt be egy hasznosságokat 
tartalmazó egyenlettel. Azt feltételezheti, hogy (/(10 dollár) — 10 x U(1 dollár), de 
U(1 000 000 dollár-ra hasonlót nem lehet feltételezni. Szociológiai tanulmányok 
mutatják, hogy az alacsonyabb jövedelmű emberek aránytalan számú sorsjegyet 
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vásárolnak. Mit gondol, ez azért van, mert rosszabb döntéshozók, vagy mert eltérő 
hasznosságfüggvényük van? 


J. Bernoulli 1738-ban vizsgálta a szentpétervári paradoxont, ami a következő. 

Lehetősége nyílik részt venni egy szerencsejátékban, amelyben egy szabályos 

érmét dobnak fel ismételten az első fej előfordulásáig. Ha az első fej az r-edik 

dobásnál következik be, akkor a nyereménye 2" dollár. 

(a) Mutassa meg, hogy ennek a játéknak a várható pénzügyi értéke végtelen. 

(b) Mennyit fizetne ön, személy szerint a részvételért? 

(c) Ezt a nyilvánvaló paradoxont Bernoulli azzal a javaslattal oldotta meg, hogy 
a pénz hasznossága logaritmikus skálát követ (azaz U(S,) — a logan -k b, 
ahol S,, azt az állapotot jelöli. hogy nm dollárunk van). Mi a játék várható 
hasznossága ezzel a feltevéssel? 

(d) Mi az a maximum összeg, amit racionális lenne kifizetni a részvételért, 
feltéve, hogy a kezdeti vagyona k dollár? 


Becsülje meg a saját hasznosságfüggvényét különböző pénznövekményekre. Ezt 
úgy teheti meg. hogy egy sor preferenciatesztet futtat egy meghatározott Mi 
összeg és egy [p, Ma: (1 — p), 0] szerencsejáték között. Válasszon különböző M, ji 
és M) értékeket, és változassa addig p-t. ameddig nem lesz ön számára közömbös, 
hogy melyiket választja a kettő közül. Ábrázolja a hasznosságfüggvényt. 


Írjon számítógépes programot. ami automatizálja a 16.4. feladat folyamatát. 
Próbálja ki a programot különböző hátterű és politikai irányultságú embereken. 
Elemezze eredményei konzisztenciáját az összes személy esetén és egyetlen 
személy esetén is. 


Mennyit ér egy mikrohalál önnek? Fejlesszen ki protokollt ennek meghatározására, 
Fogalmazzon meg kérdéseket abból a szempontból, hogy mennyit ér a kockázat 
elkerülése, és abból a szempontból is. hogy mennyiért vállalja a kockázatot. 


Mutassa meg. hogyha X4 és X. preferenciálisan független X3-tól, és X; és X. 
preferenciálisan független X4-től. akkor szükségszerűen X) és X3 is preferenciá- 
lisan független X.-től. 


Ez a feladat a 16.5. ábrán bemutatott repülőtéri elhelyezési probléma elemzését 

fejezi be. 

(a) Adjon meg ésszerű. a témakörhöz kapcsolódó változókat, valószínűségeket 
és hasznosságokat a háló számára, feltételezve. hogy három helyszín van. 

(b) Oldja meg a döntési problémát. 

(c) Mi történik. ha a műszaki fejlődés következtében a repülőgépek csak fele 
akkora zajt okoznak? 

(di És ha a zaj elkerülése háromszor fontosabbá válik? 

(e) Számolja ki a TIÉ mennyiséget a LégiForgalom. a Pereskedés és az 
Épükezés esetén a modellben. 
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16.9. Ismételje meg a 16.8. feladatot, felhasználva a 16.6. ábrán látható cselekvés- 
hasznosság-reprezentációt. 


16.10. Melyik feltételes valószínűségi tábla bejegyzésre a legérzékenyebb a hasznos- 
ság a 16.8. és a 16.9. feladatban konstruált repülőtéri elhelyezési diagramok 
esetén, ha az elérhető tényeket ismerjük. 


16.11. (Judea Pearltől átvett feladat [Pearl, 1988].) Egy használt autót vásárló eltérő 
költségek mellett különböző teszteket végeztethet (például megrugdossa a 
gumikat, autószerelőhöz viszi a kocsit), majd a tesztek eredménye alapján 
eldönti, hogy melyik autót vegye meg. Feltételezzük, hogy a vásárló akkor veszi 
meg a ci autót, ha elég idő van legalább egy teszt elvégzésére, továbbá. hogy c4- 
nek ty a tesztje, és ez 50 dollárba kerül. 

A kocsi jó állapotban (g" minőség) vagy rossz állapotban (g7 minőség) lehet, 
és a tesztek segíthetnek a kocsi állapotának meghatározásában. A c, kocsi 1500 
dollárba kerül, piaci értéke azonban 2000 dollár, ha jó állapotban van; ha nem, 
akkor 700 dollár szükséges a jó állapotba hozásához. A vásárló úgy becsüli, 
hogy 7096 esélye van, hogy a kocsi jó állapotban van. 

(a) Rajzolja fel a döntési hálót, ami ezt a problémát reprezentálja. 

(b) Számítsa ki a várható nettó nyereséget cz megvásárlása esetén. ha nincse- 
nek tesztek. 

(c) A tesztek azzal a valószínűséggel jellemezhetők, hogy a kocsi átmegy-e a 
teszten vagy elbukik, attól függően, hogy jó vagy rossz állapotban van. 
A következő információkkal rendelkezünk: 


P(Átmegy(ci, tilg"t(cp) — 0.8 
P(Ármegytci, t)lg (c1)) — 035 


Felhasználva a Bayes-tételt, számítsa ki annak valószínűségét, hogy a kocsi 
átmegy (vagy elbukik) a teszten, és így azt a valószínűséget, hogy jó vagy 
rossz állapotban van adott tesztkimenetel esetén. 

(d) Számítsa ki az optimális döntést, ha átmegy, illetve ha elbukik, és számítsa 
ki a várható hasznosságukat. 

(e) Számítsa ki a teszt információértékét, és vezesse le a vásárló optimális 
tervét. 








16.12. Bizonyítsa be, hogy az információ értéke nem negatív és sorrendfüggetlen, 
amint azt a 16.6. alfejezetben állítottuk. Magyarázza el, hogyan lehetséges, hogy 
valaki rosszabb döntést hoz az információ megkapása után, mint amit a meg- 
kapása előtt hozott volna. 


16.13. Módosítsa és egészítse ki a Bayes-hálós kódot a kódtárban, hogy képes legyen 
EZRET döntési hálókat létrehozni és kiértékelni, illetve kiszámítani az információ értékét. 


A 16.1. feladat válaszai: Első sorozat: 1811, 40 ezer, 10 millió, 5096, 5-6, 67,36 m, 
17 550 km, 5.515, 500 000, 100 000, 1000, 1172 "C. Második sorozat: 13 500, 300 000, 
64628 m, 9438 km, 56 281 000, 25 753, 1935, 3,7 millió, 28 343 fő/km?, 1020, 1868, 1904. 


17. KOMPLEX DÖNTÉSEK MEGHOZATALA 


Ebben a fejezetben olyan módszereket vizsgálunk meg, amelyekkel eldönthetjük, hogy 
mit tegyünk a mai napon, feltételezve, hogy holnap is lehetőségünk lesz a cselekvésre. 


Ebben a fejezetben a döntéshozatalhoz kapcsolódó számítási kérdéseket tárgyaljuk 
meg. Míg a 16. fejezetben egyszeri vagy epizodikus döntési problémákkal foglalkoz- 
tunk, ahol az egyes cselekvések kimeneteleinek a hasznossága jól ismert volt, a 17. fe- 
jezetben szekvenciális döntési problémákkal (seguential decision problems) fogunk 
foglalkozni, ahol az ágens hasznossága a döntések sorozatától függ. A szekvenciális 
döntési problémák, amelyek hasznosságot, bizonytalanságot és érzékelést is magukban 
foglalnak, a keresés és tervezés problémáját általánosítják, melyeket a II., illetve a ÉV. 
részben írtunk le. A 17.I. alfejezet kifejti, hogyan definiálhatunk szekvenciális döntési 
problémákat, a 17.2. és a 17.3. alfejezet elmagyarázza ezek megoldását, hogy optimális 
viselkedést eredményezzenek, amely kiegyensúlyozza a bizonytalan környezetben meg- 
hozott cselekvések kockázatát és jutalmát. A 17.4. alfejezet kiterjeszti ezeket az ötleteket 
a részlegesen megfigyelhető környezetekre, és a 17.5. alfejezet egy teljes tervezési mó- 
dot fejleszt ki részlegesen megfigyelhető környezetben lévő döntéselméleti ágensek ter- 
vezésére, összekapcsolva a dinamikus Bayes-hálókat a 15. fejezetből a 16. fejezetbeli 
döntési hálókkal. 

A fejezet második része többágenses környezeteket tárgyal. Ilyen környezetekben az 
optimális viselkedés fogalma sokkal bonyolultabbá válik az ágensek közötti interakció 
miatt. A 17.6. alfejezet ismerteti a játékelmélet (game theory) alapötleteit, ideértve azt 
az elképzelést is, hogy egy racionális ágensnek lehet, hogy véletlenszerűen kell viselked- 
nie. A 17.7. alfejezet azt vizsgálja meg, hogyan tervezhetők olyan többágenses rendsze- 
rek, amelyekben az ágensek egy közös célt tudnak megvalósítani. 


17.1. SZEKVENCIÁLIS DÖNTÉSI PROBLÉMÁK 


Egy példa 


Tételezzük fel, hogy egy ágens a 17.1. (a) ábrán látható 4 x 3-as környezetben helyez- 
kedik el. A kezdő állapotból indulva minden időpontban választania kell egy cselekvést. 
A környezettel való interakció leáll, ha az ágens eléri a --1-gyel vagy a —1-gyel jelölt ál- 
lapotot. Az egyes helyzetekben az elérhető cselekvések nevei: Fel, Le, Balra, Jobbra. 
Egyelőre feltételezzük, hogy a környezet teljesen megfigyelhető (fully observable), 
azaz az ágens mindig ismeri a helyzetét. 
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17.1. ábra. va) Egy egyszerű 4 x. 3-as környezet, ami az ágens számára szekvenciális döntési probléma. bi 
A környezet állapotátmenet-modelljenek illusztrálása: a . szándékolt" kimenetel 0.8 valószínűséggel ki 
kezik be. de 0.2 valószínűséggel az ágens oldalra mozdul a szándékolt irányhoz képest. A fallal való ütki 
zéskor nincsen mozgás. A két végállapot jutalma a jelzett 4.1 és —1. az összes többi állapot jutalma -0.04. 






Ha a probléma determinisztikus volna. a megoldás könnyű lenne: [Fel. Fel, Jobbra. 
Jobbra, Jobbra). Sajnos a környezet nem maradna mindig szinkronban ezzel a megol- 
dással. mivel a cselekvések megbízhatatlanok. A véletlenszerű mozgás egy általunk 
elfogadott modelljét a 17.1. (b) ábra mutatja be. Minden cselekvés 0.8 valószínűséggel 
éri el a kívánt hatását. de a maradék esetben a cselekvések az ágenst a kívánt iránytól 
jobbra mozgatják. Továbbá. ha az ágens falba ütközik. akkor ugyanazon a mezőn ma- 
rad. Például ha az (1. 1) kezdő négyzeten áll. a Fel cselekvés az ágenst az (1. 2)-re moz- 
gatja 0.8 valószínűséggel. de 0.1 valószínűséggel a (2. 1)-re kerül. és 0.1 valószínűség- 
gel balra megy, ahol is falnak ütközik és (1, 15-en marad. Egy ílyen környezetben a [Fel, 
Fel, Jobbra. Jobbra, Jobbra) sorozat 0.8 — 0.32768 valós éggel kerüli meg az aka- 
dályokat, és éri el a (4. 3) célállapotot. Igen kis eséllyel az is megtörténhet, hogy a célt 
a másik úton keresztül éri el. 0.1! x 0.8. ami összességében 0.32776 valószínűséget 
jelent (lásd 17.1. feladat). 

Az egyes állapotokban végrehajtott egyes akcióknak a kimeneti valószínűségeit 
állapotátmenet-modellnek (transítion model) nevezzük. (vagy csak ..modell" -nek, 
ha nem értelemzavaró). A T(5. a. s" jelölést fogjuk használni annak a valószínűségnek 
a jelölésére, hogy az s állapotban az a cselekvés végrehajtása 5" állapotot eredményez. 
Feltesszük. hogy az átmenetek teljesítik a 15. fejezetben megfogalmazott Markov- 
tulajdonságot. azaz. hogy s" elérése s5-ből csak 5-től függ. más korábbi állapotoktól 
már nem. Egyelőre a 715. a. 57)-t tekinthetjük a valószínűségek egy nagy háromdimen- 
ziós táblázatának. Később. a 17.5. alfejezetben látni fogjuk, hogy az állapotátmenet- 
modell reprezentálható dínamikus Bayes-hálókkal (dynamic Bayesian network). 
csakúgy mint a 15. fejezetben. 

Hogy teljessé tegyük a feladat környezetének a definiálását. meg kell adnunk az 
ágens hasznosságfüggvényét. Mivel a döntési probléma szekvenciális. a hasznosság- 
függvény az állapotok sorozatától — a környezeti történettől (environment history) — 
fog függni. nem pedig egyetlen állapottól. A fejezetben később megvizsgáljuk az ilyen 
hasznosságfüggvények általános megadását: lőre egyszerűen kikötjük. hogy az 
ágens minden s állapotban egy Rts) jutalmat ireward) kap. ami lehet pozitív vagy ne- 
gatív. de mindenképpen korlátos. A konkrét példánkban a jutalom minden állapotban 
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-0.04. kivéve a végállapotokat (ahol --1 vagy -1). Egy környezeti történet hasznossá- 
ga (egyelőre) egyszerűen a kapott jutalmak összege. Például ba az ágens a --1 állapotot 
10 lépés után éri el. akkor az összhasznossága 0.6 lesz. A -0.04 negatív jutalom arra ösz- 
tönzi az ágenst. hogy minél gyorsabban érje el a (4. 3)-at. így ez a probléma a 3. feje- 
zetbeli keresési problémák egy sztochasztikus általánosítása. Ez más megfogalmazás- 
ban úgy hangzik. hogy az ágens nem élvezi az életet ebben a környezetben. és olyan 
gyorsan ki akar kerülni, amilyen gyorsan csak lehet. 

Egy teljesen megfigyelhető környezetben megadott szekvenciális döntési problémát 
Markov-állapotátmenet-modelljével és additív jutalmakkal Markov döntési folyamat- 
nak neveznek (MDF) tMarkov decision process). Egy MDF-et a következő három 
összetevő határoz meg: 


Kezdőállapot: $p 
Állapotátmenet-modell: Tis, a, 5") 
Jutalomfüggvény:! Rt5) 


A következő kérdés az, hogyan néz ki egy megoldás a problémára? Azt már láttuk. 
hogy egy rögzített cselekvéssorozat nem oldja meg a problémát. mivel az ágens végül 
más állapotba jut a célállapot helyett. Ezért egy megoldásnak minden. az ágens által 
elérhető állapotra elő kell írnia, hogy az ágens mit tegyen. Egy ilyenfajta megoldás az 
eljárásmód (policy). Egy eljárásmódot általában 7-vel jelölünk, és a mr eljárásmód az s 
állapotban a 7 (5) cselekvést javasolja. Ha az ágens egy teljes eljárásmóddal rendelke- 
zik, akkor függetlenül attól, hogy egy cselekvésnek mi is a kimenetele, az ágens min- 
dig tudni fogja, mit tegyen a következő alkalommal. 

Egy adott eljárásmód kezdőállapotból induló végrehajtása minden alkalommal egy 
különböző környezeti történetet eredményez a környezet sztochasztikus volta miatt. 
Egy eljárásmód minőségét ezért az adott eljárásmód generálta lehetséges környezeti 
történetek várható hasznosságával mérik. Az optimális eljárásmód (optimal policy) 
az az eljárásmód, ami a legnagyobb várható hasznosságot eredményezi. Az optimális 
eljárásmódot 77" -gal jelöljük. A 7" ismeretében az ágens úgy dönti el, hogy mit tegyen. 
hogy figyelembe veszi az aktuális érzékelését. ami az aktuális s állapotot közli vele, 
majd végrehajtja a 7" (5) cselekvést. Az eljárásmód az ágens függvényét explicit módon 
reprezentálja. és ezért az voltaképpen egy egyszerű reflexágens leírása. amit egy hasz- 
nosságalapú ágens által használt információkból számítunk ki. 

A 17.1. ábrán mutatott világ optimális eljárását a 17.2. (a) ábra mutatja. Látható. 
hogy mivel egy lépés költsége meglehetősen kicsi ahhoz a büntetéshez viszonyítva, 
hogy véletlenül a (4, 2) pozícióra kerülünk, az optimális eljárásmód a (3, 1) állapot 
esetén óvatos. Inkább egy hosszú kerülő út megtételét javasolja. mint a rövid átvágást 
a (4, 2) kockáztatásával. 

A kockázat és a jutalom egyensúlyának megváltozása függ az R(5) értékétől a nem 
végső állapotoknál. A 17.2. (b) ábrán az R(s) értékének négy különböző intervallumá- 
hoz tartozó optimális eljárásmódot találhatunk. Ha R(s) £ -1.6284, akkor az élet any- 
nyira elviselhetetlen. hogy az ágens egyenesen a legközelebbi kijárathoz tart, annak 


1 Az MDF egyes definíciói megengedik. hogy a jutalom függjön a cselekvéstől és a kimeneteltől is, így a 
jutalomfüggvény Ats, a. 57) alakú. Ez néhány környezet leírását egyszerűsíti, de a problémát alapvetően nem 
változtatja meg. 
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17.2. ábra. (a) Egy optimális eljárásmód a sztochasztikus környezetre R(5) — -0,04 esetén nem végálla- 
Potoknál. (b) Optimális eljárásmódok R(s) négy különböző értéktartománya esetén. 


ellenére, hogy ez —I értékű. Amikor -0,4278 £ R(s) S -0,0850, az élet elég kellemet- 
len; az ágens a --1 állapothoz vezető utat választja, vállalva annak kockázatát, hogy 
esetleg a -1 állapotba kerül. Nevezetesen az ágens a (3, 1)-ben választja az átvágást. 
Amikor az élet csak kevéssé bánatos (-0,0221 ca R(s) c 0), az optimális eljárásmód 
nem vállal semmilyen kockázatot. A (4. 1) és (3. 2) állapotokban az ágens teljesen el- 
kerüli a—1 állapotot, így nem tud véletlenül beleesni, még ha ez azt is jelenti, hogy elég 
sokszor beveri a fejét a falba. Végül, ha R(s) 5 0, akkor az élet kifejezetten élvezhető, 
és az ágens mindkét kijáratot elkerüli. Mindaddig, amíg a (4, 1), (3, 2) és (3, 3) állapo- 
tokban a cselekvések azok, amelyek az ábrán láthatók, minden eljárásmód optimális, és 
az ágens végtelen teljes jutalmat ér el, mivel soha nem lép be a végállapotba. Meglepő 
módon megmutatható, hogy hat más optimális eljárásmód is létezik az R(s) különböző 
intervallumaira. A 17.7. feladat kéri majd ezek megkeresését. 

A kockázat és a jutalom óvatos egyensúlyozása az MDF-ek egy olyan meghatáro- 
z6 tulajdonsága, ami nem jelentkezik determinisztikus keresési problémáknál; más- 
felől ez meghatározó tulajdonsága számos valósvilág-beli döntési problémának. 
Emiatt az MDF-eket számos tudományterületen tanulmányozzák, ideértve az MI-t, 
az operációkutatást, a közgazdaságtant és a szabályozáselméletet. Algoritmusok tu- 
catjait javasolták optimális eljárásmódok kiszámítására. A 17.2. és 17.3. alfejezet- 
ben leírunk a legfontosabb algoritmuscsaládok közül kettőt. Először azonban be kell 
fejeznünk a hasznosságok és eljárásmódok vizsgálatát a szekvenciális döntési prob- 
lémák esetében. 


Optimalitás szekvenciális döntési problémákban 


A 17.1. ábrán látható MDF-példában az ágens teljesítményét a meglátogatott állapo- 
tokban kapott jutalmak összege mérte. Ez a teljesítménymérték nem önkényes, de nem 
is az egyetlen lehetőség. Ez az alfejezet a lehetséges alternatív teljesítménymértékeket 
vizsgálja — azaz alternatív hasznosságfüggvényeket a környezeti történéseken, amit 
úgy jelölünk, hogy U/((5o, .... sa]. Az alfejezet a 16. fejezetből származó ötleteken 
alapul, és a technikai részleteket is bemutatja; a főbb pontokat a végén összegezzük. 
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Az első megválaszolandó kérdés az, hogy véges horizont (finite horizon) vagy 
végtelen horizont (infinite horizon) van a döntéshozatalnál. A véges horizont azt je- 
lenti, hogy létezik egy rögzített N idő, ami után semmi nem érdekes — a játéknak vé- 
ge, mondhatni. Így U((50. .-.. Svax]) — U/((5o. --.s sw) minden k 5 0 esetén. Például 
tegyük fel, hogy az ágens (3, 19-ből indul a 17.1. ábra 4 x 3-as világában, és tegyük 
fel, hogy N — 3. Ekkor, hogy a --1 állapot elérésének legalább az esélye meglegyen, 
az ágensnek egyenesen felé kell tartani, és az optimális cselekvés a Fel. Ezzel szem- 
ben, ha N — 100, akkor bőségesen van idő a biztonságos utat követni Balra menve. 
Azaz, véges horizont esetében az optimális cselekvés egy adott állapotban idővel 
változhat. Azt mondjuk, hogy az optimális eljárásmód véges horizont esetében nem- 
stacionárius (nonstationary). Rögzített időkorlát hiányában ezzel szemben nincs ok 
különböző viselkedésre ugyanabban az állapotban más és más időpontokban. Így az 
optimális cselekvés csak az aktuális állapottól függ, és az optimális eljárásmód sta- 
cionárius (stationary). A végtelen horizontú esethez tartozó eljárásmódok ezért egy- 
szerűbbek, mint a véges horizontú esethez tartozók, és ebben a fejezetben mi főként a 
végtelen horizontú esettel foglalkozunk.? Vegyük észre, hogy a ..végtelen horizont" 
nem jelenti szükségszerűen azt, hogy az összes állapotsorozat végtelen; mindössze 
annyit jelent, hogy nincs egy rögzített határ. Nevezetesen, egy végtelen horizontú 
MDF-ben lehetnek végállapotot tartalmazó véges állapotsorozatok. 

A következő eldöntendő kérdés az állapotsorozatok hasznosságának a kiszámítása. 
Tekinthetjük ezt a kérdést a többattribútumú hasznosságelmélet (multiattribute 
utility theory) egy kérdésének (lásd 16.4. alfejezet) azzal, hogy minden s; állapotot az 
[50 51. 52. -) állapotsorozat egy attribútumának veszünk. Egy egyszerű kifejezés 
eléréséhez, ami az attribútumokból épül fel, fel kell tételeznünk valamilyen preferencia- 
függetlenséget. A legtermészetesebb feltevés az, hogy az ágens preferenciái az állapot- 
sorozatok között stacionáriusok (stationary). A preferenciákra vonatkozó stacionaritás 
a következőket jelenti: ha két állapotsorozat, (50, 54, 52....] és Is. sí, 59....]. ugyanazzal 
az állapottal kezdődik (például sg — sú), akkor a két sorozat a preferencia-sorrendjének 
ugyanannak kell lennie, mint az (sz, 52...) és az (51, $,...] sorozatoknak. Ez tehát azt 
jelenti, hogy ha egy holnaptól kezdődő lehetséges jövőbeli eseménysort egy másik ese- 
ménysorral szemben preferálunk, akkor ez nem változhat, ha az eseménysor a mai 
naptól kezdődne. A stacionaritás egy meglehetősen ártalmatlannak tűnő feltevés, na- 
gyon erős következményekkel: bizonyítható, hogy stacionaritás esetén a sorozatokhoz 
csak kétféle módon rendelhetők hasznosságok: 


1. Additív jutalmak (additive rewards): egy állapotsorozat hasznossága ekkor 
U/AISo. S1. 52.) — R(s0) 4 R(sp) - R(s2) -k 


A I7.1. ábra 4 x 3-as világa additív jutalmakat használ. Vegyük észre, hogy az addi- 
tivitást hallgatólagosan kihasználtuk az utak költségfüggvényeinek felhasználásakor 
a heurisztikus keresési algoritmusokban (4. fejezet). 


2. Leszámítolt jutalmak (discounted rewards): egy állapotsorozat hasznossága ekkor 
U(ISo, 56 52.) — R(50) 4 9R(s) 4 7? R(s2) A 


2 Ez a teljesen megfigyelhető környezetekre igaz. Látni fogjuk, hogy a részlegesen megfigyelhető környe- 
zetekben a végtelen horizont esete nem annyira egyszerű. 
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ahol a 3 leszámítolási tényező (discount factor) egy 0 és 1 közötti szám. A leszá- 
mítolási tényező fejezi ki egy ágens preferenciáját a jelenlegi és a jövőbeli jutalmak 
között. Amikor - közel 0. akkor a távoli jövőbeli jutalmakat jelentéktelennek tekin- 
ti. Amikor 5 értéke 1, akkor a leszámítolt jutalmak pontosan megegyeznek az addi- 
tív jutalmakkal, így az additív jutalmak a leszámítolt jutalmak speciális esetei. A le- 
számítolás jó modellnek tűnik mind az állati, mind az emberi időbeli preferenciák- 
ra. Egy 9 leszámítolási tényező ekvivalens egy (1/7) - 1 kamatlábbal. 





A fejezet hátralevő részében leszámítolt jutalmakat fogunk feltételezni, aminek okai ha- 
marosan világosak lesznek. bár néha megengedjük a 5 — 1 értéket. 

A végtelen horizont elfogadása ött azonban rejlik egy probléma: ha a környezet 
nem tartalmaz egy végállapotot, vagy ha az ágens soha nem jut végállapotba, akkor az 
összes környezettörténet végtelen hosszú lesz, és a hasznosságok additív jutalmakkal 
általában végtelenek lesznek. Abban egyetérthetünk. hogy a --oc jobb, mint a —oc, de 
két -toc hasznosságú állapotsorozat összehasonlítása már bonyolultabb. Három megol- 
dás kínálkozik, amelyek közül kettőt már láttunk: 








1. Leszámítolt jutalmakkal egy végtelen sorozat hasznossága véges. Valójában. ha a ju- 
talmakra létezik egy Rmax) korlát és y pa 1. akkor azt kapjuk. hogy 


UnAlsg. 552 D-D Ra Ya "Rmax — Rmax/1— 9) (17.D 
150 170 
felhasználva a végtelen mértani sorozat összegképletét. 

2. Ha a környezet tartalmaz végállapotokat, és ha garantált, hogy az ágens végül 
bekerül az egyikbe, akkor soha nem lesz szükségünk végtelen sorozatok össze- 
hasonlítására. Egy eljárásmódot. ami garantáltan végállapotba juttat. véges eljá- 
rásmódnak (proper policy) nevezünk. Véges eljárásmódoknál használhatjuk a 
"y7 1-t (azaz az additív jutaimakat). A 17.2. (b) ábrán látható első három eljárásmód 
véges, a negyedik azonban nem. Egy nem véges eljárásmód végtelen teljes jutalmat 
ér el a végállapotoktól való távolmaradással. amikor a nem végállapotok jutalma 
pozitív. A nem véges eljárásmódokra additív jutalmaknál nem mindig működnek 
az MDF-eket megoldó alapalgoritmusok. ami jó ok a leszámítolt jutalmak haszná- 
latára. 

3. Végtelen sorozatok összehasonlítására egy másik lehetőség az időegységenkénti át- 
lagjutalom (average reward) felhasználása. Tegyük fel, hogy a 4 x 3-as világban 
az (1, 1) mező jutalma 0.1. míg más nem végállapotoké 0.01. Ekkor egy olyan eljá- 
rásmódnak, ami minden tőle telhetőt megtesz. hogy az (1. 1)-ben maradjon. nagyobb 
lesz az átlagos jutalma, mint annak, amelyik máshol marad. Az átlagos jutalom hasz- 
nos kritérium bizonyos problémákra, de az átlagjutalomra tervezett algoritmusok 
meghaladják e könyv kereteit. 


Összegezve, a leszámítolt jutalmak használata jár a legkevesebb bonyodalommal az 
állapotsorozatok kiértékelésében. A végső lépés annak megmutatása, hogyan válasz- 
szunk az eljárásmódok között, észben tartva azt, hogy egy adott 7 eljárásmód nem 
egyetlen állapotsorozatot generál, hanem a legkülönfélébb lehetséges állapotsoroza- 
tokat, mindegyiket egy adott valószínűséggel. amit a környezet állapotátmenet- 
modellje határoz meg. Így egy eljárásmód értéke a (sorozatonként) elért leszámítolt 
jutalmak várható értéke, ahol a várható érték képzése az összes állapotsorozat felett 
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történik, ami az eljárás végrehajtása esetén előfordulhat. Egy 7" optimális eljárás- 
mód ekkor 


a 
7 z argmax E XV RCSÍT 


z 1-0 





(17.22 


A következő két alfejezet algoritmusokat ír le az optimális eljárásmódok megtalálására. 


17.2. ÉRTÉKITERÁCIÓ 


Ebben az alfejezetben az optimális eljárásmód kiszámítására mutatunk be egy algorit- 
must, az úgynevezett értékiterációt (value iteration). Az alapötlet az, hogy kiszámít- 
juk minden egyes állapot hasznosságát, majd az állapothasznosságokat felhasználjuk az 
egyes állapotoknál az optimális cselekvés megválasztásához. 


Az állapotok hasznossága 


Az állapotok hasznosságát az állapotsorozatok hasznosságán keresztül definiáljuk. 
Nagyjából azt modhatjuk. hogy egy állapot hasznossága a belőle kiinduló állapot- 
sorozatok várható hasznosságával egyenlő. Nyilvánvalóan az állapotsorozatok függnek 
a végrehajtott eljárásmódtól, így elsőként egy adott : eljárásmódra definiáljuk a hasz- 
nosságot. [7(5)-t. Jelöljük s,-vel az ágens állapotát a r eljárásmód t lépésnyi végrehaj- 
tása után, ekkor azt kapjuk. hogy 


U"(9)zE 





4; 
IT R(s, Mr.sg — ] (17.3) 
10 
Felhasználva ezt a definíciót. egy állapot valódi hasznossága az U"(s), amit U(5)-sel 
jelölünk. Ez a a leszámítolt jutalmak várható értéke akkor, amikor az ágens egy optimá- 
lis eljárásmódot hajt végre. Vegyük észre. hogy az U(5) és az R(s) igen eltérő mennyisé- 
gek: az R(s) a ..rövid távú" jutalom az $-ben tartózkodásért. míg az U(5) a , hosszú távú" 
összjutalom s-től kezdve. A 17.3. ábrán láthatók a hasznosságok a 4 x 3-as világban. 
Látható. hogy a hasznosságok nagyobbak a --1-es kijárathoz közeli állapotoknál, mivel 
kevesebb lépés szükséges a kijárat eléréséhez. 

Az U(s) hasznosságfüggvény lehetővé teszi az ágensnek. hogy a cselekvéseit a 16. 
fejezetben szereplő maximális várható hasznosság elve alapján válassza meg; azt a cse- 
lekvést választja. amelyik maximalizálja a bekövetkező állapot várható hasznosságát: 


77" (s) — argmax ) T(s.a.59U(5) (174) 
a s 

Most azonban. ha egy állapot hasznossága a leszámítolt jutalmak várható értékének 
összege attól a kiindulóponttól kezdve. akkor közvetlen kapcsolat áll fenn egy állapot 
hasznossága és a szomszédainak a hasznossága között: egy állapot hasznossága az 
állapotban tartózkodás közvetlen jutalmának és a következő állapot várható leszámítolt 
hasznosságának az összege. feltéve, hogy az ágens az optimális cselekvést választja. 
Azaz egy állapot hasznossága a következő: 
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EJEJÉJEI 






1 2 3 a 


17.3. ábra. Az állapotok hasznosságai a 4 x 3-as világban, — I és a nem végállapotoknál R(s) — -0.04 
esetén 


U(5) — R(5) 4 ymax 9 T(s.a.5)U(s?) (17.5) 
a 7 


A (17.5) egyenletet Bellman-egyenletnek (Bellman egnation) nevezik Richard 
Bellman tiszteletére (Bellman, 1957). Az állapotok hasznosságai — mint a bekövetkező 
állapotsorozatok várható hasznossága a (17.3) egyenlet szerint — a Bellman-egyenletek 
egy rendszerének a megoldásai. Valójában ezek egyértelmű megoldások, ahogyan a kö- 
vetkező két alfejezetben megmutatjuk. 

Nézzük meg a 4 x 3-as világ Bellman-egyenleteinek egyikét. Az (1, 1) állapothoz 
tartozó egyenlet: 


UI, 1) — -0.04 -- y max(0.8LXI, 2) 4 01U2, 1 4 OLUU, 1 (Fel) 
09U(1. 1) 4 01U(L, 2) (Balra) 
09U(1, 1) 4 01U2D (Le) 
08U(2, 1) 4 0.1U(1. 2) 4OIUG. DD] (Jobbra) 


A 17.3. ábrán látható számok behelyettesítésével azt láthatjuk, hogy a Fel a legjobb 
cselekvés. 


Az értékiteráció algoritmus 


A Bellman-egyenletek képezik az alapját az MDF-ek megoldására szolgáló 
értékiteráció algoritmusnak. Ha n lehetséges állapot van, akkor n Bellman-egyenlet lé- 
tezik, mindegyik állapotra egy. Az n egyenlet s ismeretlent tartalmaz — az állapotok 
hasznosságát. Így a hasznosságok megállapításához ezen egyenletek együttesét szeret- 
nénk megoldani. Azonban van egy probléma: az egyenletek nemlineárisak, mivel a 
, max" operátor nemlineáris operátor. Míg a lineáris egyenletrendszerek hatékonyan 
megoldhatók lineáris algebrai eszközökkel, a nemlineáris egyenletrendszerek már 
problematikusabbak. Ekkor iteratív módszerrel próbálkozhatunk. Kezdéskor tetszőle- 
ges kezdeti értékeket választunk a hasznosságoknak, kiszámítjuk az egyenletek jobb 
oldalát, majd behelyettesítjük a bal oldalra — így frissítve az egyes állapotok hasznos- 
ságát a szomszédjainak a hasznosságával. Ezt addig ismételjük, ameddig el nem érünk 
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egy egyensúlyi helyzetet. Jelölje U(s) az s állapot hasznosságértékét az i-edik iteráció- 
ban. A Bellman-frissítésnek (Bellman update) nevezett iterációs lépés a következő- 
képpen néz ki: 


Uj (5) — R(5) 4 ymax ) T(sa,59U As?) (17.6) 
a 


Ha a Bellman-frissítést végtelen sokszor alkalmazzuk, garantált, hogy egyensúlyi hely- 
Zetet érünk el (lásd következő alfejezet), és ekkor a végső hasznosságértékeknek a 
Bellman-egyenletek megoldását kell adniuk. Valójában ezek egyértelmű megoldások 
is, és a hozzájuk tartozó eljárásmód optimális (amit a (17.4) egyenlettel nyerhetünk). 
Az algoritmus, amit ÉRTÉKITERÁCIÓ-nak nevezünk, a 17.4. ábrán látható. 





function ÉRTÉKITERÁCIÓUndf, €) returos egy hasznosságfüggvény 
inputs: mdf, egy MDF S állapotokkat, 7 állapotátmenet-modellel, R jutalomfüggvénnyel, 
a leszámítolási tényezővel 
£, maximális megengedett hiba az állapotok hasznosságában 
local variables: U, U" hasznosságéntékek vektorai §-beli állapotokhoz, kezdetben nulla 
6, a maximális változás egy állapot hasznosságában egy iteráción belül 





repeat 
U—U 6-0 
for each s állapotra in S do 
UTS1— RIS 7 mge dj T(s, a, 59) US 


IffU(5] — VIS] 2 ő then ő [415] — UUS]I 
until ő c e(1—9/y 
return [/ 











17.4. ábra. Az értékíteráció algoritmus az állapotok hasznosságának kiszámítására. A leállási feltétel a 
(17.8) egyenletből származik. 





4 K-i 
Fát ú 
Fi 0.6 al 
§ 04 $ 
§ 02 § 
E o ke 
-02 
95 510 15 20 25 30 0.50.550.60.650.70,75080.8509095 1 
Az iterációk száma Leszámítolási tényező 7 
(a) (by 


17.5. ábra. (a) A grafikonokon kiválasztott állapotok hasznosságainak a fejlődése látható az értékiteráció 
felhasználásánál. (b) A szükséges értékiterációk száma (4), hogy a hiba garantáltan legfeljebb e — cfirnax 
legyen, c különböző értékeinél, mint a 3 leszámítolási tényező függvénye. 
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Az értékiterációt alkalmazhatjuk a 17.1. (a) ábra 4 x 3-as világára. Nulla kezdeti ér- 
tékekről indulva. a hasznosságok alakulása a 17.5. (a) ábrán látható. Vegyük észre. 
ahogy a (4. 3) állapottól különböző távolságra lévő állapotok negatív jutalmakat halmoz- 
nak fel egészen addig. amíg egy bizonyos ponton utat találnak a (4. 3)-hoz. amikortól is 
a hasznosságok elkezdenek növekedni. Az értékiteráció algoritmusára gondolhatunk úgy. 
mint lokális frissítések általi információterjesztésre az állapottérben. 


Az értékiteráció konvergenciája 


Azt állítottuk, hogy az értékíteráció végül a Bellman-egyenletek egy egyértelmű meg- 
oldásához konvergál. Ebben az alfejezetben kifejtjük. miéri is történik ez. Ennek során 
bevezetünk néhány hasznos matematikai fogalmat. és olyan módszereket kapunk, ame- 
lyek megbecsülik a hasznosságfüggvény hibáját . ha az algoritmust hamar állítottuk le: 
ennek hasznosságát az adja. hogy nem kell végtelen hosszan futtatnunk az algoritmust. 
Az alfejezet a technikai részleteket is bemutatja. 

Az értékiteráció konvergenciájának megmutatásában használt alapfogalom az össze- 
húzás (contraction). Az összehúzás nagyjából egy olyan egyváltozós függvény. ami 
két különböző bemeneti értékre alkalmazva, két olyan kimeneti értéket ad. amelyek 
egymáshoz közelebbiek". mint az eredeti értékek, legalább egy bizonyos állandó 
mennyiséggel. Például a , kettővel való osztás" egy összehúzás, mivel bármely két 
szám elosztása után a különbségük megfeleződik. Vegyük észre, hogy a . kettővel való 
osztásnak" van egy fix pontja, nevezetesen a nulla, ami a függvény alkalmazásával nem 
változik. Ebből a példából az összehúzás két fontos tulajdonságát vehetjük észre: 


s Egy összehúzásnak egyetlen fix pontja van: ha két fix pontja lenne, nem kerülnének 
egymáshoz közel a függvény alkalmazásakor. így nem is volna összehúzás. 

s A függvény tetszőleges argumentumra történő alkalmazásakor a függvényértéknek 
közelebb kell kerülniük a fix ponthoz (mivel a fix pont nem mozdul el), így egy ösz- 
szehúzás ismételt alkalmazása a fix pontot adja határértékben. 

Most tegyük fel, hogy a Bellman-frissítést (a (17.6) egyenletet) egy B operátornak te- 

kintjük. aminek egyszeri alkalmazása az összes állapot hasznosságát frissíti. Jelölje U; 

az összes állapot í-edik iterációbeli hasznosságának a vektorát. Ekkor a Bellman- 

frissítési egyenletet felírhatjuk úgy. hogy 


Ua — BU; 
Most egy olyan módszerre van szükségünk, amellyel a hasznosságvektorok távolságát 


mérhetjük. A maximum normát (max norm) fogjuk használni, ami egy vektor hosz- 
szát a legnagyobb komponensének hosszával méri: 


III max] 5) 
s 





Ezzel a definícióval, a két vektor közötti . távolság" !JU — UI] az összetartozó elemek 
közötti különbségek maximuma. Az alfejezet fő eredménye a következő: Legven U; és 
két tetszőleges hasznosságvektor. Ekkor 


II8U;— BUAI S AlU;— VAI 177) 
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Azaz, a Bellman-frissítés egy összehúzás egy a tényezővel a hasznosságvektorok terében. 
az értékiteráció mindig a Bellman-egyenletek egy egyértelmű megoldásához konvergál. 
Nevezetesen, a (17.7) egyenletben lecserélhetjük U; -t a valódi U hasznosságokkal. 
amire BU — U. Ekkor a következő egyenlőtlenséget kapjuk 
F8U;—-GII S Ál— Ul 








Ezért. ha HU; — U-ra mint az U; becslés 4ibájára tekintünk. látjuk. hogy a hiba min- 
den iterációban legalább egy a tényezővel csökken. Ez azt jelenti. hogy az érték- 
iteráció exponenciálisan gyorsan konvergál. A szük: k számát egy adott 
hibahatár eléréséhez a következőképpen számíthatjuk ki: először. a (17.1) egyenlet sze- 
rint. az összes állapot hasznossága korlátos —R max (1— 5) értékkel. Ez azt jelenti. hogy 
a maximális kezdeti hiba U9— UI S 2XRmax (1 — 71. Tegyük fel. hogy N iterációt 
zünk ahhoz. hogy a hiba legfeljebb - értékű legyen. Mivel a hiba minden egyes alkalom- 
ülnie. hogy 292 Rnax(1— 9) € e 
Ha vesszük a két oldal logaritmusát, az adódik. hogy 


og 1/m! 


számú iteráció elegendő. A 17.5. tb) ábrán látható. hogyan változik - függvényében az 
N különböző értékű :, Rnax hányadosok esetében. A jó hír az, hogy az exponenciális 
gyorsaságú konvergencia miatt A nem függ túlságosan az 5, Rmax hányadostól. A rossz 
hír az, hogy N gyorsan nő, ahogy a közel kerül 1-hez. Így gyors konvergenciát úgy ér- 
hetünk el. ha 3-t kicsivé tesszük. de ez valójában az ágensnek rövid távú horizontot biz- 
tosít, és az ágens cselekvéseinek hosszú távú hatásait figyelmen kívül hagyhatja. 

Az előző bekezdés hibakorlátja ad bizonyos tájékozódást az algoritmus futási idejét 
befolyásoló tényezőkről. de gyakran túlságosan óvatos módszert jelent annak eldönté- 
sére, hogy mikor álljon le az iteráció. Az utóbbi célra felhasználhatunk egy korlátot. 
ami a hibát az egyes iterációkban a Bellman-frissítés nagyságához kapcsolja. Az össze- 
húzási tulajdonságból ((17.7) egyenlet) meg lehet mutatni. hogy ha a frissítés kicsi 
(azaz egyetlen állapot hasznossága sem változik nagyon). akkor a hiba a valódi hasz- 
nosságfüggvényhez képest szintén kicsi. Pontosabban. 


ha fa — UI] 2 24—99/9. akkor  IIV41- UI (17.8) 















7/2701 - s 


max/ " 


N — og, 

















Ez a leállási feltétel szerepel az ÉRTÉKITERÁCIÓ algoritmusában a 17.4. ábrán. 

Eddig az énékiteráció algoritmusa által visszaadott hasznosságfüggvény hibáját ele- 
meztük. Az ágenst azonban igazán az érdekli, hogyan fog boldogulni. ha egy ilyen dön- 
tésfüggvény alapján hoz döntéseket. Tegyük fel. hogy az értékiteráció -edik iterációja 
után az ágens a valódi L: hasznosságra egy C; becslést kap. és az U;-n alapuló egylépé- 
ses előrenézés felhasználásával tahogy a (17.4) egyenletben; megkapja a x; MVH- 
eljárásmódot. Vajon a kiadódó viselkedés megközelítőleg lesz-e olyan jó. mint az opti- 
mális viselkedés? Ez dömő kérdés minden valós ágens számára. és bizonyítható. ho: 
a válasz igen. Jelölje U7(s5) azt a hasznosságot, ami ; végrehajtásakor adódik 5-I 
kiindulva. Ekkor az ,U7:— UII az eljárásmód vesztesége (policy loss) annak a maximá- 
lis értéke. amit az ágens veszíthet végrehajtva az optimál eljárásmód helyett. 
A a; eljárásmód veszteségét az U/-beli hibához a következő egyenlőtlenség kapcsolja: 


ha ,07—-UN cz. akkor U77— Un a 2, (1-5) 17.99) 
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pe 
eri 


Maximális hiba — 
08 FEljárásmód vesztesége —— 


Maximális hibafeljárásmód vesztesége 





0 2 4 6 8 I0 B 14 
Iterációk száma 


17.6. ábra. A hasznosságbecslés maximális hibája IJe7, — UII és az eljárásmód vesztesége II" — UI az 
optimális eljárásmódhoz viszonyítva az értékiteráció iterációszámának függvényében 


A gyakorlatban sokszor előfordul, hogy r; jóval hamarabb optimálissá válik, mielőtt 
U; konvergált volna. A 17.6. ábrán látható, ahogy a 4 x 3-as környezetben a maximális 
Urbeli hiba és az eljárásmód vesztesége az értékiteráció folyamatának előrehaladtával 
nullához közelít, y — 0,9 értéknél. A 7 eljárásmód már i — 4-nél optimális, pedig az 
Ujrbeli maximális hiba még 046. 

Most már minden rendelkezésünkre áll, hogy az értékiterációt a gyakorlatban is 
felhasználjuk. Tudjuk, hogy a helyes hasznosságokhoz konvergál, a hasznosság becs- 
lésének hibájára korlátokat tudunk adni, ha véges számú iteráció után leállunk, és 
korlátokat tudunk adni az eljárásmód veszteségére, ami a becsült hasznosságértékek- 
hez tartozó MVH-eljárásmód végrehajtása miatt lép fel. A végső megjegyzés, hogy 
az összes eredmény feltétele ebben az alfejezetben a y c 1-gyel való leszámítolás. Ha 

— 1 és a környezet tartalmaz végállapotokat, akkor bizonyos technikai feltételek 
teljesülése esetén konvergenciaeredmények és hibakorlátok hasonló halmaza szár- 
maztatható. 


17.3. ELJÁRÁSMÓD-ITERÁCIÓ 


Az előző alfejezetben megfigyeltük, hogy optimális eljárásmódot akkor is kaphatunk, 
amikor a hasznosságfüggvény becslése pontatlan. Ha egy cselekvés egyértelműen jobb, 
mint a többi, akkor a releváns állapotok hasznosságainak a pontos nagyságát nem szük- 
séges precízen tudnunk. Ez a megérzés egy alternatív módot javasol az optimális eljá- 
rásmód megkeresésére. Az eljárásmód-iterációs (policy iteration) algoritmus egy mo 
kezdeti eljárásmódtól indulva a következő két lépést váltogatja: 


:  Eljárásmód-értékelés (policy evaluation): Egy adott 7; eljárásmódnál számítsuk ki 
U; — U"-t, az egyes állapotok hasznosságát mintha 7; volna végrehajtva. 

"  Eljárásmód-javítás (policy improvement): Számítsunk ki egy új 7,j MVH-eljá- 
rásmódot, felhasználva az U;-n alapuló egylépéses előrenézést (mint a (17.4) egyen- 
letben). 
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Az algoritmus leáll, amikor az eljárásmód-javítás lépése nem eredményez változást a 
hasznosságokban. Ennél a pontnál tudjuk, hogy az U; hasznosságfüggvény a Bellman- 
frissítés egy fix pontja, így a Beliman-egyenletek egy megoldása, és 7-nek egy opti- 
mális eljárásmódnak kell lennie. Mivel csak véges sok eljárásmód létezik a véges álla- 
pottérben, és megmutatható, hogy minden iteráció jobb eljárásmódot eredményez, az 
eljárásmód-iterációnak le kell állnia. Az algoritmus a 17.7. ábrán látható. 

Az eljárásmód-javítás lépése nyilvánvalóan egyértelmű, de hogyan valósítsuk meg 
az eljárásmód-értékelést. Kiderül, hogy ennek elvégzése sokkal egyszerűbb, mint a 
szabványos Bellman-egyenletek megoldása (amit az értékiteráció végez el), mivel az 
eljárásmód egy cselekvést minden állapotban rögzít. Az i-edik iterációban a 7; eljárás: 
mód a r(5) cselekvést írja elő. Ez azt jelenti, hogy a (17.5) Bellman-egyenlet egy egy- 
szerűsített változatával állunk szemben, ami az s hasznosságát (7; mellett) a következő- 
képpen kapcsolja a szomszédai hasznosságához: 





U;(9)— R(9) HF YIET(s7(5). 59045) (17.10) 
7 
Például tegyük fel, hogy 7; a 17.2. (a) ábrán látható eljárásmód. Ekkor azt kapjuk, hogy 
z(1, 1) — Fel, r(I, 2) — Fel és így tovább, illetve az egyszerűsített Bellman- 
egyenletek: 


UI, 1) —-0,04 -- 0,8U1. 2) 4 0,1UXI, 1) 4 0,1U42, 1) 
Ua, 2) — -0,04 -H 0,8UKI, 3) 4 02U/(1, 2) 


A lényeges az, hogy ezek az egyenletek lineárisak, mivel a , max" operátort eltávolítot- 
tuk. Ha az állapotok száma n, n lineáris egyenlet adódik n ismeretlennel. ami egzakt 
módon megoldható O(r?) időben standard lineáris algebrai módszerekkel. 





function ELJÁRÁSMÓD-ÍTERÁCIÓ(mdf) returns egy eljárásmód 
inputs: mdf. egy MDF § állapotokkal, 7 állapotátmenet-modellel 
Tocal variables: U, U" hasznosságértékek vektorai 5-beli állapotokhoz, kezdetben zérók 
". egy eljárásmód vektor állapotokkal indexelve, kezdetben véletlen 


repeat 
U — ÉRTÉKMEGHATÁROZÁSÍT. U. mdf) 
változatlan? — igaz 
for each s állapotra in $ do 
if maxg $OT(s.a.s) USE SZÓ Tés ts). 599Us then 
Ki d 


als) — argmax, 3 T(sa,5)UI5"1 
fi 
változatlan? — hamis 


until változatlan? 
return Tr 











17.7. ábra. Az eljárásmód-iterációs algoritmus egy optimális eljárásmód kiszámítására 
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Kis állapotterekre az eljárásmód-kiértékelés egzakt megoldómódszerekkel gyakran a 
leghatékonyabb megközelítés. Nagy állapotterekre az fertő ) idő megengedhetetlen 
lehet. Szerencsére nem szül egzakt eljárásmód-kiértékelést végezni. Ehelyett el- 
végezhetünk bizonyos számú egyszerűsített énékíterációs lépést (egyszerűsített, mivel 
az eljárásmód rögzített). hogy a hasznosságok elfogadhatóan jó becsléséhez jussunk. 
Az egyszerűsíten Bellman-írissítés ehhez a folyamathoz a következő 


Uj ató) — Ra) ZT(s. 


ter 








(4.5 U AS?) 





amit k-szor ismédünk, hogy a következő hasznosságbecslés előálljon. Az adódó algo- 
ritmust módosított eljárásmód-iterációnak (modified policy iteration) nevezzük. Ez 
gyakran sokkal hatékonyabb. mint a szabványos eljárásmód-iteráció vagy értékiteráció. 
Az eddig leírt algoritmusok megkövetelik a hasznosságok vagy eljárásmódok összes ál- 
lapotbeli egyszerre történő frissítését. Megmutatható. hogy ez nem szigorúan szükséges. 
Valójában minden iterációnál kiválaszthatjuk az állapotok egy tetszőleges részhalmazát. és 
alkalmazhatjuk rá bármelvik fajta frissítést teljárásmód-javítást vagy egyszerűsített 
értékiterációt). Ezt az általánosított algoritmust aszinkron eljárásmód-iterációnak 
tasynchronous policy iteration) nevezzük. A kezdeti eljárásmód és a hasznosságfügg- 
vény adott feltételek melletti megválasztásánál az aszinkron eljárásmód-iteráció garantál- 
tan konvergál az optimális eljárásmódhoz. A feldolgozandó állapotok megválasztásának 
szabadsága azt jelenti. hogy hatékonyabb heurisztikus algoritmusokat tervezhetünk — 
például olyan algoritmusokat. amelyek azon állapotok értékének frissítésére koncent- 
rálnak, amelyeket egy jó eljárásmód valószínűleg elér. A valós életben ez nagyon hasz- 
nosnak tűnik: ha valakinek nincs szándékában a mélybe vetni magát egy szikláról, 
akkor nem kell aggódással töltenie az időt a bekövetkező állapotok pontos értékéről. 


17.4. RÉSZLEGESEN MEGFIGYELHETŐ MARKOV 
DÖNTÉSI FOLYAMATOK 


A Markov döntési folyamatok leírása a 17.1. alfejezetben feltételezte, hogy a környe- 
zet teljesen megfigyelhető (fully observable). E mellett a feltételezés mellett az ágens 
mindig tudja, hogy melyik állapotban van. Ez együttesen az állapotátmenet-modell 
Markov-tulajdonságának a feltevésével azt eredményezi, hogy az optimális eljárásmód 
csak az aktuális állapottól függ. Amikor a környezet csak részlegesen megfigyelhető 
(partially observable). a helyzet nem ennyire átlátható. Az ágens nem tudja feltétle- 
nül. hogy melyik állapotban is van. így nem hajthatja végre az adott állapothoz javasolt 
7r(5) cselekvést. Továbbá. egy s állapot hasznossága és az s-beli optimális cselekvés 
nemcsak 5-től függ. hanem attól is. hogy az ágens mennyit tud. amikor s-ben van. Ebből 
kifolyólag a részlegesen megfigyelhető MDF-eket (IRMMDF) 1 partially observable 
MDPSs, POMDPS) általában sokkal! nehezebb dolgoknak tartják. mint a hagyományos 
MDF-eket. Az RMMDF-ek azonban nem megkerülhetők. mivel a valódi világ is egy 
RMMDF. 

Példaként gondoljuk át újra a 17.1. ábra 4 x 3-as világát. de most tegyük fel. hogy 
az ágensnek egyáltalán nincsenek érzékelői, és elképzelése sincs arról. hogy hol lehet. 
Pontosabban. tegyük fel. hogy az ágens kezdeti állapota egyenlő valószínűséggel vala- 
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melyike a kilenc nem végállapotnak (17.8. (a) ábra). Világos, hogz ha az ágens tudná, 
hogy (3, 3)-ban van, akkor Jobbra mozgást hajtana végre: ha tudná, hogy (t, 19-ben 
van, akkor Fel mozogna; de mivel bárhol lehet, mit is kellene tennie? Egy lehetséges 
válasz, hogy az ágensnek először olyan cselekvéseket kell végrehajtani, amelyek csök- 
kentik a bizonytalanságát, és csak ezután kell megpróbálni a --1 kijárat felé tartani. Pél- 
dául ha az ágens öt alkalommal Balra mozgást hajt végre, akkor igen valószínű, hogy 
a bal oldali falnál van (17.8. (b) ábra). Ezután öt alkalommal Fe! mozgást hajt végre, 
akkor igen valószínű, hogy a felső falnál van, valószínűleg a bal felső sarokban (17.8. (c) 
ábra). Végül öt Jobbra mozgást hajt végre, ekkor jó eséllyel — körülbelül 77,599-kal — 
eléri a --1 kijáratot (17.8. (d) ábra). A Jobbra mozgás ezt követő folytatása az esélyét 
81,890-ra növeli. Ez az eljárásmód így meglepően biztonságos, de ebben az esetben az 
ágens igen lassan éri el a kijáratot, és a várható hasznossága csupán 0,08 körül van, 
Az optimális eljárásmód, amit hamarosan leírunk, sokkal jobban teljesít. 


feTeteT 























(a) 


17.8. ábra, (a) Az ágens elhelyezkedésének kezdeti valószínűségi eloszlása. (b) Ötszöri Balra mozgás 
után. (c) Ötszöri Fef mozgás után. (d) Ötszöri Jobbra mozgás után 


Az RMMDF-ek kezeléséhez először ís megfelelően kell őket definiálni. Egy 
RMMDF-nek az elemei ugyanazok, mint egy MDF-nek — egy 7(5. a. 5") állapotátmenet- 
modell és egy R(5) jutalomfüggvény -, de van egy 0(s, 0) megfigyelési modellje 
(observational model) ís, ami az s állapotban az o megfigyelés érzékelésének a valószí- 
nűségét adja meg.? Például az érzékelő nélküli ágensünknek csak egyetlen megfigyelé- 
se van (az üres megfigyelés), ami minden állapotban 1 valószínűséggel bekövetkezik. 

A 3. és 12. fejezetben nemdeterminisztikus és részlegesen megfigyelhető tervkészí- 
tési problémákat tanulmányoztunk, és megállapítottuk, hogy a hiedelmi állapot (belief 
state) — az aktuális állapotok halmaza, amelyekben az ágens lehet — kulcsfogalom a meg- 
oldások leírására és kiszámítására. 

Az RMMDF-ekben a fogalmat kissé finomítjuk. Egy b hiedelmi állapot most egy va- 
lószínűség-eloszlás lesz az összes lehetséges állapot felett. Például a 17.§. (a) ábra kezde- 
ti hiedelmi állapota úgy írható, hogy (§.g-g-9-5-9-9-g-g 0). A b hiedelmi állapot által az 
aktuális í állapothoz rendelt valószínűséget (5)-sel jelöljük. Az ágens úgy számíthatja ki 
a jelenlegi hiedelmi állapotát. mint egy feltételes eloszlást az aktuális állapotok felett, az 
eddigi megfigyelések és cselekvések sorozatának ismeretében. Ez lényegében a szűrési 
(filtering) feladat (lásd 15. fejezet). A rekurzív szűrési alapegyenlet (lásd (15.3) egyen- 
let a 633. oldalon) megmutatja, hogy hogyan számolhatjuk ki az új hiedelmi állapotot 








3 A megfigyelési modell alapvetően azonos az időbeli folyamatok érzékelő modelljével (sensor model) a 
15. fejezetből. Ahogyan az MDF-ek jutalomfüggvényénél. a megfigyelési modell szintén függhet a cselekvés- 
től és a kimeneteli állapottól, de ez most sem egy alapvető változás. 
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az előző hiedelmi állapotból és az új megfigyelésből. Az RMMDF-eknél a jelölés elté- 
rő, és meg kell gondolni még a cselekvést is, de az eredmény lényegében ugyanaz. Ha 
b(s) volt az előző hiedelmi állapot, és az ágens az a cselekvést hajtja végre és az 0 meg- 
figyelést érzékeli, akkor az új hiedelmi állapot a következő: 


DS) — 0O(so) y Tsa.) bt) (17.11) 
a 
ahol az egy normalizációs konstans, ami a hiedelmi állapot 1-re összegzését biztosítja. 
Ezt az egyenletet úgy rövidíthetjük. hogy b" — ELŐRE(b, a, 0). 

A RMMDF-ek megértéséhez szükséges lényegi meglátás pedig ez: az optimális cse- 
lekvés csak az ágens aktuális hiedelmi állapotától függ. Így az optimális eljárásmód 
leírható a hiedelmi állapotok cselekvésekre történő a (b) leképzésével. Ez nem függ az 
ágens aktuális állapotától, amiben tartózkodik. Ez hasznos tulajdonság, mivel az ágens 
nem ismeri az aktuális állapotát; csupán a hiedelmi állapotát. Ekkor egy RMMDF ágens 
döntési ciklusa a következő: 


1. Adott jelenlegi b hiedelmi állapot esetén hajtsuk végre az a — 77" (b) cselekvést. 
2. Fogadjuk az o megfigyelést. 
3. Állítsuk a jelenlegi állapothiedelmet ELŐRE(b, a, 0)-ra. és ismételjük meg a ciklust. 


Most úgy gondolhatunk az RMMDF-ekre, mint amelyek keresést igényelnek a hie- 
delmi állapotok terében, pontosan úgy. ahogy az érzékelő nélküli és az eshetőségi 
problémákra vonatkozó módszerek a 3. fejezetben. A fő különbség az, hogy az 
RMMEPF hiedelmi állapot tere folytonos, mivel egy RMMDF hiedelmi állapot egy 
valószínűségi eloszlás. Például a hiedelmi állapot a 4 x 3-as világ esetében egy pont 
a 11 dimenziós folytonos térben. Egy cselekvés megváltoztatja a hiedelmi állapotot 
is, nemcsak a fizikai állapotot, így kiértékelése aszerint az információ szerint tör- 
ténik, amit a cselekvés eredményeként az ágens megszerez. Az RMMDF-ekbe ezért 
beletartozik az információ értéke is (16.6. alfejezet) mint a döntési probléma egy 
komponense. 

Nézzük meg tüzetesebben a cselekvések kimenetelét. Nevezetesen, számítsuk ki 
annak valószínűségét, hogy az ágens a b hiedelmi állapotból a 4" hiedelmi állapotba jut 
az a cselekvés végrehajtása után. Ekkor, ha ismernénk a cselekvést és a bekövetkező 
megfigyelést, akkor a (17.11) egyenlet a hiedelmi állapot egy determinisztikus frissíté- 
sét adná: b" — ELŐRE(b, a, 0). Természetesen a bekövetkező megfigyelés még nem 
ismert, Így az ágens a számos lehetséges hiedelmi állapot egyikébe, 4-be kerülhet az 
előforduló megfigyelés függvényében. Az o érzékelésének valószínűsége, feltéve hogy 
a 4 hiedelmi állapotban az a cselekvés került végrehajtásra, az összes olyan s" aktuális 
állapot feletti összegzéssel adódik, amelyeket az ágens elérhet: 


P(ola,b)— 3)" P(ola,5,b) P(s"la,b) 
8; 
- ba O(s,o)P(s"]a,b) 


7-9 9O(s oD T(s a.s) bis) 
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Jelölje (b, a, b") annak a valószínűségét, hogy b-ből £/-be jutunk egy a cselekvéssel. 
Ennek felhasználásával ekkor 


T(b,a,b)—P(tla,b)— 3 P(Wlo,a,b)P(ola,b) 
o 


—-) 9 PWlosa,b) 370(5,0) DOT(s as) (5) ÚT 


ahol P(4/]o, a, b) 1, ha 4" — ELŐRE(b, a, 0), egyébként pedig 0. 

A (17.2.) egyenletet felfoghatjuk egy állapotátmenet-modellnek a hiedelmi állapot 
térben. Definiálhatunk egy jutalomfüggvényt is a hiedelmi állapotokra (azaz azon ak- 
tuális állapotok várható jutalmát, amelyekben az ágens lehet): 


p(b)— ) P(JR(5) 
f) 


Így láthatóan 7(b, a, b") és p(b) együtt egy megfigyelhető MDF-et definiál a hiedelmi 
állapotok terén. Továbbá megmutatható, hogy egy 7r" (b) optimális eljárásmód erre az 
MDF-re, szintén optimális eljárásmód az eredeti RMMDF-re. Máshogy fogalmazva, 
egy RMMDF megoldása a fizikai állapottérben redukálható egy MDF megoldására 
a hozzá tartozó hiedelmi állapot térben. Ez a tény talán kevésbé meglepő, arra gondol- 
va, hogy a hiedelmi állapot definíció szerint az ágens számára mindig megfigyelhető. 
Vegyük észre, hogy bár az RMMDF-eket sikeresen redukáltuk az MDF-ekre, a ka- 
pott MDF-eknek folytonos (és általában sokdimenziós) állapotterük van. A 17.2. és 
17.3. alfejezetekben leírt algoritmusok egyike sem alkalmazható közvetlenül ilyen 
MDF-ekre. Kiderült, hogy az érték- és eljárásmód-iterációnak kifejleszthetők olyan 
változatai, amelyek folytonos állapotú MDF-ekre is alkalmazhatók. Az alapötlet az. 
hogy egy 7(b) eljárásmód reprezentálható a hiedelmi állapot tér olyan részeinek egy 
halmazaként, amelyek mindegyikéhez egy adott optimális cselekvés tartozik.? Az érték- 
függvény b különböző lineáris függvényét rendeli az egyes térrészekhez. Minden érték- 
és eljárásmód-iterációs lépés finomít a térrészek határain, és új térrészeket vezethet be. 
Az algoritmus részletei meghaladják a könyv kereteit, de megadjuk a megoldást az 
érzékelőmentes 4 x 3-as világra. Az optimális eljárásmód a következő: 


Balra, Fel, Fel, Jobbra, Fel, Fel, Jobbra, Fel, Fel, Jobbra, Fel, Jobbra, Fel, ...) 


Az eljárásmód egy sorozat, mivel ez a probléma determinisztikus a hiedelmi állapotok 
terében — nincsenek megfigyelések. Azt a , trükköt" alkalmaztuk, hogy az ágens egyet- 
len Balra mozgással biztosítja, hogy nincs (4, 1)-ben, azért, hogy aztán meglehetős biz- 
tonsággal mozoghasson Fel és Jobbra a --1 kijárat eléréséhez. Az ágens a --1 kijáratot 
86,690 gyakorisággal éri el, és sokkal gyorsabban, mint az alfejezet elején megadott el- 
járásmód esetén, így a várható hasznossága 0,38, szemben az előző 0,08-as értékével. 
Bonyolultabb RMMDF-eknél, amikor megfigyelések is vannak, nagyon nehéz (valójában 
PSPACE-beli — azaz valóban nagyon nehéz) közelítőleg optimális eljárásmódokat találni. 
A problémák néhány tucat változóval gyakran kivitelezhetetlenek. A következő alfejezet egy 
eltérő közelítő módszert ír le RMMDF-ek megoldására, ami az előrenéző keresésen alapul. 


4 Bizonyos RMMDF-ekre az optimális eljárásmódhoz végtelen számú térrész tartozik, így az egyszerű térrészek 
listája megközelítés nem működik, és ötletesebb módszerek szükségesek még egy közelítés megtalálásához is. 
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17.5. DÖNTÉSELMÉLETI ÁGENSEK 


Ebben a fejezetben egy átfogó szemléletmódot vázolunk fel az ágensek megtervezésé- 
re részlegesen megfigyelhető. sztochasztikus környezetek esetén. A tervezés alapele- 
mei már ismertek: 


. Az állapotátmenet- és megfigyelési modelleket egy dinamikus Bayes-hálóval 
(dynamic Bayesian network) ábrázoljuk (a 15. fejezetben leírtak szerint). 

s A dinamikus Bayes-háló kiegészült döntési és hasznossági csomópontokkal, ame- 
lyek megegyeznek a 16. fejezetben szereplő döntési hálókban használatosakkal. 
A kirajzolódó modellt dinamikus döntési hálónak vagy DDH-nak (dynamic deci- 
sion network, DDN) nevezzük. 

s Egy szűrési algorítmust használunk az új érzékelések és cselekvések befogadására 
és a hiedelmi állapot reprezentációjának a frissítésére. 

s Döntéseket hozunk lehetséges cselekvéssorozatok elgondolásával és a legjobb kivá- 
lasztásával. 


Egy dinamikus Bayes-háló felhasználásának elsődleges haszna az állapotátmenet- és érzé- 
kelő modellek ábrázolásánál az, hogy felbontja az állapotleírást valószínűségi változók egy 
halmazára, hasonlóan ahhoz, ahogy a tervkészítési algoritmusok logikai ábrázolást vesz- 
nek igénybe az állapottér felbontására, amit a keresési algorítmusok használnak. Az ágens- 
terv ezért a 2. fejezetben vázolt hasznosságalapú ágens egy gyakorlati megvalósítása. 

Mivel dinamikus Bayes-hálókat használunk, visszatérünk a 15. fejezetbeli jelöléshez, 
ahol X, az állapotváltozók egy halmazát jelölte egy t időpillanatban, E, pedig a bizonyí- 
tékváltozókat. Így ahol ebben a fejezetben eddig s,-t használtunk (a t-beli állapotra), 
mostantól X,-t fogunk használni. A t-beli cselekvést A,-vel fogjuk jelölni, így a 
T(s, a, 5) állapotátmenet-modell ugyanaz, mint a P(X,, 1IX, , A), és az O(s, 0) megfi- 
gyelési modell ugyanaz, mint a P(E,JX,). A r időpontban kapott jutalmat jelöljük R, -vel, 
és U,-vel az állapot hasznosságát a ? időpontban. E szerint a jelölés szerint egy dina- 
mikus döntési háló a 17.9. ábrán látható módon néz ki. 

A dinamikus döntési hálók tömör leírást biztosítanak nagy RMMDF-ekre, így bár- 
mely RMMCF algoritmus bemenetéül szolgálhatnak, ideértve az érték- és eljárásmód- 


e el [ ső ed e 
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17.9. ábra. Egy dinamikus döntési háló általános struktúrája. Az ismert énékű változók árnyékoltak. 
A jelenlegi időpont r, és az ágensnek el kell döntenie. hogy mit tegyen — azaz választania kell egy értéket 
A, számára. A háló három jövőbeli lépésre van kibontva. és a jövőbeli jutalmakat, valamint az előrelátó 
horizonton lévő állapot hasznosságát ábrázolja. 
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iterációra való módszereket is. Ebben az alfejezetben az előrenéző módszerekre össz- 
pontosítunk, amelyek cselekvéssorozatokat képzelnek el a jelenlegi hiedelmi állapottól 
kiindulva, nagyon hasonlóan a 6. fejezetbeli játékok algorítmusaihoz. A 17.9. ábrán a 
háló három jövőbeli lépésig elképzelve szerepel; a jelenlegi és a jövőbeli döntések és a 
jövőbeli megfigyelések és jutalmak mind ismeretlenek. Figyeljük meg, hogy a háló 
csomópontokat tartalmaz az X,, , és X,42-beli jutalmakra, de hasznosságot az X 43 ese- 
tében. Ez azért van így, mert az ágensnek maximalizálnia kell az összes jövőbeli juta- 
lom (leszámítolt) összegét, és U(X,,3) reprezentálja az X, , 3-hoz tartozó és az összes ezt 
követő jutalmat. Ahogyan a 6. fejezetben, most is feltesszük, hogy U-nak csak egy 
közelítő alakja érhető el: ha elérhetők lennének pontos hasznosságértékek, akkor nem 
lenne szükség 1 lépésnél hosszabb előretekintésre. 

A 17.9. ábrán látható DDH-hoz tartozó háromlépéses előrenéző keresési fa egy részét 
a 17.10. ábra mutatja. Mindegyik háromszög alakú csomópont egy olyan hiedelmi ál- 
lapot, amiben az ágens egy A, ,; döntést hoz í — 0, I, 2, ... esetén. A kerek csomópontok 
a környezet válaszaihoz tartoznak, nevezetesen hogy milyen E,,; megfigyelés fog fel- 
bukkanni. Látható, hogy nincsen véletlen csomópont, ami a cselekvések kimeneteléhez 
tartozna. Ez azért van így, mert egy cselekvésnél a hiedelmi állapot frissítése a konkrét 
kimeneteltől függetlenül determinisztikus. 

A hiedelmi állapot az egyes háromszög csomópontoknál kiszámítható egy szűrési 
algoritmusnak a hozzávezető megfigyelések és cselekvések sorozatán való alkalmazá- 
sával. Ezzel a módszerrel, az algoritmus figyelembe veszi azt a tényt, hogy egy A; 
döntésnél az ágens számára elérhetők lesznek az E,, j, ..., E,,; érzékelések, még ha a 
időpontban nem is tudja, hogy ezek az érzékelések mi is lesznek. Ezen a módon a dön- 
téselméleti ágens automatikusan figyelembe veszi az információ értékét és információ- 
gyűjtő cselekvéseket hajt végre, ha szükséges. 

Egy döntés a keresési fából a levelek hasznosságértékének hátrafelé terjesztésével 
nyerhető ki, a véletlen csomópontoknál átlagot, a döntési csomópontokban pedig maxi- 
mumot számítva. Ez hasonló a véletlen csomópontokkal rendelkező játékfákra vonat- 
kozó VÁRHATÓMINIMAX algoritmushoz, kivéve, hogy (1) nem csak levélállapotokban 
lehet jutalom, és (2) a döntési csomópontok lelmi állapotokhoz, és nem aktuális ál- 
lapotokhoz tartoznak. A d mélységű kimerítő keresés időkomplexitása O(IDI" : JEI9), 
ahol ID] az elérhető cselekvések száma, JEl pedig a lehetséges megfigyelések száma. 
Olyan problémáknál, ahol a "y leszámítolási tényező nincs közel 1-hez, gyakran ele- 
gendő sekély keresés az optimálishoz közeli döntés megtalálásához. Az is lehetséges, 
hogy az átlagszámítás lépését a lehetséges megfigyelések mintavételezésével közelít- 
jük, az összes lehetséges megfigyelés feletti összegzés helyett. Számos más módja van 
jó közelítő megoldások gyors megtalálásának, de ezeket a 21. fejezetre hagyjuk. 

A dinamikus döntési háló alapú döntéselméleti ágenseknek számos előnye van más, 
egyszerűbb, a korábbi fejezetekben bemutatott ágensfelépítésekhez képest. Nevezete- 
sen, részlegesen megfigyelhető és sztochasztikus környezeteket kezelnek, és könnyen 
felülbírálják a terveiket" a váratlan események kezeléséhez. Megfelelő érzékelő 
modellekkel képesek kezelni az érzékelőmeghibásodást, és képesek megtervezni az 
információ begyűjtését. Az idő szorításában és komplex környezetekben , teljesítmény- 
romlásuk fokozatos", különböző közelítő technikák kihasználásával. Így jogos a kér- 
dés, hogy mi is hiányzik még? A DDH-alapú algoritmusunknak a legkomolyabb hiá- 
nyossága az előrefelé kereséstől való függés, ahogyan a II. részbeli állapottér-keresési 
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algoritmusoknak is. A IV. részben elmagyaráztuk, hogy részlegesen rendezett, absztrakt 
tervek mérlegelésének képessége célirányos kereséssel hogyan biztosította a probléma- 
megoldó képesség lényegi növekedését, különösen a tervkönyvtárakkal összeillesztve. 
Ezeket a módszereket megkísérelték a valószínűségi területre is kiterjeszteni, de ez eddig 
nem bizonyult hatékonynak. Egy második, kapcsolódó probléma a DDH nyelv alapvető 
kijelentéslogikai természete. Szeretnénk, ha az elsőrendű valószínűségi nyelvek elkép- 
zeléseit (lásd 14.6. alfejezet) ki tudnánk terjeszteni a döntéshozatal problémájára. A je- 
lenlegi kutatások azt mutatják, hogy ez a kiterjesztés lehetséges, és jelentős előnyöket 
rejt magában, ahogy ezt a fejezet végi megjegyzéseknél megtárgyaljuk. 
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Ez a fejezet a bizonytalan környezetbeli döntéshozatalra összpontosított. De mi a hely- 
zet akkor, ha a bizonytalanság más ágenseknek és azok döntéseinek köszönhető? És ha 
ezeknek az ágenseknek a döntéseit a mi döntéseink befolyásolják? Ezze! a kérdéssel 
egyszer már foglalkoztunk, amikor a 6. fejezetben a játékokat tanulmányoztuk, Ott azon- 
ban többfordulós. teljes információs játékokkal foglalkoztunk, amelyekre a minimax ke- 
reséssel optimális lépések találhatók. Ebben az alfejezetben a játékelmélet (game theory) 
azon vonatkozásait tanulmányozzuk, amelyek felhasználhatók szimultán játékok elem- 
zésére. Egyszerűsítés céljából elsőként olyan játékokat nézünk meg, amelyek csak egy 
lépés hosszúak. A , játék" szó és az egyetlen lépésre való korlátozás ezt triviálisnak tün- 
tetheti fel, de valójában a játékelméletet nagyon komoly döntéshozatali helyzetekben 
használják — ideértve a bankcsődeljárásokat, a távközlési frekvenciasávok aukcióját, a 
termékfejlesztési és ármegállapítási döntéseket, illetve a honvédelmi kérdéseket — olyan 
helyzetekben. amelyek dollármilliárdok és életek százezreinek a sorsát érintik. A játék- 
elmélet legalább kétféle módon használható fel: 
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1 Ágenstervezés (agent design): A játékelmélet képes elemezni az ágensek döntéseit, és 
kiszámítani az egyes döntések várható hasznosságát (azon feltevés mellett, hogy más 
ágensek a játékelmélet szerint optimálisan cselekednek). Például a kétujjas snól 
tékban (two-finger Morra) két játékos, 0 és E egyidejűleg felmutatja egy vagy két 
ujját. Legyen az ujjak összes száma f. Ha f páratlan, akkor 0 kap f dollárt E-től, és ha 
fipáros, akkor E kap f dollárt 0-tól. A játékelmélet képes meghatározni a legjobb stra- 
tégiát egy racionális ellenféllel szemben, és az egyes játékosok várható hasznát." 

2. Működési mód tervezés (mechanism design): Amikor a környezetet számos ágens 
népesíti be, előfordulhat, hogy a környezet szabályait (azaz a játékot, amit az ágensek- 
nek játszaniuk kell) olyannak határozhatjuk meg, hogy az összes ágens együttes hasz- 
na akkor maximális, amikor mindegyik ágens egy saját hasznát maximáló játékelmé- 
leti megoldást követ. Például a játékelmélet segíthet olyan protokollok tervezésében az 
internetes forgalomirányítók számára, hogy minden irányítónak olyan ösztönzői 
legyenek, hogy a globális átvitel maximális legyen. A működési mód tervezés arra is 
felhasználható, hogy olyan intelligens többágenses rendszereket (multiagent sys- 
tems) hozzunk létre, amelyek komplex problémákat elosztott módon oldanak meg, 
anélkül, hogy az egyes ágenseknek ismerniük kellene a megoldandó teljes problémát. 


Egy játékot a játékelméletben a következő alkotóelemek definiálnak: 


s Játékosok (player) vagy ágensek, akik döntéseket hoznak. A legnagyobb figyelem 
a kétszemélyes játékokra irányult, bár az n személyes játékok nm 5 2-re szintén gyako- 
riak. A játékosokra nagybetűs neveket használunk, mint Aliz és Bendegúz vagy O és E. 

s  Cselekvések (actions), amiket a játékosok választhatnak. A cselekvéseknek kisbe- 
tűs neveket választunk, mint az egy vagy a tanúskodik. Lehet, hogy a játékosok a 
cselekvéseknek ugyanazt a halmazát érik el, de az is lehet. hogy különbözőt. 

s Jutalommátrix (payoff matrix), ami az összes játékos cselekvéseinek mindegyik 
kombinációjára, mindegyik játékos számára megadja a hasznosságot. A jutalom- 
mátrix a kétujjas snóblijátékhoz a következő: 














[ O: egy O: kettő 
E: egy E-207--2 E-—3,0-3 
E: kettő E-—307-3 E-40--4 








Például a jobb alsó sarokban az látható, amikor 0 a kettő cselekvést és E szintén a 
kettő cselekvést választja, a jutalom E-nek 4, 0-nak pedig —4. 


Minden játékosnak a játékban választania kell, és aztán végrehajtani egy stratégiát 
(strategy) (ami a 16. fejezetben szereplő eljárásmód elnevezése a játékelméletben). 
A tiszta stratégia (pure strategy) egy determinisztikus eljárásmód, ami mindegyik 
helyzethez előír egy végrehajtandó konkrét cselekvést; az egylépéses játékokban a tiszta 





5 A snóblijáték az ellenőrzési játék (inspection game) egy szabadidős változata. Ilyen játékokban az ellenőr 
megválaszt egy napot egy létesítmény (mint például egy vendéglő vagy egy biológiai fegyvergyár) ellenőrzé- 
sére. és a létesítmény működtetője szintén megválaszt egy napot, amikor az összes kellemetlen dolgot elrejti. 
Az ellenőr győz. ha a napok különböznek, és a létesítmény fenntartója, ha ugyanazok. 


728 V7. KOMPLEX DÖNTÉSEK MEGHOZATALA 


stratégia csupán egyetlen cselekvés. A játékok elemzése vezetett el a kevert stratégiák 
(mixed strategy) gondolatához, amely eljárásmódban egy konkrét cselekvés véletlen- 
szerűen kerül kiválasztásra egy adott eloszlásból a cselekvések felett. Azt a kevert stra- 
tégiát, ami p valószínűséggel az a cselekvést, egyébként pedig a b-t választja, úgy je- 
löljük, hogy [p: a; (1 — p): b]. Például a kétujjas snóblijátékban egy lehetséges kevert 
stratégia a [(0,5: egy; 0,5: kettő]. A stratégiaprofil (strategy profil) egy hozzárendelés, 
ami mindegyik játékoshoz egy stratégiát rendel; adott stratégiaprofilnál a játék kime- 
netele (outcome) egy numerikus érték mindegyik játékoshoz. 

Egy játék megoldása (solution) egy olyan stratégiaprofil, amiben minden játékos 
egy racionális stratégiát fogad el. Látni fogjuk, hogy a játékelméletben a legfontosabb 
kérdés a , racionális" jelentésének a definiálása akkor, amikor mindegyik ágens csak 
egy részét választja meg a kimenetelt meghatározó stratégiaprofilnak. Fontos azt felis- 
merni, hogy a kimenetelek a játék egyes meneteinek a konkrét eredményei, míg a meg- 
oldások a játék elemzéséhez használt elméleti konstrukciók. Megmutatjuk. hogy bizo- 
nyos játékoknak csak a kevert stratégiák között van megoldása. Ez azonban nem jelenti 
azt, hogy egy játékosnak szó szerint egy kevert stratégiát kell elfogadnia a racionális 
viselkedéshez. 

Gondoljuk át a következő történetet: két állítólagos betörőt, Alizt és Bendegúzt tetten 
érik egy betörés helyszínéhez közel, és a rendőrség külön-külön kihallgatja őket. Mind- 
ketten tudják, hogy ha mindketten beismerik a bűncselekményt, akkor 5 év börtönt kap- 
nak betörésért, de ha mindketten tagadnak, akkor csak 1 évet kapnak lopott holmik 
birtoklásának enyhébb vádjával. Azonban a rendőrség külön-külön alkut ajánl mindket- 
tőnek: ha a partneredről tanúsítod, hogy egy betörőbanda vezetője, akkor szabadon 
engednek, míg a partnered 10 évet kap. Ekkor Aliz és Bendegúz az úgynevezett fogoly- 
dilemmával (prisoner"s dilemma) szembesülnek: tanúskodniuk kell vagy tagadniuk? 
Racionális ágensként Aliz és Bendegúz is a saját várható hasznosságát akarja maximál- 
ni. Tegyük fel, hogy Alizt teljességgel hidegen hagyja partnerének a sorsa, így az ő hasz- 
nossága a saját börtönben töltött éveinek számával arányosan csökken, függetlenül attól, 
hogy mi történik Bendegúzzal. Bendegúz teljesen hasonlóan érez. A racionális döntés 
meghozatalához mindketten megalkotják a következő jutalommátrixot: 











[ Alizztanúskodik Aliz:tagad ] 
Bendegúz:tanúskodik ] A ——5,B—-5 ] A—-10,8-0 
Bendegúz:tagad Az08- rea] Az-I,B—-I 














Aliz a következőképpen elemzi a jutalommátrixot: Tegyük fel, hogy Bendegúz tanús- 
kodik. Ha tanúskodom, 5 évet kapok, és 10 évet, ha nem, ebben az esetben a tanúsko- 
dás jobb. Másrészről, ha Bendegúz tagad, akkor 0 évet kapok, ha tanúskodom, és 
1 évet, ha tagadok, így a tanúskodás ebben az esetben is jobb. Így mindkét esetben 
számomra jobb tanúskodni, így ez az, amit tennem kell. 

Aliz felfedezte, hogy a tanúskodás a játék domináns stratégiája (dominant stra- 
tegy). Azt mondjuk, hogy egy p játékos egy s stratégiája erősen dominálja (strongly 
dominate) az 5" stratégiát, ha az s kimenetele p számára jobb, mint az 5" kimenetele, 
a többi játékos minden stratégiaválasztása esetén. Egy s stratégia gyengén dominálja 


17.6. TÖBBÁGENSES DÖNTÉSEK: A JÁTÉKELMELET 729 


(weakly dominates) 5/-t, ha s jobb, mint s" legalább egy stratégiaprofilnál, és nem 
rosszabb a többiben. Egy domináns stratégia olyan stratégia, ami az összes többit 
dominálja. Egy erősen dominált stratégiát irracionális követni, és ha létezik, irracio- 
nális eltérni a domináns stratégiától. Racionális volta miatt Aliz a domináns stratégi- 
át választja. Már csak egy kevés terminológiára van szükségünk a továbbhaladáshoz: 
egy kimenetelt Pareto-optimálisnak (Pareto optimal) nevezünk, ő ha nincs másik ki- 
menetel, amit az összes játékos preferálna. Egy kimenetel Pareto-dominált (Pareto 
dominated) egy másik kimenetel által, ha az összes játékos a másik kimenetelt pre- 
ferálná. 

Ha Aliz okos és racionális, folytatni fogja az érvelést a következőképpen: Bendegúz 
domináns stratégiája szintén a tanúskodás. Így ő is tanúskodni fog, és mindketten 5 évet 
kapunk. Amikor mindegyik játékosnak van domináns stratégiája, ezek kombinációját 
domináns stratégiai egyensúlynak (dominant strategy eguilibrium) nevezzük. Általá- 
ban egy stratégiaprofil akkor van egyensúlyi helyzetben (eguilibrium), ha egyik játékos 
sem nyer stratégiája váltásával, az összes többi játékos stratégiájának változatlansága 
mellett. Egy egyensúlyi helyzet lényegében egy lokális optimum (local optimum) az et- 
járásmódok terében: egy csúcs teteje lejtőkkel minden dimenzióban, ahol a dimenziók 
egy játékos stratégiai választásaihoz tartoznak. 

A dilemma a fogolydilemmában az, hogy az egyensúlyi helyzet kimenetele mindkét 
játékosnak rosszabb, mint az a kimenetel, amit akkor érnének el, ha mindketten meg- 
tagadnák a tanúskodást. Másképpen fogalmazva, az egyensúlyi megoldás kimenete 
Pareto-dominált a (tagad, tagad)-nak a (-1, -1)-es kimenetelével. 

"Van-e módja Aliznak és Bendegúznak a (-1, -1)-es kimenetelt elérni? Az bizonyosan 
megengedett lehetőség mindkettőjüknek, hogy megtagadják a tanúskodást, de valószínűt- 
len lehetőség. Akármelyik játékos is kezdene elmélkedni azon, hogy a tagadást választja, 
felismeri, hogy jobban teszi, ha a zanúskodik. Az egyensúlyi helyzetnek ez a vonzereje. 

A matematikus John Nash (1928-) bebizonyította, hogy minden játéknak van egy itt 
definiált típusú egyensúlyi helyzete. Ezt a tiszteletére most már Nash-egyensúlynak 
nevezik. Nyilvánvaló, hogy egy domináns stratégiai egyensúly Nash-egyensúly (Nash 
eguilibrium) (lásd 17.9. feladat), de nem minden játéknak vannak domináns stratégiái. 
Nash tétele azt mondja ki, hogy egyensúlyi stratégiák akkor is léteznek, ha nincs domi- 
náns stratégia. 

A fogolydilemmánál csak a (tanúskodik. tanúskodik) stratégiaprofil Nash-egyensúlyi. 
Nehezen látható, hogy racionális játékosok hogyan tudják elkerülni ennek a kimenetelét, 
mivel bármely javasolt nem egyensúlyi megoldásnál legalább egy játékos kísértésben 
lenne, hogy változtasson a stratégiáján. Játékelméleti kutatók egyetértenek, hogy a Nash- 
egyensúly fennállása szükséges feltétel egy megoldás fennállásához — bár abban már 
nem értenek egyet, hogy ez elégséges feltétel-e. 

A (tanúskodik, tanúskodik) megoldás könnyűszerrel elkerülhető, ha valamilyen mó- 
don megváltoztatjuk a játékot (vagy a játékosokat). Módosíthatjuk például egy olyan ite- 
rált játékra, amiben a játékosok tudják, hogy újra találkozni fognak (de az döntő, hogy 
bizonytalanok legyenek abban, hogy hányszor fognak még újra találkozni). Vagy ha az 
ágensek morális meggyőződése erősíti az együttműködést és az igazságosságot, meg- 
változtathatjuk a jutalommátrixot úgy, hogy tükrözze az egyes ágensek többiekkel való 





$ A Pareto-optímalitás a közgazdász Vilfredo Parctóról (1848-1923) kapta nevét. 


ti 
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együttműködésének a hasznosságát. Később látni fogjuk, hogy az ágens olyatén megvál- 
toztatása, hogy a számítási kapacitása korlátos, ahelyett hogy teljesen racionális követ- 
keztetésre lenne képes, szintén befolyásolja a kimenetelt, mivel azt árulhatja el az egyik 
ágensnek, hogy a másik racionalitása korlátos. 

Most nézzünk meg egy játékot, aminek nincs domináns stratégiája. Az Acme nevű 
videojáték-hardver gyártójának döntenie kell. hogy a következő játékgép DVD-ket vagy 
CD-ket használjon. Eközben a videojáték-szoftver gyártójának, Bestnek is döntenie kell. 
hogy DVD-n vagy CD-n adja ki a következő játékát. A nyereség mindkettőjüknek po- 
zitív, ha egyetértenek, és negatív, ha eltérnek, ahogy a következő jutatommátrixból ez 
látható: 

















Acme:cd 
Best:dvd A--4,B—- 
Best:cd 4-5, B-5 














Erre a játékra nincs domináns stratégiai egyensúly, de létezik két Nash-egyensúly: 
(dvd, dvd) és (cd, cd). Tudjuk, hogy ezek Nash-egyensúlyok, mivel akármelyik játé- 
kos is vált egyoldalúan egy különböző stratégiára, az rosszabbul fog állni. Most az 
ágenseknek a problémája a következő: több elfogadható megoldás is létezik, de ha az 
egyes ágensek különböző megoldást választanak, akkor a kiadódó stratégiaprofil 
egyáltalán nem lesz megoldás, és mindkét ágens veszteséget fog elszenvedni. Hogyan 
egyezhetnek meg egy megoldásban? Egy válasz erre, hogy mindkettőnek a Pareto- 
optimális megoldást kell választania (dvd, dvd); azaz leszűkíthetjük a , megoldás" de- 
finícióját az egyértelmű Pareto-optimális Nash-egyensúlyokra, feltéve, hogy létezik 
ilyen. Minden játéknak van legalább egy Pareto-optimális megoldása, de egy játék- 
nak lehet több egyensúlyi pontja, de lehet, hogy ezek nem egyensúlyi pontok. Példá- 
ul beállíthatjuk a jutalmakat a (dvd, dvd)-nél 5-re 9 helyett. Ebben az esetben két 
egyenlő Pareto-optimális egyensúlyi pont létezik. A közöttük való választáshoz az 
ágensek vagy találgatnak, vagy kommunikálnak. ami vagy egy megállapodás kimon- 
dását jelenti, ami sorrendezi a megoldásokat a játék megkezdődése előtt, vagy tárgya- 
lást jelent, hogy egy kölcsönösen előnyös megoldás alakuljon ki a játék folyamán 
(ami egy többlépéses játék részeként megjelenő kommunikációs cselekvések létét 
jelentené). A kommunikáció így pontosan ugyanazokból az okokból jelenik meg, 
mint a többágenses tervezésnél a 12. fejezetben. Az ilyen játékokat, ahol a játéko- 
soknak szükséges kommunikálniuk, koordinációs játékoknak (coordination games) 
nevezzük. 

Láttuk, hogy egy játéknak lehet több mint egy Nash-egyensúlya: honnan tudjuk, 
hogy minden játéknak van legalább egy? Az lehetséges, hogy egy játéknak nincs tiszta 
stratégiájú Nash-egyensúlya. Gondoljunk át például egy tetszőleges tiszta stratégiájú 
profilt a kétujjas snóblijátékhoz (727. oldal). Ha az ujjak összértéke páros, akkor 0 
szeretne váltani; ha páratlan, akkor pedig E szeretne váltani. Így egy tiszta stratégiájú 
profil nem lehet egyensúlyi, és kevert stratégiákat keil megnéznünk. 

De melyik kevert stratégiát? 1928-ban Neumann kifejlesztett egy módszert az optimá- 
lis kevert stratégia megkeresésére kétszemélyes zérusösszegű játékokra. A zérusösszegű 
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játék" (zero-sum games) olyan játék, amiben a jutalmak a jutalommátrix elemeiben 
nullára összegződnek. Világos, hogy a snóblijáték ilyen játék. A kétszemélyes zérus- 
összegű játékoknál tudjuk, hogy a jutalmak egyenlők és ellentétesek, így csak az egyik 
játékos jutalmait kell figyelembe vennünk, aki a maximáló lesz (ahogy a 6. fejezetben is). 
A snóblijátéknál az E páros játékost választjuk maximálónak, így a jutalommátrixot az 
Ux(e, 0) értékekkel definiálhatjuk — a jutalom £-nek, ha E e-t hajt végre és 0 0-t. 
Neumann módszerét maximin technikának nevezik, és a következő módon működik: 


s Tegyük fel, hogy úgy változtatjuk meg a szabályokat, hogy elsőként £-nek kötelező 
felfedni a stratégiáját, majd O következik. Így egy fordulókon alapuló játékot kapunk, 
amire a standard minimax algoritmust alkalmazhatjuk a 6. fejezetből. Tegyük fel, 
hogy ez egy Ur o kimenetelt ad. Nyilvánvaló, hogy ez a játék 0-nak kedvez, így a 
játék igazi hasznossága (E szempontjából) legalább Ur 9. Például ha csak tiszta stra- 
tégiákat nézünk, a minimax játékfának a gyökérbeli értéke -3 (lásd 17.11. (a) ábra), 
így tudjuk, hogy U 2 —3. 

s Most tegyük fel, hogy a szabályokat úgy változtatjuk meg, hogy elsőként 0-nak kö- 
telező felfednie a stratégiáját, majd E következik. Ennek a játéknak a minimax érté- 
ke Ur.o, és mivel ez a játék £-nek kedvez, tudjuk, hogy U legfeljebb Ur o. Tiszta 
stratégiáknál az érték --2 (lásd 17.11. (b) ábra), így tudjuk, hogy U £ 1-2. 


Ezt a két érvelést összekapcsolva láthatjuk, hogy a megoldás valódi hasznossága (U) 
eleget fog tenni annak, hogy 


UzoS US Uor vagy ebben az esetben azusz 


Az U értékének pontos megállapításához az elemzésünkben át kell térni a kevert 
stratégiákra. Elsőként vegyük észre a következőt: ha az első játékos felfedte a straté- 
giáját, a második nem veszthet azzal, hogy tiszta stratégiát követ. Az ok egyszerű: ha 
a második játékos egy [p: egy; (1 — p): kettő] kevert stratégiát játszik, akkor a várható 
hasznossága a tiszta stratégiák hasznosságainak, 4. ey-nek és upe-nek egy lineáris kom- 
binációja, (p - tegy -k (1 — p) : urenó)- Ez a lineáris kombináció nem haladhatja meg az 
ttegy ÉS AZ ttxerrő KÖZÜL a nagyobbat, így a második játékos is játszhat egy tiszta stratégiát. 
Ézt az észrevételt emlékezetünkben tartva, a minimax fáknál képzelhetjük azt, hogy 
a gyökérnél végtelen sok ág van, amelyek az első játékos által választható végtelen sok 
kevert stratégiához tartoznak. Ezek mindegyike egy kettős elágazású csomóponthoz ve- 
zet, amelyek a második játékos tiszta stratégiáihoz tartoznak. Ezeket a végtelen fákat 
úgy ábrázoljuk véges módon, hogy a gyökérnél egy ..parametrizált" választás van: 


s Ha E lép először, a helyzet a 17.11. (c) ábrán látható. E a gyökérnél [p: egy; 
(1 - p): kettő] szerint játszik, és O p értéke alapján választ egy lépést. Ha 0 egy-et 
választ, a várható jutalom (E-nek) 2p — 3(41 — p) — 5p — 3: ha O kettő-t választ, a 
várható jutalom -3p -t- 4(1 - p) — 4 - 7p. Ezeket a jutalmakat mint egyeneseket tün- 
tethetjük fel a grafikonon, ahol p 0 és 1 között lehet az x tengelyen, ahogyan az 


7 Álalánosabb az állandó összegű játékok (constant-sum games) fogalma, amelyekben a játékbeli min- 
den elemnél az összeg egy c állandót ad. Egy a személyes állandó összegű játék egy zérusösszegű játékká 
konvertálható c/n kivonásával minden jutalomból. Így a sakk. a tradicionális jutalmakkal. mint 1 a győzelemért. 
Vá a döntetlenért és 0 a veszteségért, technikailag egy állandó összegű játék c — 1-gyel, de könnyen egy zérus- 
összegű játékká konvertálható, ha minden jutalomból kivonunk 44-et. 
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a 17.11. (e) ábrán látható. 0, a minimalizáló, mindig az alsót fogja választani a két 
egyenes közül, amit az ábrán a vastag egyenes jelez. Így a legjobb, amit E tehet 
a gyökérnél, hogy p-t a metszéspontnál választja meg, aminek értéke: 


5p-3-4-7p 5 p-T7/l2 


A hasznosság E számára ebben a pontban Up a ——1/12. 

s Ha lép először, a helyzet a 17.II. (d) ábrán látható. O a gyökérnél [g: egy; 
(1 — a): kettő) szerint játszik, és E a g értéke alapján választ egy lépést. A jutalmak 
29 — 3(1-g)—59§-3é5-394 4(1-g) —4- 798 Ismét látható a 17.11. (f) ábrán, 
hogy a legjobb, amit 0 a gyökérnél tehet, hogy a metszéspontot választja: 


59-3-—-4-79 —- a9-7T/2 
A hasznosság E számára ebben a pontban Ug e — -1/12. 


Most már tudjuk, hogy a játék valódi hasznossága —1/12 és —1/12 között helyezkedik 
el, azaz pontosan -1/12! (A tanulság az, hogy ebben a játékban jobb 0-nak lenni, mint 
E-nek.) Továbbá, a valódi hasznosságot a [7/12: egy; 5/12: kettő] kevert stratégiával 
lehet elérni, amit mindkét játékosnak érdemes követnie. Ezt a stratégiát a játék 
maximin egyensúlyának nevezik (maximin eguilibrium), és ez egy Nash-egyensúly. 
"Vegyük észre, hogy az egyensúlyi kevert stratégia minden komponensének ugyanaz a 
várható hasznossága. Ebben az esetben mind az egy-nek, mind a kettő-nek ugyanaz 
a várható hasznossága, -1/12, mint magának a kevert stratégiának. 

A snóbiijátékra vonatkozó eredményünk Neumann általános eredményének egy pél- 
dája: minden kétszemélyes, zérusösszegű játéknak van egy maximin egyensúlya, amikor ke- 
vert stratégiák lehetségesek. Továbbá, egy zérusösszegű játékban minden Nash-egyensúly 
mindkét játékos számára egy maximin. A maximin egyensúly megtalálásának általános al- 
goritmusa zérusösszegű játékokban kissé bonyolultabb, mint amit a 17.11. (e) és 17.11. (£) 
ábra sugallhatna. Ha n cselekvés lehetséges, akkor egy kevert stratégia egy pont az 
n dimenziós térben, és az egyenesek hipersíkok lesznek. Az is lehetséges, hogy a második 
játékos számára bizonyos tiszta stratégiák másokkal domináltak, így ezek nem optimá- 
lisak az első játékos egyetlen stratégiája ellen sem. Az összes ilyen stratégia eltávolítása 
után (amit lehet, hogy ismétlődően kell elvégezni), az optimális választás a gyökérnél a 
legmagasabb (vagy a legalacsonyabb) metszéspontja amegmaradt hipersíkoknak. Ennek 
a választásnak a megtalálása lineáris programozási feladat (linear programming): egy 
célfüggvény maximálása lineáris kényszerek mellett. Ilyen problémák szabványos tech- 
nikákkal megoldhatók polinomiális időkomplexitással a cselekvések számában (és a ju- 
talomfüggvény megadásához használt bitek számában, ha precízek akarunk lenni). 

A kérdés továbbra is megválaszolatlan, mit kel! egy racionális ágensnek konkrétan 
tennie ha a snóblijáték egy menetét játssza? A racionális ágens le fogja vezetni azt a 
tényt, hogy a [7/12: egy; 5/12: kettő) egy maximin egyensúlyi stratégia, azt fogja fel- 
tételezni, hogy egy racionális ellenfélnél ez a tudás kölcsönös. Az ágens használhat egy 
12 oldalú kockát vagy egy véletlenszám generátort, hogy e szerint a kevert stratégia 


§ Az egy egybeesés, hogy ezek az egyenletek ugyanazok, mint a p-re vonatkozók; az egybeesés amiatt lép 
fel, mert Uy(egy. kettő) — Ur(kettő, egy)  -3. Ez azt is megmagyarázza, hogy az optimális stratégia miéri 
ugyanaz mindkét játékosnál. 
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17.11. ábra. (a) és (b): Minimax játékfák a kétujjas snóblijátékhoz, ha a játékosok a fordulókban tiszta 
stratégiát játszanak. (c) és (d): Parametrizált játékfák, ahol az első játékos kevert stratégiát játszik. A ju- 
talmak függnek a kevert stratégia (p és 9) valószínűségi paramétereitől. (e) és (f): A valószínűségi para- 
méter bármely konkrét értékénél a második játékos a két cselekvés közül a ,jobbikat" fogja választani, 
így az első játékos kevert stratágiájának az értékét a vastag vonal jelöli. Az első játékos a kevert straté- 
Bia valószínűségi paraméterét a metszéspontnál fogja megválasztani. 












szerint sorsoljon, amely esetben a várható jutalom E számára -1/12. Vagy az ágens 
egyszerűen dönthet úgy, hogy mindig egy-et vagy kertő-t játszik. A várható jutalom bár- 
mely esetben —1/12 marad E számára. Érdekes, hogy egy konkrét cselekvés egyoldalú 
megválasztása nem veszélyezteti a várható jutalmat, de ha a másik ágnes számára 
ismertté válik egy ilyen egyoldalú döntés, az már befolyásolja a várható jutalmat. hiszen 
az ellenfél ennek megfelelően igazíthatja a stratégiáját. 

A megoldások (azaz Nash-egyensúlyok) megtalálása nem zéró összegű véges játékok- 
ra kissé bonyolultabb. Az általános megközelítés kétlépéses: (1) Soroljuk fel a cselek- 
vések összes lehetséges részhalmazát, amelyek kevert stratégiákat alkothatnak. Például 
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elsőként próbálkozzunk az összes olyan stratégiaprofillal, amelyekben mindegyik játé- 
kos egyetlen cselekvést használ, aztán azokkal, amelyekben mindegyik játékos egy 
vagy két cselekvést használ és így tovább. Ez a cselekvések számában exponenciális, 
és így csak viszonylag kis játékoknál alkalmazható. (2) Minden (1)-ben felsorolt stra- 
tégiaprofilnál ellenőrizzük, hogy az egyensúlyi-e. Ez olyan egyenletek és egyenlőtlen- 
ségek egy rendszerének a megoldásával érhető el, amelyek hasonlók a zérusösszegű 
játékban használtakhoz. Két játékosra ezek az egyenletek lineárisak, és alapvető lineáris 
programozási technikákkal megoldhatók, de három vagy több játékosnál már nem- 
lineárisak, és esetleg nagyon nehezen oldhatók meg. 

Eddig csak egylépéses játékokat vizsgáltunk. A legegyszerűbb többlépéses játék az 
ismétlődő játék (repeated game), amelyben a játékosok újra és újra ugyanazzal a 
választással szembesülnek, de az egyes alkalmakkor már ismert az összes játékos ko- 
rábbi választásainak a története. Az ismétlődő játéknál egy stratégiaprofil egy cselek- 
vésválasztást ad meg mindegyik játékos számára, minden időpontban és a korábbi 
választások minden lehetséges történetére. Ahogyan az MDF-eknél, a jutalmak az idő- 
ben additívak. 

Gondoljuk át a fogolydilemma ismétlődő változatát. Együtt fog-e működni Aliz és 
Bendegúz, visszautasítva a tanúskodást, azt tudva, hogy újra fognak találkozni? A válasz 
a találkozás részleteitől függ. Tegyük fel, hogy Aliz és Bendegúz tudja, hogy pontosan 
100 menetben játszanak fogolydilemmásat. Ekkor mindketten tudják, hogy a 100. menet 
nem lesz ismételt játék — azaz, a kimenetelének nincs hatása jövőbeli menetekre -, és 
ezért ebben a menetben mindketten a domináns stratégiát, a ranúskodás-t választják. De 
a 100. menet meghatározásával a 99. menetnek nem lehet hatása következő menetekre, 
így ennek szintén lesz egy domináns stratégiai egyensúlya a (tanúskodik, tanúskodik)- 
nál. Indukcióval mindkét játékos a tanúskodást fogja választani minden menetben, fe- 
jenként összesen 500 év börtönt kapva. Eltérő megoldásokat nyerhetünk az interakció 
szabályainak a megváltoztatásával. Tegyük fel, hogy minden menet után 9999 esélye 
van, hogy a játékosok újra találkoznak. 

Ekkor a menetek várható száma még mindig 100, de egyik játékos sem tudja biztosan, 
hogy melyik menet lesz az utolsó. Ezen feltételek mellett együttműködőbb viselkedés le- 
hetséges. Például a tagadás mindegyik játékosnak egyensúlyi stratégia mindaddig, amíg 
amásik játékos nem választ tanúskodás-t. Ezt a stratégiát örökös büntetésnek (perpetual 
Punishment) nevezik. Tegyük fel, hogy mindkét játékos ezt a stratégiát fogadta el, és ez 
kölcsönösen ismert. Ekkor mindaddig, amíg egyik játékos sem választotta a tanúskodás-t, 
bármely időpontban a várható jövőbeli teljes jutalom mindegyik játékosnak 





30 
2-0,99(-D 5 —100 
1-0 
Az a játékos, aki a tanúskodás-t választja, egy 0 pontszámot nyer -1 helyett a soron kö- 
vetkező lépésben. de a teljes várható jövőbeli jutalma a következőre változik: 


00 
0--370,99"(—5) ——499,5 
1-1 
Ezért egyik lépésnél sincs indíték eltérni a (tagad, tagad)-tól. Az örökös büntetés a fo- 
golydilemma egy , kölcsönösen biztosított megsemmisítési" stratés 
egyik játékos a tanúskodás mellett dönt, ez biztosítja, hogy mindkét játékos nagy vesz- 
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teséget fog elszenvedni. De ez csak akkor elrettentő, ha a másik játékos elhiszi, hogy 
ezt a stratégiát fogadtuk el — vagy legalábbis hogy elfogadhattuk. 

Vannak más stratégiák, amelyek megbocsátóbbak. A leghíresebb a , szemet szemért" 
(tit-for-tat), ami szerint tagadás-sal kell kezdeni, majd megismételni a másik játékos 
előző lépését az összes elkövetkező lépésben. Így Aliz tagadna, ameddig Bendegúz 
tagadna, és a Bendegúz tanúskodása utáni lépésben ő is tanúskodna, de visszatérne a 
tagadáshoz, ha Bendegúz visszatért. Bár nagyon egyszerű, ez a stratégia igen robusztus- 
nak és hatékonynak bizonyult stratégiák széles köre ellen. 

Különböző megoldásokat az ágensek megváltoztatásával is kaphatunk, a találkozás 
szabályainak változtatása helyett. Tegyük fel, hogy az ágensek véges állapotú gépek n 
állapottal, és egy m 2 n lépéses játékot játszanak. Az ágensek így nem képesek repre- 
zentálni a hátramaradó lépések számát, így azt ismeretlenként kell kezelni. Így ők nem 
képesek az indukciós levezetésre, és lehetőségük van a kedvezőbb (ragad, tagad) ese- 
tet elérni. Ebben az esetben a tudatlanság áldás — vagy inkább az, hogy elhítessük az 
ellenféllel, hogy tudatlanok vagyunk. Ezekben az ismétlődő játékokban a sikerünk a 
másik játékos benyomásán múlik, hogy nyomulósok vagy mamlaszok vagyunk, és nem 
a valódi tulajdonságunkon. 

Az ismétlődő játékok teljesen általános tárgyalása meghaladja a könyv kereteit, de 
számos helyzetben megjelennek. Például konstruálhatunk egy szekvenciális játékot, ha 
a 17.1. ábra 4 x 3-as világába két ágenst behelyezünk. Ha kikötjük, hogy nem követ- 
kezik be mozgás, amikor a két ágens ugyanarra a mezőre próbál lépni (ugyanaz a prob- 
léma számos forgalmi útkereszteződésben), akkor bizonyos tiszta stratégiák örökre 
beragadhatnak. Megoldás, ha mindegyik ágens véletlenszerűen választ az előrefelé lépés 
és a helyben maradás közöt; a holtpont gyorsan feloldódik, és mindkét ágens boldog 
lesz. Pontosan ezt teszik az Ethernet-hálózatokban a csomagütközés feloldására. 

Az ismétlődő játékok jelenleg ismert megoldási módszerei a 6. fejezetből ismert több- 
fordulós játékok megoldási módszereihez hasonlítanak abban, hogy egy játékfa építhető 
a gyökértől lefelé, és megoldható a levelektől felfelé. A fő különbség az, hogy egy 
gyerekcsomópont értékei feletti egyszerű maximum- vagy minimumképzés helyett az 
algoritmusnak minden szinten meg kell oldania egy kevert stratégiájú játékot, feltételez- 
ve, hogy a gyerekcsomópontok már megoldottak, és jól definiált értékük felhasználható. 

Az ismétlődő játékokat részlegesen megfigyelhető környezetekben részleges informá- 
ciójú (partial information) játékoknak nevezik. A példák között találhatunk olyan kár- 
tyajátékokat, mint a póker és a bridzs, amelyekben mindegyik játékos a kártyáknak csak 
egy részét láthatja, de olyan komolyabb , játékokat" is, mint a nukleáris háborús model- 
lek, ahol egyik fél sem ismeri az ellenfél összes fegyverének a helyzetét. Részleges infor- 
mációjú játékokat a hiedelmi állapotok fájának a vizsgálatával oldanak meg úgy. mint az 
RMMDF-ekben (lásd 17.4. alfejezet). Fontos különbség az, hogy míg a saját hiedelmi 
állapotok megfigyelhetők, addig az ellenfél hiedelmi állapotai nem. Ilyen játékokra csak 
mostanában fejlesztettek ki a gyakorlatban használható algoritmusokat. Megoldások szü- 
lettek a póker bizonyos egyszerűbb változataira, bebizonyítva, hogy a blöffölés valóban 
racionális választás egy jól kiegyensúlyozott kevert stratégia részeként. Az ilyen tanul- 
mányokból alakult ki az a lényeges meglátás, hogy a kevert stratégiák nemcsak azért 
hasznosak, mert valakinek a cselekvését megjósolhatatlanná teszik. hanem azért is, mert 
minimalizálják annak az információnak a mennyiségét, amit az ellenfél a cselekvések 
megfigyelésével tanulni képes. Érdekes, hogy annak ellenére, hogy a bridzs játszásához 


736 17. KOMPLEX DÖNTÉSEK MEGHOZATALA 


való programok tervezői nagyon is tisztában vannak az információ gyűjtésének és elrej- 
tésének a fontosságával, senki sem javasolta véletlenszerű stratégiák használatát. 

A játékelmélet felhasználásának az ágenstervezés szélesebb területén eddig számos 
akadálya volt. Elsőként vegyük észre, hogy egy Nash-egyensúlyban egy játékos teljes 
mértékben feltételezi azt, hogy az ellenfél egyensúlyi stratégiát játszik. Ez azt jelenti, 
hogy a játékos semmilyen elvárását sem képes felhasználni a többi játékos valószínű 
cselekvésével kapcsolatban, és így lehet, hogy olyan fenyegetések elen való védeke- 
zésre vesztegeti el az értékeit, amelyek soha nem is lépnek fel. A Bayes-Nash- 
egyensúly (Bayes-Nash eguilibrium) fogalma részben ezt a hiányosságot pótolja: ez 
egy olyan egyensúly, ami megfelel egy játékos a priori valószínűség-eloszlásának a 
os síratégiái felett — másképpen fogalmazva, kifejezi egy játékos elvárásait 
átékos valószínű stratégiájáról. Másodszor, jelenleg nincs jó módszer a játékel- 
méleti és az RMMLF irányítási stratégiák összekapcsolására. Ezek és más problémák 
miatt a játékelméletet elsődlegesen inkább olyan környezetek elemzésére használják, 
amelyek egyensúlyban vannak, a környezetben lévő ágensek irányítása helyett. Hama- 
rosan látni fogjuk, hogy a játékelmélet hogyan segítheti a környezetek tervezését. 







17.7. MŰKÖDÉSI MÓD TERVEZÉS 


Az előző alfejezetben azt a kérdést próbáltuk megválaszolni, hogy , Ha adott egy játék, 
mi a racionális stratégia?" Ebben az alfejezetben azt kérdezzük, hogy , Ha az ágensek 
racionálisak, milyen játékot tervezzünk?" Pontosabban, egy olyan játékot szeretnénk 
tervezni, aminek a megoldása az egyes ágensek által követett saját racionális stratégiáik 
együttese, és ez egy globális hasznosságfüggvény maximálását eredményezi. Ezt a 
problémát működési mód tervezésnek (mechanism design) nevezik, vagy néha in- 
verz játékelméletnek (inverse game theory). A működési mód tervezés a közgazda- 
ság-tudományok és a politikai tudományok a lényege. Ágensek együttesénél ez annak 
lehetőségét hordozza magában, hogy játékelméleti működési módokat használva ügyes 
rendszereket hozunk létre korlátoltabb rendszerek együtteséből — még nem együttműkö- 
dő rendszerekből is -, nagyon hasonlóan ahhoz, ahogy emberek csoportjai olyan célokat 
tudnak elérni, amik messze túl vannak az egyéni lehetőségeken. 

A működési mód tervezés példái között olcsó repülőjegyek elárverezése, TCP- 
csomagok számítógépek közötti továbbításához megfelelő útvonal keresése, szigorló 
orvosok kórházakhoz rendelése, illetve annak eldöntése szerepel, hogy robotfocisták 
hogyan működjenek együtt a csapattársaikkal. A működési mód tervezés az 1990-es 
évektől lépett ki az az egyetemek falai amikor számos ország, a műsorszóró frek- 
venciasávok elárverezésének a problémájával szembesülve, dollárszázmilliókat vesztett 
a lehetséges bevételeiből a gyenge működési mód tervezés eredményeképpen. Formálisan 
a működési mód (mechanism) tartalmaz (1) egy nyelvet az ágensek által választható 
megengedett stratégiák (potenciálisan végtelen) halmazának a leírására és (2) egy G 
kimeneteli szabályt, ami a jutalmakat határozza meg az ágenseknek megengedett straté- 
giák egy adott stratégiaprofilja esetén. 

Első ránézésre a működési mód tervezés problémája triviálisnak tűnik. Tegyük fel, 
hogy az U globális hasznosságfüggvény dekomponálódik egyéni U; ágens hasznosság- 
függvények valamely halmazára úgy. hogy U — X/U;. Ekkor mondhatnánk azt, hogy 
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ha mindegyik ágens maximálja a saját hasznosságát, ez biztosan a globális hasznosság 
automatikusan maximálásához fog vezetni. (Például a kapitalizmus egyszeregye sze- 
rint, ha egy társadalomban mindenki megpróbál gazdagodni, a társadalom összgazdag- 
sága növekedni fog.) Sajnos ez nem működik. Az egyes ágensek cselekvései befolyá- 
solhatják a többi ágens jólétét oly módon, hogy a globális hasznosság csökken. Erre 
példa a köztegelő tragédiája (tragedy of commons), amely helyzetben az egyéni gaz- 
dálkodók az összes lábasjószágukat ingyen legeltetik a város közlegelőjén, ezért a köz- 
legelő tönkremegy, és az összes gazdálkodó nagy veszteséget szenved el. Mindegyik 
gazdálkodó egyénileg racionálisan cselekedett, azzal érvelve, hogy a közlegelő ingyenes, 
és azzal, hogy bár a közlegelő használata a tönkremeneteléhez vezet, a használatának 
a mellőzése ezt nem befolyásolja (hiszen mások úgyis használnák). Hasonló érvelések 
alkalmazhatók a szennyező anyagok kibocsátása esetén a légkör és az óceánok haszná- 
latára ís. 

Az ilyen problémák szabványos megközelítése a működési mód tervezésben az, hogy 
a köztulajdon használatáért mindegyik ágensnél költséget számítunk fel. Általánosab- 
ban, azt kel! biztosítanunk, hogy minden külsőség (externalities) — olyan globális 
hasznosságot befolyásoló tényező, amely az egyéni ágensek tranzakcióiban nincsenek 
elismerve — különállóan nevesítve megjelenjen. Ebben a nehéz a helyes árak megálla- 
pítása. Ennek a megközelítésnek a végletes formája egy olyan működési mód megalko- 
tását jelenti, amelyben mindegyik ágenstől valójában a globális hasznosság maximálá- 
sát követeljük meg. Ez megokdhatatlanul nehéz feladat az ágens számára, aki sem meg- 
becsülni nem tudja a világ jelenlegi állapotát, sem megfigyelni a cselekvéseinek az 
összes többi ágensre gyakorolt hatását. A működési mód tervezés ezért olyan működés- 
módok megtalálására összpontosít, amelyeknél az egyes ágensek döntési problémája 
könnyen megoldható. 

Gondoljuk át először az árveréseket. Az árverés a legáltalánosabb formájában egy 
működésmód bizonyos áruknak egy ajánlattevő csoport tagjai számára történő el- 
adására. Az árajánlatok, a stratégiák és a kimenetel meghatározza, hogy ki kapja az 
árukat és mennyit fizet. A mesterséges intelligencában például az árverések akkor 
jelennek meg, amikor ágensek egy csoportja eldönti, hogy együttműi enek-e egy 
közös terven. Hunsberger és Grosz megmutatta, hogy ez hatékonyan elérhető árve- 
réssel, amiben az ágensek ajánlatokat tesznek a közös tervbeli szerepükre 
(Hunsberger és Grosz, 2000). Egyelőre olyan árveréseket tekintünk át, amelyekben 
(1 egyetlen áru van, (2) mindegyik ajánlattevőnek van egy v; hasznosságértéke az 
árura, és (3) ezek az értékek csak az ajánlattevő számára ismertek. Az ajánlattevők 
megteszik a b; ajánlataikat, és a legmagasabb ajánlat nyeri el az árukat, de a műkö- 
désmód határozza meg. hogyan tehetők meg az ajánlatok, és mi a győztes által fize- 
tendő ár (ami nem szükségszerűen b;). Az árverések legismertebb típusa az angol 
árverés (English auction), amelyben az árverező mindaddig növeli az áruk árát, 
amíg csak egyetlen ajánlattevő marad, ellenőrizve közben, hogy vajon az ajánlat- 
tevők érdekeltek-e még. Ennek a működésmódnak az a tulajdonsága, hogy a leg- 
nagyobb v; értékkel bíró ajánlattevő nyeri el az árukat b,, t- d áron, ahol b,, a leg- 
magasabb ajánlat az összes többi játékos ött, és d az árverező növekménye az 
ajánlatok között.? Az angol árverésnél az ajánlattevőknek egyszerű domináns straté- 
giájuk van: addig tegyünk árajánlatokat, ameddig a jelenlegi költség a személyes 
érték alatt van. Emlékezzünk arra, hogy a , domináns" azt jelenti, hogy a stratégia 
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minden más stratégia ellen működik. Ez viszont azt jelenti, hogy egy játékos a többi 
stratégiától függetlenül választhatja ezt. Ezért a játékosoknak nem kell időt és energi- 
át vesztegetniük a többi játékos stratégiáján való elmélkedéssel. Egy működésmódot 
stratégiamentesnek (strategy-proof) nevezünk, ha a játékosoknak van domináns 
stratégiája, ami magában foglalja a valódi indítékok felfedését is. 

Az angol árverés hátrányos tulajdonsága a nagy kommunikációs költség, így vagy egy 
szobában keli az árverésnek lezajlania, vagy az összes ajánlattevőnek nagysebességű, 
biztonságos kommunikációs csatornával kell rendelkeznie. Egy kevesebb kommuniká- 
ciót igényő alternatív működésmód a zárt ajánlatú árverés (sealed bid auction). Eb- 
ben minden ajánlattevő egyetlen ajánlatot tesz. és ezt közli az árverezővel, és a legna- 
gyobb ajánlat győz. Ennek a működésmódnak az esetében az a stratégia, aminek az 
árajánlata a valódi érték, már nem domináns. Ha valakinek az értéke v;, és az elvárása 
szerint az összes többi játékos maximális ajánlata b,,, lesz, akkor az árajánlatának a v; és 
b,, 4 € közül az alacsonyabbnak kell lennie. A zárt ajánlatú árverés két hátránya, hogy 
előrdulhat, hogy a legnagyobb v; értékkel bíró játékos nem kapja meg az árukat, illetve 
az, hogy a játékosoknak fáradozniuk kell a többi játékos stratégiáján való elmélkedéssel. 

A zárt ajánlatú árverés szabályainak kis változtatásával adódik a zárt ajánlatú má- 
sodik áras árverés (sealed bid second-price auction), ami Vickrey-árverés (Vickrey 
auction) néven is ismert.!0 Az ilyen árveréseknél a győztes a második legmagasabb 
ajánlati árat fizeti a saját árajánlatának a kifizetése helyett. Ez az egyszerű módosítás 
teljesen kiküszöböli a szabványos (avagy első áras, first-price) zárt ajánlatú árverés- 
nél szükséges összetett mérlegeléseket, mivel ekkor a domináns stratégia saját értékű 
árajánlat. Ennek belátásához vegyük észre, hogy bármely játékos tekintheti az árverést 
egy kétszemélyes játéknak, figyelmen kívül hagyva az összes játékost, kivéve önmagát 
És a többi játékos közül a legmagasabb árajánlatot tevőt. Az i. játékos hasznossága a sa- 
ját b; ajánlata, a v; értéke és a többi játékos legjobb b,, ajánlata szempontjából 


uj(bi:bm) 7 b 2) za 7378 
0 egyébként 

Annak belátásához, hogy a b; — v; domináns stratégia, vegyük észre, hogy amikor 
(vy — b,,) pozitív, akkor bármelyik ajánlat optimális, ami megnyeri az árverést, És v; 
megtétele nevezetesen megnyeri az árverést. Másrészt, amikor (v; — b,,) negatív, akkor 
bármelyik ajánlat optimális, ami elveszti az árverést, és v;, megtétele nevezetesen el- 
veszti az árverést. Így a v; árajánlat optimális az összes lehetséges b, értékre, és valójá- 
ban ez csak a v; árajánlatra teljesül. Az egyszerűsége miatt, továbbá mind az árverező, 
mind az ajánlattevő számára jelentkező minimális számítási igénye miatt a Vickrey- 
árverést széles körben használják elosztott MI-rendszerek létrehozásában. 

Most gondoljuk át az internet forgalomirányítási problémáját. A játékosok a kap- 
csolódási háló gráfjában az élekhez tartoznak. Minden játékos ismeri egy üzenet kül- 
désének a költségét a saját élén át; ha nincs küldendő üzenet, akkor a költség 0. A cél 


9 Valójában van egy kis esélye, hogy a legnagyobb ; értékkel bíró játékosnak nem sikerül megszereznie az 
árukat abban az esetben, amikor ba £ Y ; £ bm "kH d. Annak az esélyét, hogy ez megtönénjen, tetszőlegesen 
kicsivé lehet tenni a d növekmény csökkentésével. 

10 William Vickreyről elnevezve, aki az 1996-os közgazdasági Nobel-díj kitüntetettje. 
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az, hogy egy üzenet számára megtaláljuk a legolcsóbb utat a kiindulástól a célig, ahol 
a teljes út költsége az egyes élek költségének az összege. A 4. fejezet számos algorit- 
must ad az élköltségek ismeretében a legrövidebb út kiszámítására, így minden, amit 
tennünk kell, az, hogy az egyes ágenseket rávegyük, hogy jelentsék a valódi c; költsé- 
güket. Sajnos, ha csupán megkérdezzük az ágenseket, akkor magas költséget fog 
jelenteni, hogy arra bátorítson, küldjük át az üzenetet máshol. Ki kell fejlesztenünk 
egy stratégiamentes működési módot. Egy ilyen működési mód, ha minden játékosnak 
fizetünk egy p; jutalmat, ami a legrövidebb, az i-edik élet nem tartalmazó út hossza 
mínusz a legrövidebb út (keresési algoritmus által kiszámolt) hossza, ahol az i-edik él 
költségét 0-nak tételezzük fel. 


P; — Hossz(út c; — 00-nél) - Hossz(út c; — 0-nál) 


Megmutatható, hogy e mellett a működési mód mellett a domináns stratégia mindegyik 
játékosnak a c; őszinte jelentése, illetve, hogy ennek megtétele a legolcsóbb utat fogja 
eredményezni. E kívánatos tulajdonság ellenére az itt vázolt működésmódot a gyakor- 
latban nem használják a nagy kommui iós és központi számítási költség miatt. 
A működési mód tervezőnek kommunikálnia kell az összes n játékossal, és aztán egy 
optimalizációs problémát kell megoldania. Ez megérheti, ha a költségek eloszlanának 
sok üzenet felett, de valós hálózatokban a c; költségek folyamatosan változnának a for- 
galom torlódása, a gépek üzemképtelenné válása és belépése miatt. Eddig teljesen 
kielégítő megoldást még nem fejlesztettek ki. 
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A fejezet megmutatta, hogyan használjuk a világról meglévő tudásunkat döntések meg- 
hozatalára, még akkor is, amikor egy cselekvés kimenetelei bizonytalanok, és a cselek- 
vésért járó jutalmat nem arathatjuk le csak több cselekvés után. A legfőbb pontok: 


s A szekvenciális döntési problémákat bizonytalan környezet esetén, más néven 
Markov döntési folyamatokat vagy MDF-ket (Markov decision process, MDP), 
teljesen definiálja egy cselekvések valószínűségi kimenetelét meghatározó állapot- 
átmenet-modell (transition model) és az egyes állapotokbeli jutalmakat meghatá- 
rozó jutalomfüggvény (reward function). 

" Egy állapotsorozat hasznossága a sorozathoz tartozó összes jutalom összege, ami le- 
het az idővel leszámítolt. Egy MDF megoldása egy eljárás (policy), ami mindegyik 
ágens által elérhető állapothoz hozzárendel egy döntést. Egy optimális eljárás maxi- 
málja a végrehajtása során fellépő állapotsorozatok hasznosságát. 

s Egy állapot hasznossága az azon állapotsorozatok várható hasznossága, amelyek 
ebből az állapotból kezdődnek, és egy optimális eljárás végrehajtása esetén lépnek 
fel. Az MDF-k megoldására szolgáló értékiteráció (value iteration) algoritmusa a 
működése során az egyenleteket iteratívan oldja meg, az egyes állapotok hasznos- 
ságait a szomszédai hasznosságához kapcsolva. 

s Az eljárásmód-iteráció (policy iteration) felváltva kiszámolja az állapotoknak az 
aktuális eljáráshoz tartozó hasznosságát, majd az aktuális hasznosságokhoz képest 
javít az aktuális eljáráson. 
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a A részlegesen megfigyelhető MDF-ek vagy RMMDF-ek sokkal nehezebben oldha- 
tók meg, mint az MDF-ek. Megoldásuk során konvertáljuk őket egy olyan MDF-be, 
amit hiedelmi állapotok folytonos terében definiálunk. Az optimális viselkedés az 
RMMDF-ekben magában foglalja az információgyűjtést a bizonytalanság csökken- 
tése céljából, és így a jövőbeli jobb döntések meghozatala miatt is. 

s Az RMMDF-környezetekre egy döntéselméleti ágens hozható létre. Az ágens egy 
dinamikus döntési hálót (dynamic decision network) használ az állapotátmenet- 
modell és megfigyelési modell ábrázolására, a hiedelmi állapotának frissítésére, 
illetve lehetséges cselekvési sorozatok előre elgondolásához. 

s A játékelmélet (game theory) olyan szituációkban írja le az ágensek racionális 
viselkedését, amelyekben több ágens egyidejű interakciója van jelen. A játékok meg- 
oldásai Nash-egyensúlyok — olyan stratégiaprofilok, amelyekben egyik ágensnek 
sincs indítéka a megadott stratégiától eltérni. 

s A működési mód tervezés (mechanism design) használható fel az ágensek interak- 
cióját megadó olyan szabályok megállapítására, amelyek egy globális hasznosságot 
az egyéni racionális ágensek tevékenységén keresztül maximálnak. Néha léteznek 
olyan működésmódok, amelyek ezt a célt úgy érik el, hogy az egyes ágenseknek 
nem kell meggondolniuk a többi ágens által hozott döntéseket. 


Az MDF-ek és az RMMDF-ek világára vissza fogunk térni a 21. fejezetben, amikor a 
megerősítéses tanulás módszerét tanulmányozzuk, ami lehetővé teszi az ágens számá- 
ra, hogy a tapasztalatai alapján javítsa a viselkedését szekvenciális, bizonytalan környe- 
zetekben. 


Irodalmi és történeti megjegyzések 


Richard Bellman kezdeményezte a szekvenciális döntési problémák modern megköze- 
lítési módját, és javasolta a dinamikus programozás módszerét általában és külön az 
értékiterációval kapcsolatban is (Bellman, 1957). Egy PhD-disszertációban Ron Howard 
vezette be az eljárásmód-iterációt és az átlagjutalom fogalmát végtelen horizontú prob- 
lémák megoldására (Howard, 1960). Számos további eredményt Bellman és Dreyfus 
vezettek be (Bellman és Dreyfus, 1962). A módosított eljárásmód-iteráció van Nunentől, 
illetve Putermantól és Shintől származik (van Nunen, 1976; Puterman és Shin, 1978). 
Az aszinkron eljárásmód-iterációt Williams és Baird elemezték. tőlük származik a (17.9) 
egyenletbeli korlát is az eljárásmód-veszteségre (Williams és Baird, 1993). A leszámí- 
tolás technikáját stacionárius preferenciák segítségével megfogalmazva Koopmans dol- 
gozta ki (Koopmans, 1972). A (Bertsekas, 1987; Puterman, 1994; Bertsekas és Tsítsiklis, 
1996) könyvek precíz bevezetést adnak a szekvenciális döntési problémákhoz. Papa- 
dímitriou és Tsitsiklis az MDF-k számítási komplexitásáról közölnek eredményeket 
(Papadimitriou és Tsitsiklis, 1987). 

Sutton és Watkins nagy hatású munkái, amelyek az MDF-ek megoldására szolgáló 
megerősítéses tanulási módszerekre irányultak, jelentős szerepet játszottak az MDF-ek 
megismertetésében az MI-kutatás területén (Sutton és Watkins, 1988), hasonlóan Barto 
és társainak későbbi áttekintéséhez (Barto és társai, 1995). (Werbos [1977] korábbi mun- 
kája számos hasonló ötletet tartalmazott, de nem vált ilyen széles körben elfogadottá.) 
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Az első kapcsolatot az MDF-ek és a mesterséges intelligencia tervezési problémái 
között Sven Koenig teremtette meg (Koenig, 1991), aki megmutatta hogyan nyújtanak 
a valószínűségi STRiIPS operátorok egy tömör ábrázolást az állapotátmenet-modellek 
számára. (Lásd még Wellman, 1990b.) Dean és munkatársai, illetve Tash és Russell 
munkáikban a nagy állapotterek miatti kombinatorikus problémákon kíséreltek meg úr- 
rá lenni korlátozott keresési horizont és absztrakt állapotok felhasználásával (Dean és 
társai, 1993); Tash és Russell, 1994). Az információ értékén alapuló heurisztikák fel- 
használhatók olyan állapottérrészek kiválasztására, ahol a horizont lokális kiterjesztése 
a döntés minőségének jelentős javulását eredményezi. Ezt a megközelítést használva az 
ágensek az időkényszerekhez igazíthatják az erőfeszítéseiket, és érdekes viselkedést 
alakíthatnak ki, mint például a jól ismert , kitaposott utak" használatát az állapottérben 
való gyors útkeresésnél, elkerülve az optimális döntések újbóli kiszámítását az egyes 
pontokban. Boutilier és munkatársai mostani munkái propozicionális és elsőrendű kife- 
jezéseken alapuló szimbolikus reprezentációk dinamikus programozásbeli felhasználá- 
sára összpontosultak, mind az állapotátmenet-modellek, mind az értékfüggvények ese- 
tében (Boutilier és társai. 2000; 2001). 

Azt a megfigyelést, hogy a részlegesen megfigyelhető Markov döntési folyamatok 
átalakíthatók hagyományos Markov döntési folyamatokká hiedelmi állapotok felhasz- 
nálásával, Astrom közli (Astrom, 1965). Az első teljes algoritmust a részlegesen meg- 
figyelhető Markov döntési folyamatok egzakt megoldására Edward Sondik javasolta 
a PhD-disszertációjában (Sondik, 1971). (Egy későbbi folyóiratcikk (Srmallwood és 
Sondik, 1973] tartalmaz néhány hibát, de jobban elérhető.) Az RMMDF-el kapcsolatos 
aktuális eredmények áttekintését adja Lovejoy (Lovejoy, 1991). Az első jelentős ered- 
mény az MI területén a Witness-algoritmus volt (Cassandra és társai, 1994; Kaelbling 
és társai, 1998), ami egy javított változata az RMMDF értékiterációjának. Hamarosan 
következtek más algoritmusok, köztük egy Hansentól származó megközelítés, ami egy 
eljárásmódot fokozatosan hoz létre egy végesállapotú automata formájában (Hansen, 
1998). Az eljárásmód ezen ábrázolásában a hiedelmi állapotok közvetlenül az automata 
konkrét állapotaihoz tartoznak. Közelítőleg optimális eljárásmódok az RMMDF-ekhez 
olyan eljárással hozhatók létre, ahol az előrefelé keresést a lehetséges megfigyelések és 
cselekvések kimeneteleinek mintavételezésével kombináljuk (Kearns és társai, 2000; 
Ng és Jordan. 2000). További. az RMMDF-ekre vonatkozó munkákat a 21. fejezetben 
tárgyalunk. 

A dinamikus döntési hálókat használó ágensarchitektúra alapötleteit Dean és Kana- 
Zawa javasolták (Dean és Kanazawa, 1989a). Dean és Wellman könyve, a Planning and 
Conrrol, sokkal részletesebb kapcsolatot teremt a DBH/DDH-modellek és a szűrés 
klasszikus szabályozáselméletbeli szakirodalma között (Dean és Wellman, 1991). Tatman 
és Shachter mutatta meg, hogy hogyan alkalmazhatók dinamikus programozási algoritmu- 
sok DDH-modellekre (Tatman és Shachter, 1990). Russell különböző módszereket közöl 
ilyen ágensek felskálázására. és számos nyitott kutatási kérdést fogalmaz meg (Russell, 
1998). 

A játékelmélet kezdetei a 17. századra nyúlnak vissza, Christiaan Huygens és Gott- 
fried Leibniz javaslataihoz, a versengő és együttműködő emberi interakciók tudományos 
és matematikai vizsgálatára. A 19. század folyamán számos vezető közgazdász 
alkotott egyszerű matematikai példákat, hogy a versengési helyzetek konkrét eseteit 
elemezze. Az első formális eredmények a játékelméletben Zermelótól származnak 
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(Zermelo, 1913) (aki egy évvel korábban a minimax keresés egy — bár hibás — válto- 
zatát javasolta játékokra). Emil Borel vezette be a kevert stratégia fogalmát (Borel, 
1921). Neumann János bizonyította be, hogy minden kétszemélyes, zérusösszegű játék- 
nak van egy maximin egyensúlya a kevert stratégiák körében és egy jól definiált értéke 
(Neumann, 1928). Neumann együttműködése a közgazdász Oskar Morgensternnel 
vezetett a Theory of Games and Economic Behavior c. könyv megjelenéséhez 1944-ben, 
ami a játékelmélet meghatározó könyve. A könyv megjelenése a háború miatti papír- 
hiány miatt késett, míg végül a Rockefeller család egy tagja személyesen támogatta 
a könyv kiadását. 

John Nash, 1950-ben, 21 évesen jelentette meg elgondolásait az általános játékbeli 
egyensúlyi helyzetekkel kapcsolatban. Az egyensúlyi megoldás általa megadott defi- 
níciója, bár Cournot munkáján alapult (Cournot, 1838), úgy vált ismertté, mint Nash- 
egyensúly. Az 1959-től fellépő skizofréniája miatti hosszú szünet után Nash 1994-ben 
közgazdasági Nobel-díjat kapott (megosztva Reinhart Seltennel és Harsányi Jánossal). 

A Bayes-Nash-egyensúlyt Harsányi közli (Harsányi, 1967) és Kadane és Larkey elemzi 
(Kadane és Larkey, 1982). A játékelmélet ágensek vezérlésében történő felhasználásának 
bizonyos kérdéseit Binmore tárgyalja (Binmore, 1982). 

A fogolydilemmát mint tantermi példát Albert W. Tucker alkotta meg és Axelrod tár- 
gyalja részletesen (Axelrod, 1985). Az ismétlődő játékokat Luce és Raiffa vezette be 
(Luce és Raiffa, 1957) mint részleges információjú játékokat (Kuhn, 1953). 

Az első gyakorlati algoritmust részleges információjú játékokra az MI területén 
Koller és munkatársai fejlesztették ki (Koller és társai, 1996); Koller és Pfeffer cikke 
olvasmányos bevezetést ad a terület általános részeihez és egy működő rendszert ír le 
szekvenciális játékok ábrázolására és megoldására (Koller és Pfeffer, 1997). A játék- 
elméletet és az MDF-eket a Markov-játékok elméletében egységesíti Littman (Líttman, 
1994). Shapley valójában már Bellman előtt közölte az értékiteráció algoritmusát 
(Shapley, 1953), de az eredményei nem váltak ismertté, talán amiatt, hogy nem a 
Markov-játékok keretei között voltak megfogalmazva. A játékelmélet általános tár- 
gyalását tartalmazzák a (Myerson, 1991; Fudenberg és Tirole, 1991; Osborne és Rubin- 
stein, 1994) művek. 

A köztulajdon tragédiáját, ami működési mód tervezés egy motiváló problémája, Hardin 
mutatta be (Hardin, 1968). Hurwicz alkotta meg a működési mód tervezés matematikai 
alapjait (Hurwicz, 1973). Milgrom egy általa tervezett, akár több milliárd dolláros téte- 
lekre is szánt árverés működésmódot közöl (Milgrom, 1997). Az árverések a tervezés- 
ben (Hunsberger és Grosz, 2000) és az ütemezésben is felhasználhatók (Rassenti és tár- 
sai, 1982). Varian rövid áttekintést ad a számításelméleti szakirodalomhoz kapcsolódó 
hivatkozásokkal együtt (Varian, 1995), a Rosenschein és Zlotkin szerzőpárostól pedig 
egy könyv terjedelmű tárgyalás jelent meg elosztott MI-alkalmazásokról (Rosenschein 
és Zlotkin, 1994). Az elosztott M1I-ben más nevek alatt folynak kapcsolódó munkák, ide- 
értve az együttes intelligenciát (Collective Intelligence), (Tumer és Wolpert, 2000) és a 
piacalapú szabályozást (market-based control) (Clearwater, 1996). Az árverések számí- 
tási vonatkozásairól gyakran az ACM Conferences on Electronic Commerce-en jelennek 
meg cikkek. 
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Feladatok 


17.1. 


172. 


17.3. 


174 


17.5. 


A 17.I. ábra által mutatott 4 x 3-as világ esetén számítsa ki mely négyzetek és 
milyen valószínűséggel érhetők el az [1, 1]-ből a [Fel, Fel, Jobbra, Jobbra, 
Jobbra) cselekvéssorozattal. Magyarázza el, hogyan kapcsolódik ez a számítás 
egy rejtett Markov-modell előre elgondolásához (, projecting"). 


Tegyük fel. hogy egy állapotsorozat hasznosságát a sorozat állapotaiban kapott 
jutalmak maximumaként definiáljuk. Mutassuk meg, hogy ez a hasznosságfügg- 
vény nem eredményez stacionárius preferenciákat az állapotszekvenciák között. 
Lehetséges-e mégis olyan hasznosságfüggvényt definiálni az állapotokon, hogy 
a MVH-döntéshozatal optimális viselkedést adjon? 


Pontosan konvertálható-e egy véges keresési probléma Markov döntési problé- 
mává úgy, hogy az utóbbi optimális megoldása az előzőnek is optimális megol- 
dása legyen? Ha igen, magyarázza el pontosan, hogyan konvertálja a problémát, 
és hogyan konvertálja a megoldást visszafelé; ha nem, akkor magyarázza el, 
hogy miért nem (azaz adjon ellenpéldát). 


Képzeljünk el egy leszámítolattan MDF-et három állapottal, (1, 2, 3) és sorrend- 

ben a következő jutalmakkal -1, -2, 0. A 3-as állapot egy végállapot. Az 1-es és 

2-es állapotokban két lehetséges cselekvés van: a és b. Az állapotátmenet- 
modell a következő: 

s — Az l-es állapotban az a cselekvés az ágenst a 2-es állapotba mozgatja 0.8 
valószínűséggel, míg 0,2 valószínűséggel helyben hagyja. 

s — Az 2-es állapotban az a cselekvés az ágenst az 1-es állapotba mozgatja 0,8 
valószínűséggel, és 0,2 valószínűséggel helyben hagyja. 

s — Mind az 1-es, mind a 2-es állapotban a b cselekvés az ágenst a 3-as állapot- 
ba mozgatja 0,1 valószínűséggel, és 0,9 valószínűséggel helyben hagyja. 

Válaszolja meg a következő kérdéseket: 

(a) Mi határozható meg kvalitatívan az optimális eljárásmódról az 1-es és a 
2-es állapotokban? 

(b) Alkalmazzon eljárásmód-iterációt az optimális eljárásmód, illetve az 1-es 
és a 2-es állapotok értékének a meghatározására. Minden lépést teljesen 
illusztráljon. Tegyük fel, hogy a kezdeti eljárásmód mindkét állapotban a b 
cselekvés. 

(c) Mi történik az eljárásmód-iterációval, ha a kezdeti eljárásmód mindkét ál- 
lapotban az a cselekvés? Segít a leszámítolás? Függ-e az optimális eljárás- 
mód a leszámítolási tényezőtől? 


Alkalmanként az MDF-ek megadása tartalmaz egy R(s, a) jutalomfüggvényt, 

ami a véghezvitt cselekvéstől függ, vagy egy R(s, a, s") jutalomfüggvényt, ami 

még a kimeneteli állapottól is függ. 

(a) Írja fel a Bellman-egyenleteket ezt a formalizmust használva. 

(b) Mutassa meg, hogyan lehet egy R(s, a, s") jutalomfüggvényt tartalmazó 
MDF-et átalakítani egy másik, R(s, a) jutalomfüggvényt tartalmazó MDF-be 
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úgy, hogy az optimális eljárásmódok az új MDF-ben pontosan megfeleljenek 
az eredeti MDF-beli optimális eljárásmódoknak. 

(c) Most ugyanígy konvertálja az R(s, a)-t tartalmazó MDF-eket R(5)-t tartal- 
mazó MDF-ekbe. 


Tekintsük a 17.1. ábrán látható 4 x 3-as világot. 


tgzfé (a) Valósítson meg egy olyan környezetszimulátort erre a környezetre, 


17.7. 


17.8. 


17.9. 


amelyben a környezet földrajzi sajátosságai könnyen megváltoztathatók. 
Ehhez egy bizonyos forráskód már elérhető a könyv forráskódtárában a 
világhálón. 

(b) Hozzon létre egy eljárásmód-iterációt használó ágenst, és mérje meg a tel- 
jesítményét a környezetszimulátorban különböző kiindulási állapotokból. 
Végezzen nagyszámú kísérletet mindegyik kiindulási állapotból, és hason- 
lítsa össze a futásonként kapott összjutalmak átlagát az állapot hasznossá- 
gával (amit a létrehozott algoritmus határozott meg). 

(c)  Kísérletezzen a környezet méretének a megnövelésével. Hogyan változik az 
eljárásmód-iteráció futási ideje a környezet méretének a változásával? 


A 17.1. ábrán mutatott környezetre keresse meg az R(5s) függvényre az összes 
küszöbértéket, azaz azokat az értékeket, amelyek átlépésekor az optimális eljá- 
rásmód megváltozik. Ehhez egy módszer szükséges az optimális eljárásmód 
meghatározásához és egy rögzített R(s) esetén az értékének a kiszámításához. 
(Segítség: bizonyítsa be, hogy az érték minden rögzített eljárásmódnál R(5)-sel 
lineárisan változik.) 


Ebben a feladatban kétszereplős MDF-ekkel foglalkozunk, amelyek a zénus- 

összegű, többfordulós játékokhoz tartoznak, mint amilyenek a 6. fejezetben sze- 

repelnek. Legyen a két játékos A és B, és legyen R(5) az A játékos jutalma az s 

állapotban. (B jutalma mindig egyenlő és ellentétes előjelű.) 

(a) Legyen U4(5) az s állapot hasznossága, amikor A lépése következik s-ben, 
és legyen Up(s) az s állapot hasznossága, amikor B következik s-ben. 
Az összes jutalom és hasznosság A szempontjából van megfogalmazva 
(pontosan úgy, ahogyan a minimax játékfában). Írja fel az U4(5)-t és az 
Up(5)-t definiáló Bellman-egyenleteket. 

(b) Magyarázza el, hogyan végezhet kétszemélyes értékiterációt ezekkel az 
egyenletekkel, és adjon meg egy alkalmas leállási kritériumot. 

(c) "Tekintsük a 6.14. ábrán látható játékot a 241. oldalról. Rajzolja fel az álla- 
potteret (a játékfa helyett), folytonos vonallal mutatva A mozgásait és szag- 
gatott vonallal 8 mozgásait. Jegyezze fel minden állapothoz az R(s) értékét. 
Hasznos lehet az (s4, sp) állapotok elrendezése egy kétdimenziós rácson, 
sa-t és s-t ,koordinátaként" használva. 

(d) Most alkalmazza a kétszemélyes értékiterációt a játék megoldására, és szár- 
maztassa az optimális eljárásmódot 


Mutassuk meg, hogy egy domináns stratégiai egyensúly egy Nash-egyensúly, 
de ez visszafelé nem igaz. 
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17.10. A kő-papír-olló gyerekjátékban mindegyik játékos egyszerre felmutatja a válasz- 
tását, ami kő, papír vagy olló. A papír becsomagolja a követ, a kő kicsorbítja az 
ollót, az olló elvágja a papírt. A kiterjesztett kő-papír-olló-tűz-víz változatban 
atűz üti a követ, papírt és ollót, a kő, papír és olló üti a vizet, és a víz üti a tüzet. 
Írja fel a jutalmazási mátrixot, és keressen egy kevert stratégiájú megoldást a já- 
tékhoz. 


17.11. Oldja meg a háromujjas snóblijátékot. 


17.12. A Nemzeti Jégkorong Szövetségben (National Hockey League) 1999 előtt a csa- 
Patok 2 pontot kaptak a győzelemért, 1-et a döntetlenért és 0-t, ha veszítettek. 
Ez zérusösszegű játék? 1999-ben a szabályokat úgy módosították, hogy egy 
csapat 1 pontot kap. ha hosszabbításban kap ki. A győztes csapat továbbra is 2 
Pontot kap. Hogyan változtatja meg ez a módosítás a fenti kérdésekre a válaszo- 
kat? Ha törvényes lenne, mikor volna racionális a két csapatnak titokban meg- 
egyezni, hogy a rendes játékidőben döntetlent érnek el, és majd a hosszabbítás- 
ban döntik el a küzdelmet? Tegyük fel, hogy mindegyik csapat számára a kapott 
pontszámok jelentik a hasznosságot, és hogy létezik egy kölcsönösen ismert p 
a priori valószínűség, hogy az első csapat hosszabbításban fog nyerni. Milyen 
P értékekre értene egyet mindkét csapat ezzel az egyezséggel? 


17.13. A következő jutalommátrix Blindertől származik, amit Bernstein közöl (Blinder, 
1983; Bernstein, 1996), a politikusok és a jegybank (Federal Reserve) közötti já- 











tékot ábrázolja. 
Bank: szigorít 
Pol: szigorítj 8—7,P-1 
Pol: semmi [ B — 5-2 


Pol: lazít B—3P-3 





A politikusok lazíthatják vagy szigoríthatják a pénzügyi politikát, míg a jegy- 
bank lazíthatja vagy szigoríthatja a monetáris politikát. (És természetesen mind- 
két oldal választhatja azt, hogy nem tesz semmit.) Mindegyik oldalnak vannak 
preferenciái, hogy kinek mit kell tennie — egyik oldal sem szeretne rossznak lát- 
szani. A mutatott jutalmak egyszerűen sorrendi rangok: 9 az első választásért és 
végül I az utolsóért. Keresse meg a játék Nash-egyensúlyát a tiszta stratégiák 
között. Ez Pareto-optimális megoldás? Az olvasó esetleg érdemesnek tartja ele- 
mezni a jelenlegi kormány politikáját ennek fényében. 


VI. RÉSZ 
TANULÁS 





18. MEGFIGYELÉSEK ALAPJÁN 
TÖRTÉNŐ TANULÁS 


Ebben a fejezetben olyan ágensekkel foglalkozunk, amelyek saját tapasztalataik szor- 
gos tanulmányozásával javítják teljesítményüket. 


A tanulás alapgondolata az, hogy a megfigyeléseket ne csak az ágens jelenlegi cselekvé- 
seinek kialakítására használjuk, hanem arra is, hogy javítsuk a cselekvésre való jövőbeli 
képességeit. A tanulás aközben zajlik, míg az ágens megfigyeli a környezettel való köl- 
csönhatásait és saját döntéshozó folyamatait. A tanulás széles skálán értelmezhető: egyik 
végén a tapasztalatok egyszerű memorizálása található, amit a 10. fejezetben megismert 
wumpus ágens példáz, a skála másik végén pedig a tapasztalatok alapján kialakított 
komplett tudományos elmélet áll, mint például Albert Einstein elmélete. Ebben a fejezet- 
ben a megfigyeléseken alapuló induktív tanulással (inductive learning) foglalkozunk. 
Speciálisan azzal, hogy hogyan tanulhatók meg a propozíciós logikában megfogalmazott 
egyszerű elméletek. Annak elemzésére, elméleti magyarázatára is sor kerül, hogy miért 
működik az induktív tanulás. 


18.1. TANULÁSI FORMÁK 


A második fejezetben láttuk. hogy a tanuló ágens felfogható úgy, mint aminek van egy 
cselekvő komponense (performance element), amellyel eldönti, hogy milyen cselek- 
vést válasszon, és egy tanuló komponense (learning element), amellyel módosítja ezt 
a cselekvő elemet annak érdekében, hogy a későbbiekben jobb döntéseket hozzon (lásd 
2.15. ábra). A gépi tanulással foglalkozó kutatók a tanuló komponensek széles válasz- 
tékával álltak elő. Ezek megértését segíti, ha megnézzük, hogy a leendő működési terü- 
letük hogyan befolyásolja tervezésüket. A tanuló komponens tervezését három dolog 
befolyásolja alapvetően. Ezek: 


s A cselekvő elem mely komponenseit akarjuk tanítani. 
s Milyen visszacsatolás áll rendelkezésre ezen komponensek tanítására. 
. Hogyan reprezentáljuk a komponenseket. 


Ezeket a szempontokat rendre elemezni fogjuk. Láttuk, hogy számos lehetőség van 
a cselekvő elemek építésére, a 2. fejezetben számos ágenskialakítást megismertünk 
(lásd 2.9., 2.11.. 2.13. és 2.14. ábra). Ezeknek az ágenseknek a komponensei a követ- 
kezőket tartalmazzák: 


1. Az aktuális állapot feltételeinek közvetlen leképezése cselekvésekre. 
2. Olyan lehetőség, amely egy megfigyelési szekvenciából a világ releváns tulajdonsá- 
gaira képes következtetni. 
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3. A világ alakulására vonatkozó, valamint az ágens lehetséges cselekvéseinek követ- 
kezményeit leíró információ. 

4. A világ lehetséges állapotainak számunkra kívánatos voltát megadó hasznosság- 
információ. 

5. Cselekvés-hasznosság információ, amely az egyes cselekvések kívánatosságát jelzi 
számunkra. 

6. Célok: ezek olyan állapotosztályokat adnak meg, amelyek elérése az ágens hasznos- 
ságát maximálja. 


Megfelelő visszacsatolás alkalmazása esetén ezen komponensek mindegyike tanulható. 
Vegyünk például egy ágenst, amely taxivezetést tanul. Minden egyes alkalommal, ami- 
kor a felügyelő elkiáltja magát: , Fék!", az ágens megtanulhat egy feltétel-cselekvés 
fékezési szabályt ( I. komponens). Amennyiben számos olyan képet mutatunk az ágens- 
nek, amelyről közöljük, hogy busz van rajta, akkor megtanulhatja felismerni azokat (2). 
Ha egy cselekvést próbálgat. és megfigyeli az eredményt — például nedves úton erősen 
fékez —, megtanulhatja cselekvéseinek hatását (3). Ha nem kap borravalót utasától, akit 
jól összerázott az út, akkor értékes elemekkel gazdagíthatja az általános hasznosság- 
függvényét (4). 

Az ágens előtt álló tanulási folyamat meghatározásában rendszerint a visszacsatolás 
jellege a legfontosabb faktor. A gépi tanulás területén általában három esetet különböz- 
tetnek meg: ellenőrzött (supervised), nem ellenőrzött (unsupervised) és megerősítéses 
(reinforcement) tanulást. 

Az ellenőrzött tanulás (supervised learning) egy leképezésnek a bemeneti és kíme- 
neti minták alapján történő megtanulását jelenti. Az (1), (2) és (3) esetek mindegyike 
az ellenőrzött tanulás példája. Az (1) esetben az ágens a fékezés feltétel-cselekvés 
szabályát tanulja — ez az állapottérről egy Boole-típusú kimenetre való leképezés (fékez- 
zen vagy ne fékezzen). A (2) esetben az ágens képekről egy Boole-típusú kimenetre való 
leképezést tanul meg (tartalmaz-e a kép buszt, vagy sem). A (3) esetben a tanult fékezé- 
si elmélet egy, az állapotok és a fékezési cselekvések teréről a — mondjuk méterben 
mért — megállási útra történő leképezés. Vegyük észre, hogy az (1) és (2) esetekben 
a tanító szolgáltatta a mintákhoz tartozó helyes választ: a harmadikban a kimeneti érté- 
keket közvetlenül az ágens észlelései szolgáltatták. Teljesen megfigyelhető környezet 
esetén mindig fennáll a lehetőség, hogy az ágens megfigyeli a cselekvésének következ- 
ményeit, így használhat ellenőrzött tanulási módszereket annak érdekében, hogy meg- 
jósolja azokat. Részlegesen megfigyelhető környezetben nehezebb a probléma, mert 
a közvetlen hatások láthatatlanok maradhatnak. 

Nem ellenőrzött tanulási (unsupervised learning) probléma esetén bemeneti min- 
ták tanulása történik, de a kimeneti kívánt minták nem biztosítottak. Például egy taxi- 
vezető ágens apránként kialakíthatja a , jó közlekedési napok" és a . rossz közlekedési 
napok" koncepcióját, anélkül hogy bármikor címkézett példákat kapott volna bárme- 
lyikről. Egy tisztán nem ellenőrzött tanulást végző ágens nem képes megtanulni, hogy 
mit cselekedjék, mivel nincs olyan információja, amely egy cselekvést helyesnek vagy 
egy állapotot kívánatosnak minősítene. A nem ellenőrzött tanulást elsősorban a valószí- 
nűségi következtető rendszerek kapcsán fogjuk tárgyalni (lásd 20. fejezet). 

A megerősítéses tanulás (reinforcement learning) problémája, amelyet a 21. fejezet- 
ben tárgyalunk, a legáltalánosabb a három közül. Ahelyett hogy egy tanító útmutatását 
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követhetné, egy megerősítéses tanulást végző ágensnek megerősítési információ alap- 
ján kell tanulnia.! Például a borravaló hiánya az út végén (vagy egy hatalmas számla, 
ha beleszáll az előtte haladó kocsiba) némi információt nyújt az ágensnek arról, hogy 
viselkedése nem volt megfelelő. A megerősítéses tanulás tipikusan magában foglalja azt 
a részproblémát, hogy az ágensnek meg kell tanulnia azt is, hogyan működik a világ. 

A megtanult információ reprezentációja szintén nagyon fontos szerepet játszik ab- 
ban, hogy meghatározhassuk azt, hogyan is kell működnie a tanulási algoritmusnak. 
Egy ágens bármelyik komponense reprezentálható az ebben a könyvben található sémák 
bármelyikével. Számos példát láttunk: súlyozott polinomokat, amelyeket a játékot játszó 
ágensek használtak hasznosságfüggvényként; ítéletkalkulus-beli és elsőrendű logikai 
állításokat, amelyeket logikai ágensek használtak; valamint valószínűségi leírásokat, mint 
például a Bayes-hálókat, amelyeket döntéselméleti ágensek használtak következtető kom- 
ponensként. Ezek mindegyikére alkottak hatékony tanulási eljárásokat. Ebben a fejezet- 
ben a propozíciós logikát alkalmazó módszereket tárgyaljuk. A 19. fejezet az elsőrendű 
logikát alkalmazó módszereket mutatja be, míg a 20. fejezet a Bayes-hálókat és a neurális 
hálókat tárgyalja (amelyek speciális esetként tartalmazzák a lineáris polinomokat). 

A tanuló rendszerek tervezésének utolsó fontos tényezője az a priori információ ren- 
delkezésre állásának kérdése. Az MI, a számítástudomány és a pszichológia területén a 
tanulással foglalkozó kutatás nagy része azzal az esettel foglalkozott, amikor kezdetben 
az ágensnek semmi információja nincs arról, amit megpróbál megtanulni. Bár ez egy fon- 
tos speciális eset, de egyáltalán nem ez az általános. A legtöbb emberi tanulás egy jó adag 
kiinduló háttértudásra épül. Néhány pszichológus és nyelvész szerint még az újszülöttek- 
nek is van ismeretük a világról. Bármi is legyen az igazság ezt illetően, az kétségtelen. 
hogy a kiinduló tudás rengeteget segíthet a tanulásban. Buborék-kamra fényképek alap- 
ján egy fizikus egy új - meghatározott tömegű és töltésű — részecske létezésére mutató 
elméletre következtethet. Ugyanakkor egy kritikus ugyanazon képhalmaz vizsgálata alap- 
ján csupán arra következtethet, hogy a , művész" bizonyára valamilyen absztrakt vagy 
expresszionista irányzat követője. A 19. fejezet számos módszert mutat be arra, hogy a ta- 
nulást hogyan segíti a meglévő tudás; azt is megmutatjuk ebben a fejezetben, hogy a tu- 
dást hogyan lehet úgy összeállítani, hogy felgyorsítsuk a döntéshozatalt. A 20. fejezet azt 
mutatja be. hogy a kiinduló tudás hogyan segít a valószínűségi elméletek tanulásában. 
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Egy determinisztikus, felügyelt tanulást végző algoritmus bemenetként megkapja az is- 
meretlen függvény bizonyos bemeneti értékekhez tartozó válaszait, feladata az ismeretlen 
függvény - vagy ahhoz nagyon közel álló leképezés — előállítása. Formálisan azt mond- 
juk. hogy egy minta (example) nem más, mint egy (x. f(x)) értékpár, ahol x a bemeneti 
érték, míg f(0) az x-re alkalmazott függvény kimeneti értéke. A tisztán induktív követ- 
keztetés (pure inductive inference) (vagy indukció (induction]) feladata a következő: 


Adott az f-re vonatkozó minták egy halmaza, ennek alapján határozzunk meg egy /r 
függvényt, amely közelíti f-et. 


1 A 17. fejezetben használt jutalom (reward) kifejezés a megerősítés (reinforcement) szinonimája. 


752 18. MEGFIGYELÉSEK ALAPJÁN TÖRTÉNŐ TANULÁS 


A h függvényt hipotézisnek (hypothesis) nevezzük. A tanulás nehézsége elvi szempont- 
ból abban áll, hogy nem könnyű egy adott h függvényről megmondani, hogy jól 
approximálja-e f-et. Egy jó hipotézis jól általánosít (generalize) — azaz jó becslést ka- 
punk a még nem látott mintákra is. Ez az induktív következtetés alapproblémája 
(problem of induction). A problémát már évszázadok óta kutatják, a 18.5. alfejezet egy 
részmegoldást szolgáltat. 
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18.1. ábra. (a) Példa (x, f(x)) értékpárok és egy velük konzisztens lineáris hipotézis. (b) Egy — ugyan- 
azokkal az adatokkal konzisztens — hetedfokú polinom. (c) Egy másik adathalmaz egy pontosan illeszke- 
dő hatodfokú polinommal, illetve egy közelítő lineáris illesztéssel. (d) Egy egyszerű szinuszos illesztés 
ugyanazokra az adatokra. 


A 18.1. ábra ismert példát mutat be: egy adathalmazra egyváltozós függvényt illesz- 
tünk. A minták (x, flx)) értékpárok, ahol mind x, mind f(x) valós értékek. Legyen a H 
hipotézistér (hypothesis space H) — azon hipotézisek halmaza, amelyeket meg fogunk 
vizsgálni — a legfeljebb k-ad fokú polinomok tere. (Például 3x2 -- 2, x!7 — 443 stb) 
A 18.1. (a) ábra valamilyen adatokat és egy az adatokra pontosan illeszkedő egyenes 
vonalat (elsőfokú polinom) mutat. Ez a vonal itt egy konzisztens (consistent) hípoté- 
zis, mivel valamennyi adatra illeszkedik. A 18.t. (b) ábra egy nagy fokszámú polino- 
mot mutat, amely szintén konzisztens ugyanazokra az adatokra nézve. Ez a két példa 
illusztrálja az induktív tanulás első komoly megoldandó kérdését: hogyan válasszunk 
több konzisztens hipotézis közül? Egy lehetséges válasz az ún. Ockham borotvája? 
(Ockhamvs razor) elv: részesítsük előnyben a legegyszerűbb olyan hipotézist, amely 
konzisztens az adatokkal. Ez józan intuíciónak tűnik, mivel azok a hipotézisek, amelyek 
nem egyszerűbbek, mint maguk az adatok, nem nyernek ki semmilyen mintázatot az 
adatokból. Az egyszerűség definíciója nem könnyű, de értelmesnek tűnik azt mondani, 
hogy egy elsőfokú polinom egyszerűbb, mint egy 12-ed fokú. 

A 18.1. (c) ábra egy másik adathalmazt mutat. Ezekre az adatokra nem lehet konzisz- 
tens módon egyenest illeszteni, valójában egy hatodfokú polinomra (amely 7 szabad 
paraméterrel rendelkezik) van szükség a pontos illesztéshez. A halmazban csak 7 adat 
van, így a polinomnak épp annyi paramétere van, ahány adatpont. Ennek megfelelően 
úgy tűnik, hogy nem sikerül valamilyen mintázatot találnunk az adathalmazban, így nem 
várunk jó általánosítóképességet. Jobban járhatunk, ha inkább egy egyszerű egyenest 
illesztünk, amely ugyan nem konzisztens, de ésszerű becsléseket adhat. Ez azt valószí- 


gi A 14. századi angol filozófus, William of Ockham után. Ockham nevét gyakran hibásan Occamnak ítják, 
ami talán a francia , Guillaume d"Occam" fordításából ered. 
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nűsíti, hogy a keresett függvény nem determinisztikus (vagy ami ezzel közelítőleg ek- 
vivalens: a valódi bemeneti minták nem figyelhetők meg teljes pontossággal). Nem- 
determinisztikus függvények esetén elkerülhetetlen, hogy kompromisszumot kössünk a 
hipotézis komplexitása és az adatokhoz való illeszkedés pontossága között. A 20. feje- 
zetben bemutatjuk, hogy ezt a kompromisszumot hogyan lehet a valószínűség-számítás 
elméletének felhasználásával kialakítani. 

Észben kell tartanunk, hogy egy egyszerű, konzisztens hipotézis megtalálásának esélye 
erősen függ a választott hipotézistértől. A 18.1. (d) ábra bemutatja, hogy a (c) alatti ada- 
tokra pontosan illeszthető egy egyszerű ax -t b -t c sin(x) alakú függvény. Ez a példa jól 
mutatja a hipotézistér jó megválasztásának fontosságát. Ha olyan hipotézisteret válasz- 
tunk, amely véges fokszámú polinomokat tartalmaz, akkor szinuszos függvényeket nem 
tudunk pontosan reprezentálni. Így egy olyan tanuló, amelyik ezt a hipotézisteret hasz- 
nálja. nem fog tudni szinuszos adatokból tanulni. Egy tanulási problémát realizálható- 
nak (realizable) nevezünk. ha a hipotézistérnek eleme az igazi függvény, különben a 
problémát nem realizálhatónak (unrealizable) nevezzük. Sajnos nem mindig tudjuk 
megmondani, hogy egy tanulási probléma realizálható-e, mivel nem ismerjük a valódi 
függvényt. Egy lehetőség e korlát túllépésére az a priori tudás felhasználása. Ennek se- 
gítségével olyan hipotézisteret alkotunk, amelyről tudjuk, hogy tartalmazza az igazi 
függvényt. Ezt a témát a 19. fejezetben tárgyaljuk. 

Egy másik lehetséges megközelítés, hogy a lehető legnagyobb hipotézisteret használ- 
juk. Például miért ne legyen a H hipotézisterünk az összes Turing-gépek osztálya? 
"Végül is minden kiszámítható függvény reprezentálható valamilyen Turing-géppel, tehát 
ez a legjobb, amit tehetünk. Ennek a megközelítésnek az a problémája, hogy nem veszi 
figyelembe a tanulás számítási komplexitását. Kompromisszumot kell kötnünk a hipoté- 
zistér kifejezőképessége és egyszerű konzisztens hipotézisek megtalálásának komplexitá- 
sa között. Például: egyenesek illesztése az adatokra könnyen megoldható, nagy fokszámú 
polinomok illesztése nehezebb, Turing-gépek illesztése pedig nagyon nehéz. Ugyanis an- 
nak eldöntése, hogy egy adott Turing-gép konzisztens-e az adatokkal, általánosságban 
még csak nem is lehetséges. Egy másik ok, ami miatt előnyben részesítjük az egyszerű 
hipotézistereket, hogy az eredményképp kapott hipotézisek használata is egyszerűbb 
lehet — könnyebb kiszámítani A(x)-et, ha A egy lineáris függvény, mint ha egy tetszőleges 
Turing-gép programja lenne. 

Ezen okokból a legtöbb tanulással foglalkozó eddigi kutatás a viszonylag egyszerű 
hipotézisreprezentációkra helyezte a fő hangsúlyt. Ebben a fejezetben az ítéletlogikára 
és az ehhez kapcsolódó nyelvekre koncentrálunk. Az elsőrendű logikai reprezentációt 
használó tanulás elméletével a 19. fejezet foglalkozik. Látni fogjuk, hogy a kifejező- 
képesség-komplexitás kompromisszum nem is olyan egyszerű, mint először gondol- 
nánk. Gyakran az a helyzet — mint azt a 8. fejezetben is láttuk -, hogy egy kifejezőnyelv 
lehetővé teszi az adatokra illesztett egyszerű elméletet, míg a nyelv kifejezőképessé- 
gének korlátozása azt is jelenti, hogy bármely konzisztens elmélet szükségszerűen 
bonyolult lesz. A sakk szabályait pékdául egy-két oldalon le tudjuk írni elsőrendű 
logika segítségével, míg az ítéletlogikával történő leírás több ezer oldalt igényelne. 
Ilyen esetekben kell arra lehetőségnek lennie, hogy a kifejezőbb nyelven sokkal gyor- 
sabb legyen a tanulás. 


Ti 
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A döntési fa tanulás egyike a legegyszerűbb, mégis az eddigiekben az egyik legsikere- 
sebbnek bizonyult tanulási algoritmusnak. Jó bevezetésként szolgál az induktív tanulás 
területén, és ráadásul könnyen implementálható. Először bemutatjuk a cselekvő alrend- 
szert, majd megmutatjuk, hogy miképpen lehet tanítani. Mindeközben olyan elveket 
mutatunk be, amelyek az induktív tanulás minden területére jellemzők. 


Cselekvő komponensként használt döntési fák 


Egy döntési fa (decision tree) bemenetként egy attribútumokkal (attributes) leírt ob- 
jektumot vagy szituációt kap, és egy , döntést" ad vissza eredményként - a bemenetre 
adott válasz jósolt értékét. A bemeneti attribútumok lehetnek diszkrétek vagy folytono- 
sak. Jelen tárgyalásban diszkrét bemeneteket tételezünk fel. A kimeneti érték szintén 
lehet diszkrét vagy folytonos; egy diszkrét értékkészletű függvény tanulását osztályozás 
(classification) tanulásnak, míg a folytonos függvény tanulását regressziónak (regres- 
sion) nevezzük. Bináris (BBoolean) osztályozásra fogunk koncentrálni, ahol minden pél- 
dát vagy igaznak (pozitív). vagy hamisnak (negatív) sorolunk be. 

A döntési fa egy tesztsorozat elvégzése során jut el a döntéshez. A fa minden egyes 
belső csomópontja valamely tulajdonság értékére vonatkozó tesztnek felel meg, a cso- 
mópontból kilépő ágakat pedig a teszt lehetséges kimeneteivel címkézzük. Minden 
egyes levélcsomópont megadja azt az értéket, amelyet vissza kell adnunk, ha ezt a leve- 
let elértük. Úgy tűnik, hogy a döntési fa reprezentáció az emberek számára rendkívül 
természetes; valójában számos , Hogyan csináljuk?" kézikönyvet (például az autójavítási 
kézikönyveket) írtak meg egyetlen hatalmas, több száz oldalra kiterjedő döntési faként. 

Valamelyest egyszerűbb példa lehet az a probléma, hogy várjunk-e egy étteremben 
egy asztal felszabadulására. Az a célunk. hogy tanulással kialakítsuk a VárjunkE cél. 
predikátum (goal predicate) definícióját. Ahhoz, hogy ezt tanulási feladatként kezel- 
hessük, először meg kell határozzuk, hogy milyen attribútumok állnak rendelkezésre 
ahhoz, hogy ezen a problématerületen leírjuk a példákat. A 19. fejezetben megmutat- 
juk, hogyan lehet automatizálni ezt a feladatot; most egyszerűen tegyük fel, hogy a 
következő attribútumlista mellett döntöttünk: 


Alternatíva: van-e a közelben megfelelő alternatívaként kínálkozó étterem. 

Bár: van-e az étteremnek kényelmes bár része, ahol várakozhatunk. 
Péntek/Szombat: igaz értéket vesz fel pénteken és szombaton. 

Éhes: éhesek vagyunk-e. 

Vendégek: hány ember van az étteremben (értékkészlet Senki, Néhány és Tele). 
Drága: az étterem menyire drága ($. $$. $$$). 

Eső: esik-e odakint az eső. 

Foglalás: foglaltunk-e asztalt. 

Konyha: az étterem típusa (francia, olasz, thai vagy burger). 

10. BecsültVárakozás: a pincér becsülte várakozási idő (0-10, 10-30, 30-60, 560 perc) 


A szerzők egyike (SR) által erre a problémára rendszerint használt döntési fa a 18.2. ábrán 
látható. Vegyük észre, hogy a fa nem basználja a Drága és a Konyha attribútumokat, 
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Vendégek? 









0-10 





[Énes? ] 
Nem Igen Nem, Igen 





Igen 











Alternatíva? 

















Nem 


18.2. ábra. Egy döntési fa annak eldöntésére, hogy várjunk-e asztalra 


valójában irrelevánsnak tekinti azokat. A példákat a döntési fa a gyökérnél kezdi fel- 
dolgozni, követi a megfelelő ágakat, amíg egy levélhez el nem ér. Például egy Vendé- 
gek — Tele és BecsültVárakozás — 0-10 attribútumokkal jellemezhető példa pozitív 
kimenetet fog eredményezni (azaz várni fogunk egy asztalra). 


A döntési fák kifejezőképessége 


Logikai felírást használva minden egyes döntési fa, amely a VárjunkE célpredikátum 
egy hipotézise, a következő formában felírt állításnak felel meg: 


Ws VárjunkE(s) 45 (Pi(s) v P2(9) V ... v P,(5)) 


ahol mindegyik PXs) feltétel azon tesztek konjunkciójának felel meg, amelyeket a gyö- 
kértől egy pozitív kimenetet jelentő levélig megtett út során végeztünk. Bár ez egy első- 
rendű logikában felírt mondatnak tűnik, valójában bizonyos értelemben ítéletlogikai 
kifejezés, mivel csak egyetlen változót tartalmaz és az összes predikátum unáris. Való- 
jában a döntési fa a VárjunkE és az attribútumértékek bizonyos logikai kapcsolatát írja 
le. A döntési fa nem használható olyan tesztek reprezentálására, amelyek kettő vagy 
több különböző objektumra vonatkoznak — például: 


3ra Közelíra, r) A Drágaír, p) A Drága(ra, pa) A Olcsóbbípa, p) 


(van a közelben egy olcsóbb étterem?). Nyilvánvalóan felvehetnénk egy OlcsóbbÉtte- 
remKözel nevű logikai attribútumot, de az összes ilyen attribútum hozzáadása kezelhe- 
tetlenné teszi a problémát. A 19. fejezet mélyebbre hatol az elsőrendű logikában történő 
tanulás területén. 
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Az ítéletlogikai nyelvek területén a döntési fák teljes kifejezőképességgel bírnak, ami 
azt jelenti, hogy tetszőleges logikai (Boole) függvény felírható döntési faként. Ezt tri- 
viálisan megvalósíthatjuk, ha a függvény igazságtáblájának minden sorát megfeleltet- 
jük a döntési fa egy útjának. Ez exponenciálisan növekvő döntési fára vezet, mivel az 
igazságtábla exponenciálisan növekvő számú sort tartalmaz. Nyilvánvalóan a döntési 
fák sok függvényt jóval kisebb fával képesek reprezentálni. 

Ugyanakkor némely függvényfajtánál ez valóban problémát jelent. Például ha a függ- 
vényünk a paritásfüggvény (parity function), amely akkor és csak akkor ad 1-et, ha pá- 
ros számú bemenet 1 értékű, akkor egy exponenciálisan nagy döntési fára lesz szükség. 
Hasonlóan nehéz a többségfüggvény (majority function) reprezentálása döntési fával, 
amely függvény akkor ad 1-et, ha bemeneteinek több mint fele 1 értékű. 

Más szavakkal, a döntési fák bizonyos függvények esetén jók, mások esetén rosz- 
szak. Van bármilyen olyan reprezentáció, amely mindenfajta függvény esetén haté- 
kony? A válasz sajnos az, hogy nincs. Ezt általánosan is meg tudjuk mutatni. Vizsgál- 
juk az összes n bemeneti attribútummal rendelkező logikai (Boole) függvényt. Hány 
különböző függvény van ebben a halmazban? Ez éppen a lehetséges felírható igaz- 
ságtáblák számával egyezik meg, hiszen egy függvényt az igazságtáblája ad meg. 
Az igazságtáblának 2" sora van, mivel minden bemeneti esetet n attribútummal adunk 
meg. Úgy tekinthetjük a tábla , válasz" oszlopát, mint egy 2" bites számot, amely de- 
finiálja a függvényt. Mindegy, hogy a függvények milyen reprezentációját választjuk, 
néhánynak (valójában szinte mindegyiknek) a reprezentálásához tényleg szükség lesz 
ennyi bitre. 8 

Ha ?" bitre van szükség a függvény megadásához, akkor n attribútum esetén 919 
a lehetséges függvények száma. Ez megrázóan nagy szám. Például csupán hat Boole- 
változó esetén is 27— 18 446 744 073 709 551 616 különböző logikai (Boole) függvény 
Állítható elő. Szükségünk lesz néhány szellemes algoritmusra, hogy egy ilyen hatalmas 
térben konzisztens hipotézist tudjunk találni. 


A döntési fák példák alapján történő felépítése 


Egy logikai döntési fa által kezelhető példa a bemeneti attribútumok X vektorából és 
egyetlen logikai kimeneti értékből, y-ból áll. A 18.3. ábra egy (Xi, y)...( X12. y12) példa- 
halmazt mutat. Azokat nevezzük pozitív példáknak (X, X3, ...), amelyekben a VárjunkE 
értéke igaz, és azok a negatív példák, amelyekben az értéke hamis (X2, X5, ...). A pél- 
dák teljes halmazát tanító haimaznak (training set) nevezzük. 

Az a probléma, hogy a tanító halmaznak megfelelő döntési fát találjunk, bonyolultnak 
tűnik ugyan, de valójában van egy triviális megoldása. Egyszerűen egy olyan fát konst- 
ruálhatunk, amelyben minden példához egy külön saját utat hozunk létre egy — a pél- 
dához tartozó — levélcsomóponthoz. A levélhez vezető út mentén sorra teszteljük az attri- 
bútumokat, és a példához tartozó tesztértéket követjük, a levél pedig a példa besorolását 
adja. Ha ismét ugyanazt a példát? vesszük, akkor a döntési fa a helyes osztályozási ered- 
ményt adja. Szerencsétlen módon nemigen ad információt egyetlen más esetről sem! 


3 Nagyon fontos, hogy megkülönböztessük az azonos példát egy azonos leírással rendelkező példától. Erre 
a fontos különbségre még visszatérünk a 19. fejezetben. 
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Példa Anyátánök cel 
lAlter-] Bár TPéntek/ T Ékes TVendégekl Drága JEső Fogtatás! Konyha IBecsült — ] Vár- 
maríval — ISzombati Várakozás! junkE 

Xy [jfgen Nem] Nem Igen ) Néhány [ $88 (Nem Igen] Francia] 0-10 Igen 

X2 [igen [Nem] Nem Igen (Tee  1$ — ]Nem] Nem ] Thai ] 30-60 Ú Nem 

X3 Nem Igen] Nem ] Nem ] Néhány! $ — INem] Nem ] Burger [00-10 — ] igen 

X4 igen INeml Igen jJigen (Tee 01$ — Iigen] Nem o! Thai 10-30 Igen 

Xs Igen I Neml Igen Nem I Tele $$$ Nem] Igen ] Francial 260 Nem 

Xg fNem lIigenl Nem igen ! Néhány 138 — Igen] igen ] Olasz 10-10] Igen 

X7 INemltgenl Nem !Nem Senki 18 ligenl Nem ] Burger 0-10 — Ű Nem 

Xg (Nem [Nem] Nem Igen ] Néhány 1$$ — !igen] Igen ] Thai 00-10 Igen 

Xg Nem Iigen! Igen Nem ITele 18 — igen] Nem ] Burger] 560] Nem 

Xioligen [Igen] Igen igen (Tele 1 $$$ Nem] Igen ] Otasz ) 10-30] Nem 

X4IINem [Nem] Nem ] Nem l Senki 18 (Nem Nem I 7nai 10-10  ] Nem 

Xp2 igen [Igen Igen Igen ÍTele  ]$ (Nem! Nem ] Burger [ 30-60! Igen 









































18.3. ábra. Példák az étterem problématerületre 


Ezzel a triviális megoldással az a baj, hogy egyszerűen memorizálja a példákat. Mi- 
vel nem nyer ki semmilyen mintázatot a példákból, ezért nem várhatjuk, hogy extra- 
polálni tudjon azokra a mintákra, amelyeket még sohasem látott. Az Ockham borotvája 
elvét alkalmazva nekünk azt a legkisebb döntési fát kell megtalálnunk, amely konzisz- 
tens a példákkal. Sajnálatos módon a , legkisebb" összes értelmes definíciója esetén 
a legkisebb döntési fa megtalálása kezelhetetlen problémát jelent. Viszont némi egy- 
szerű heurisztika bevetésével jó eredményt érhetünk el egy , kicsike" fa megtalálásában. 
A DÖNTÉSI-FA-TANULÁS algoritmus alapötlete az, hogy teszteljük először a legfontosabb. 
attribútumot, A , legfontosabb" alatt azt az attribútumot értjük, amelyik a legnagyobb 
változást okozza a példák besorolásában. Ezen a módon — reményünk szerint — kisszá- 
mú teszttel helyes osztályozáshoz jutunk, ami azt jelenti, hogy a fában minden út rövid 
lesz, tehát az egész fa kicsi lesz. 

A 18.4. ábrán látható, hogy hogyan indul az algoritmus. 12 példánk van, amelye- 
ket pozitív és negatív példahalmazokba sorolunk. Ezek után eldöntjük, hogy melyik 
attribútumot teszteljük először a fában. A 18.4. (a) ábrán megmutattuk, hogy a Kony- 
ha attribútum rossz választás lenne, mert tesztjének 4 kimenetele van, és mindegyik 
esetén ugyannyi pozitív és negatív példánk lesz az eredményül kapott halmazokban. 
Másrészt viszont a 18.4. (b) ábrán látható, hogy a Vendégek egy meglehetősen fontos 
attribútum, hiszen ha értéke Senki vagy Néhány, akkor határozott választ tudunk adni 
(az első esetben Nem, a másodikban fgen a válaszunk). Ha az attribútum értéke Tele, 
akkor a példák vegyes halmazát kapjuk. Általánosságban megállapítható, hogy mi- 
után az első attribútum tesztje csoportokra bontotta a példákat, mindegyik tesztered- 
mény egy újabb döntési fa tanulási problémát eredményez, kevesebb példával és egy- 
gyel kevesebb attribútummal. Négy esetet kell áttekintenünk ezekben a rekurzív 
problémákban: 

1. Ha van néhány pozitív és néhány negatív példánk, akkor válasszuk a legjobb attri- 
bútumot a szétosztásukra. A 18.4. (b) ábrán bemutattuk, hogy az Éhes attribútum 
alkalmas a megmaradó példák osztályozására. 
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Enunma 


Vendégek? 



























































(a) 


18.4. ábra. A példahalmaz attribútumteszteléssel történő szétosztása. (a) A Konyha alapján történő szét- 
osztás nem visz közelebb ahhoz, hogy a pozitív és negatív példákat megkülönböztessük. (b) A Vendégek 
attribútum tesztje jól szeparálja a pozitív és negatív példákat. Miután a Vendégek tesztjét elvégeztük, az 
Éhes egy eléggé jó második tesztlehetőséget ad. 


2. Ha valamennyi megmaradt példánk pozitív (vagy mind negatív), akkor készen 
vagyunk: válaszolhatunk /gen-t vagy Nem-et. A 18.4. (b) ábra bemutatja ezt a Senki, 
illetve a Néhány esetekben. 

3. Ha nem marad példa a teszt egyik kimenetele esetén, akkor ez azt jelenti, hogy nem 
figyeltünk meg ilyen esetet, és a szülőcsomópontban többségben levő választ adjuk. 

4. Ha nem maradt attribútumunk, amelyet tesztelhetnénk, de mind pozitív, mind nega- 
tív példáink maradtak, akkor bajban vagyunk. Ez azt jelenti, hogy ezeknek a pél- 
dáknak pontosan azonos jellemzőik vannak, de különböző osztályokba tartoznak. 
Ez egyrészt akkor fordulhat elő, ha néhány adat nem megfelelő, azt mondjuk, hogy 
zajosak (noise) az adatok. Másrészt akkor is előállhat ez a helyzet, ha az attribútu- 
mok nem adnak elég információt a szituáció teljes leírására, vagy a problématér 
valójában nemdeterminisztikus. Egyszerű megoldása lehet ennek a problémának a 
többségi szavazás használata. 


A  DÖNTÉSI-FA-TANULÁS algoritmust a 18.5. ábrán mutatjuk be. AZ ÁATTRIBÚTUM- 
VÁLASZTÁS módszer bemutatása a következő alfejezetben található. 

Az algoritmus által a 12 mintából álló adathalmaz alapján létrehozott fa a 18.6. ábrán 
látható. Az eredményként kapott fa nyilvánvalóan különbözik a 18.2. ábrán látható ere- 
detitől, annak ellenére, hogy az adatokat egy, az eredeti fát használó ágens generálta. 
Arra gondolhatnánk, hogy az algoritmus nem ért el különösebben jó eredményt a helyes 
függvény megtanulásában. Mindamellett ez téves következtetés lenne. A tanuló algo- 
ritmus a példákat látja, nem az eredeti függvényt. Valójában a létrehozott hipotézis 
(lásd 18.6. ábra) nem csupán megfelel az összes példának, de lényegesen egyszerűbb 
is, mint az eredeti fa. A tanuló algoritmusnak semmi oka sincs az Eső és Foglalás att- 
ribútumokra vonatkozó teszteket felvenni, mivel ezek nélkül is tudja osztályozni az 
összes példát. Mellesleg, felfedett egy érdekes és váratlan viselkedést: az első szerző 
hétvégeken várni fog thai ételekre. 
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function DÖNTÉSI-FA-TANULÁS(példák, attribútumok, alapérték) returns egy döntési fa 
inputs: példák, a példák halmaza 
attribútumok, az attribútumok halmaza 
alapérték, a célpredikátum alapértéke 


Alf példák üres then return alapérték 
else if példák minden elemének azonos a besorolása then return a besorolás 
else íf arrribújumok üres halmaz then return TÖBBSÉGI-ÉRTÉK példák) 





fa — egy új döntési fa, a gyökér a legjobb attribútum tesztje 
m s— TÖBBSÉGI-ÉRTÉK(példák;) 
for each legjobb minden v; értékére do 

példák; — (a példák azon elemei, amelyekre legjobb — vi) 

részfa — DÖNTÉSI-FA-TANULÁSí(példák;, attribútumok-legjobb, m) 
fához adjunk egy v, címkéjű ágat és a részfa részfát 















18.5. ábra. A döntési fa tanulásra szolgáló algoritmus 


Természetesen ha több mintát gyűjtöttünk volna, akkor egy, az eredetihez hasonlóbb 
fát hozhattunk volna létre az induktív tanulással. A 18.6. ábrán látható fa elkerülhetet- 
lenül hibákat is el fog követni; például sohasem látott olyan helyzetet, amelyben a vára- 
kozási idő 0-10 perc, de az étterem tele van. Egy olyan esetben, amikor az Éhes attri- 
bútum hamis értékű, a fa azt választja, hogy ne várjunk, pedig én (S. Russell) bizonyára 
várnék. Felmerül tehát az a kézenfekvő kérdés, hogy ha az algoritmus egy konzisztens, 
de inkorrekt fát indukál, akkor mennyire lesz inkorrekt ez a fa? Ezt azután fogjuk 
kísérletileg elemezni, hogy először elmagyaráztuk az attribútumteszt-választási lépés 
részleteit. 


Vendégek? 

















18.6. ábra. A 12 példás tanító minta halmazból származtatott döntési fa 
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Attribútumteszt-választás 


A döntési fa tanulás során az attribútumok kiválasztására szolgáló eljárás arra irányul, 
hogy minimalizáljuk az eredményül kapott fa mélységét. Az alapötlet az, hogy azt az att- 
ribútumot válasszuk, amellyel a lehető legmesszebbre jutunk a példák pontos osztályo- 
zásában. Egy tökéletes attribútum a példákat egy csupa pozitív és egy csupa negatív pél- 
dát tartalmazó halmazra osztja. A Vendégek nem tökéletes attribútum, de meglehetősen 
jó. Egy valójában haszontalan attribútum, mint például a Konyha, tesztjének eredménye- 
ként a kapott halmazokban nagyjából ugyanolyan arányban lesz pozitív és negatív példa, 
mint az eredeti halmazban. 

Mindössze arra van szükségünk, hogy formális mértéket találjunk arra, hogy mit 
jelent a , meglehetősen jó" és a , valójában haszontalan", ezek után implementálni tud- 
juk a 18.5. ábrán látható ATTRIBÚTUM-VÁLASZTÁS függvényt. A mérték akkor érje el 
maximumát, amikor az attribútum tökéletes, és akkor legyen minimális, amikor az att- 
ribútumnak egyáltalán nincs semmi haszna. Egy megfelelő mérték az attribútum által 
szolgáltatott információ (information) várható értéke, ahol az információt abban a 
matematikai értelmezésben használjuk, ahogy először Shannon és Weaver definiálta 
(Shannon és Weaver, 1949). Az információ definíciójának megértéséhez gondoljunk 
például annak a kérdésnek a megválaszolására, hogy egy feldobott pénzérme fej oldala 
lesz-e felül. Az, hogy a válaszban mennyi információ rejlik, az az előzetes a priori tudás- 
tól függ. Minél kevesebbet tudunk, annál több a szolgáltatott információ. Az információ- 
elmélet bitekben méri az információtartalmat. Egy bit információ ahhoz elég, hogy egy 
olyan kérdésre, amelyről semmilyen előzetes elképzelésünk sem volt (például egy sza- 
bályos érme feldobásának eredménye) igen/nem választ megadjunk. Általánosságban, 
ha a lehetséges v; válaszok valószínűsége P(v,). akkor a válasz ! információtartalmát a 
következő összefüggés adja meg: 


n 
IKPCVp),.s PGY) — 32—PWw)tog2 Pl) 
í—1 


A pénzfeldobás esetre ellenőrizve az összefüggést, a következőt kapjuk: 


11 1 1 1 jú 
1(z.2) z — 71082 7 20982 5 zlbit 
Ha az érme hamisított oly módon, hogy a dobás 9996-ban fejre jön ki, akkor I1/100, 
99/100) — 0,08 bitre van szükség, és ha a fej kimenetel valószínűsége 1-hez tart, akkor 
az aktuális kimenetel megjóslásához szükséges információ 0-hoz tart. 

Döntési fa tanulás esetén a megválaszolásra váró kérdés az, hogy egy adott példának 
mi a helyes besorolása. Egy jó döntési fa választ ad erre 2 kérdésre. Még mielőtt egyetlen 
attribútumot teszteltünk volna, a válaszok valószínűségét becsülhetjük a tanító halmazban 
található pozitív és negatív minták arányával. Tegyük fel, hogy a tanító halmazban p 
pozitív és n negatív példa található. Ez esetben a helyes válasz információtartalmának 
becslése: 





Pp n Pp Pp n 
v ező og; los 
ee viz] ptn 2 pan ptn 2 En 
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A 18.3. ábrán bemutatott étterem tanító halmaz p — n — 6 mintát tartalmaz, tehát 1 bit 
információra van szükségünk. 

Egyetlen A attribútum tesztje nem fogja megadni mindezt az információt, de vala- 
mennyít megad belőle. Pontosan mérni tudjuk, hogy mennyit, ha megnézzük, hogy 
mennyi információra van még szükségünk az attribútumteszt után. Bármely A attribú- 
tum, amely v különböző értéket vehet fel, E,, ..., E, részhalmazokra bontja az E tanító 
halmazt, az A lehetséges értékei szerint. Mindegyik E; részhalmaz p; pozitív és n; ne- 
gatív példát tartalmaz, így ezen az ágon továbbhaladva Kp;/(p; 4 n;), n;/(p; 4 n;)) bit 
információra van szükségünk a válasz megadásához. A tanító halmazból véletlen min- 
tavétellel nyert minta esetén annak valószínűsége, hogy az A attribútum ezen a mintán 
az i-edik értéket veszi fel: (p, D/(p 4 m. Ennek megfelelően az A attribútum teszt- 
je után az átlagos TASÍNÉSÉSZTÉBÉBÉRE amely a példa osztályozásához kell: 





MaradékinfoSzükséglet (A) pet Br, E ge ) 
ptn 1pitn; "pi Fn; 
Az attribútum tesztjéből EEYSTÉSTK információnyereség (information gain) az eredeti 
(A tesztje előtti) információszükséglet és a teszt utáni új információszükséglet különb- 
ségeként kapható meg: 





InfolNNyereség(A) —I (e 2] — MaradéklinfoSzükséglet(A) 
n 


tn 
Az ATTRIBÚTUM-VÁLASZTÁS függvényben használt heurisztika csupán azt takarja, hogy 
válasszuk a legnagyobb nyereséget biztosító attribútumot. Visszatérve a 18.4. ábrán 
vizsgált attribútumokhoz: 

6,24 
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Ez megerősíti azt az intuíciónkat, hogy a Vendégek jobb attribútum a tanítóhalmaz rész- 

halmazokra szabdalására, mint a Konyha. Az a helyzet, hogy a Vendégek attribútumnak 


van a legnagyobb információnyeresége, ezért a döntési fa tanuló algoritmus ennek 
tesztjét választaná a fa gyökércsomópontjába. 
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A tanuló algoritmus teljesítményének becslése 


Egy tanuló algoritmus akkor jó, ha olyan hipotéziseket hoz létre, amelyek jól jósolják 
meg az általuk előzetesen nem látott példák osztályba sorolását. A 18.5. fejezetben azt 
mutatjuk be, hogy mi módon lehet előre megbecsülni a jóslás minőséget. Ebben a feje- 
zetben egy olyan módszertant vizsgálunk meg, amellyel az osztályba soroló képességet 
méréssel lehet becsülni. 

Nyilvánvalóan akkor jó egy jóslás, ha igaznak bizonyul, így a hipotézis minőségét 
megbecsülhetjük az ismertté vált tényleges osztálybasorolások alapján. Ezt egy teszt- 
halmaznak (test set) nevezett mintahalmaz segítségével végezhetjük el. Ha az összes 


762 18. MEGFIGYELÉSEK ALAPJÁN TÖRTÉNŐ TANULÁS 


rendelkezésünkre álló példát tanításra használjuk, akkor továbbiakat kell gyűjtenünk a 
teszteléshez. Ezért gyakran kényelmesebb a következő módszert alkalmazni: 


1. Gyűjtsünk egy nagy példahalmazt. 

2. Osszuk két diszjunkt részre: a tanító halmazra (training set) és a teszthalmazra 
(test set). 

3. Alkalmazzuk a tanító algoritmust a tanító halmazon, és így generáljunk egy /t hipotézist. 

4. Mérjük meg a teszthalmazon, hogy a A hipotézis a halmaz hány százalékára ad 
helyes osztálybasorolást. 

5. Ismételjük meg az 1-4 lépéseket különböző tanító halmaz méretekre, és mindegyik 
mérethez különböző véletlenszerűen kíválasztott tanító halmazokra. 


Ennek az eljárásnak az eredményeként egy adathalmazt kapunk, amelynek feldolgozá- 
sával megkaphatjuk az átlagos jóslási képességet a tanító halmaz méretének függvényé- 
ben. Ezt a függvényt ábrázolva kapjuk az adott algoritmusnak egy adott tématerületre 
vonatkozó tanulási görbéjét (learning curve). A DÖNTÉSI-FA-TANULÁS algoritmus 
étterem példáinkkal felvett tanulási görbéje a 18.7. ábrán látható. Vegyük észre, hogy a 
tanító halmaz méretével javul a predikció minősége! (Ez okból az ilyen görbéket ún. 
boldog görbéknek (happy graphs) is nevezik.) Ez annak a jele ugyanis, hogy valóban 
van valami mintázat az adatokban, és az algoritmus felfedezi ezt a mintázatot. 

A tanuló algoritmusnak nyilvánvalóan nem szabad az előtt , látnia" a tesztadatokat, 
mielőtt a megtanított hipotézist teszteltük velük. Szerencsétlen módon nagyon könnyű 
beleesni abba a hibába, hogy tanítás közben a tesztadatokra kukucskálunk (peeking). 
Ez tipikusan a következő módon zajlik: egy tanuló algoritmus általában számos hango- 
lási lehetőséggel rendelkezik, amellyel az algoritmus viselkedését változtatni tudjuk. 
Például számos különböző kritérium lehet, amelyek alapján a következő attribútumot 
kiválasztjuk a döntési fa tanulásnál. Különböző beállítások mentén számos különböző 
hipotézist generálunk, majd mindegyiket leteszteljük a teszthalmazon, és a legjobb 
hipotézis predikciós eredményét tekintjük eredménynek. Fájdalmas bár, de kukucs- 
kálás történt! Ennek oka, hogy a hipotézist a teszthalmazon elért eredménye alapján 
választottuk ki, így a teszthalmaz által hordozott információ beszivárgott a tanuló algo- 
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18.7. ábra. Tanulási görbe az étterem problématérre vélettenszerűen generált 100 példa esetén. 
A görbe 20 kísérlet eredményét összegzi. 
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ritmusba. Ennek a mesének az a tanulsága, hogy bármely eljárásnak, amelynek része a 
hipotéziseknek a teszthalmazon nyújtott teljesítményük alapján való összehasonlítása, 
egy új teszthalmazt kell használnia, amelyen a végül kiválasztott hipotézis teljesítményét 
méri. A gyakorlatban ez túl körülményes, így az emberek továbbra is ily módon szeny- 
nyezett adathalmazaikon folytatják kísérleteiket. 


Zaj és túlilleszkedés 


Korábban már láttuk, hogy ha van kettő vagy több olyan példa, amelyeknek azonos a le- 
írásuk (az attribútumokra nézve), de eltérő az osztálybasorolásuk, akkor a DÖNTÉSI-FAa- 
TANULÁS algoritmus nem lehet képes olyan döntési fát találni, amely minden példával 
konzisztens. Az általunk korábbiakban említett megoldás a következő. Ha determinisz- 
tikus osztályzásra van igény, akkor minden levélcsomópont adja vissza a hozzá tartozó 
halmaz többségi osztályát. Más esetekben pedig adja vissza a relatív gyakoriságok alap- 
ján becsült osztályba tartozási valószínűségeket. Sajnos, ez még távol van a történet 
végétől. Könnyen elképzelhető, sőt valójában elég valószínű, hogy a tanuló algoritmus 
akkor ís talál egy olyan döntési fát, amely az összes példával konzisztens, ha nagyon 
fontos információ hiányzik. Ennek oka, hogy az algoritmus felhasználhat irreleváns att- 
ribútumokat, ha vannak ilyenek, hogy hamis megkülönböztetést tegyen a példák közt. 

Vizsgáljuk meg azt a problémát, amikor egy kockadobás eredményét akarjuk megjó- 
solni. Tegyük fel, hogy több napon át kísérleteket végzünk számos kockával. Mind- 
egyik tanító példát a következő attribútumokkal írunk le: 


1. Nap: az a nap, amelyen a kockadobást végeztük (hétfő, kedd, szerda, csütörtök). 
2. Hónap: a hónap, amelyben a kockadobást végeztük (január vagy február). 
3. Szín: a kocka színe (vörös vagy kék). 


Mindaddig, amíg két dobásnak nem lesz pontosan azonos a leírása, a IDÖNTÉSI-FA- 
TANULÁS képes lesz egzakt hipotézist találni. Minél több attribútum van, annál valószí- 
nűbb, hogy egzakt hipotézist kapunk. Viszont az összes ilyen hipotézis teljesen hamis 
lesz! Amit szeretnénk, az az, hogy a DÖNTÉSI-FA-TANULÁS — miután elég példát látott 
már - egyetlen levélcsomópontot adjon vissza, minden egyes dobási eredményhez 
közelítőleg 1/6 valószínűséggel. 

Amikor a hipotézisek nagy halmaza lehetséges, akkor óvatosnak kell lennünk, nehogy 
arra használjuk az ebből eredő nagy szabadságot, hogy értelmetlen , szabályosságot" ta- 
láljunk az adatokban. Ezt a problémát túlilleszkedésnek (overfitting) nevezzük. Ez rend- 
kívül általános jelenség, akkor is jelentkezhet, amikor a keresett függvénynek egyáltalán 
nincs valószínűségi jellege. Mindamellett ez a probléma az összes tanulási algoritmust 
sújtja, nem csak a döntési fákat. 

A túlilleszkedés kezelésének kimerítő matematikai tárgyalása meghaladja e könyv ke- 
reteit. A probléma megoldására itt csupán egy egyszerű — döntési fa metszés (decision 
tree pruning) nevű — módszert mutatunk be. A metszés (vagy nyesés) azon az alapon 
működik, hogy megakadályozzuk a nem nyilvánvalóan releváns attribútumok tesztje 
mentén a mintahalmaz ismételt (rekurzív) felosztását, még akkor is, ha az adatok osztály- 
basorolása az adott csomópontban nem egyforma. Az a kérdés, hogyan vesszük észre egy 
attribútumról, hogy irreleváns? 
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Tegyük fel, hogy egy irreleváns attribútumra alapozva osztottuk ketté a mintahalma- 
zunkat. Általánosságban szólva azt várjuk, hogy ez esetben az eredményül kapott rész- 
halmazokban nagyjából ugyanabban az arányban fognak szerepelni az egyes osztályok- 
ba tartozó minták, mint az eredeti halmazban. Ekkor az információnyereség közel 
nulla. Tehát az információnyereség (annak hiánya) jó jelzés lehet az irrelevanciára. 
Most az a kérdés merül fel, hogy mekkorának kell lennie az információnyereségnek ah- 
hoz, hogy ezen attribútum mentén szétosszuk a mintahalmazt? 

Ezt a kérdést a statisztikai szignifikanciatesztet (significance test) hasznájva vála- 
szolhatjuk meg. Ez a teszt azzal a feltételezéssel indul, hogy a példákban egyáltalán 
nincs közös mintázat (ez az úgynevezett nullhipotézis). Ezek után az aktuális adathal- 
mazt vizsgáljuk: meg akarjuk határozni annak mértékét, hogy az adathalmaz mennyire 
tér el a tökéletesen mintázat nélküli helyzettől. Ha az eltérés mértéke statisztikailag már 
valószínűtlen (rendszerint 590 vagy ennél kisebb valószínűséget értünk ezalatt), akkor 
ezt annak bizonyítékaként vesszük, hogy az adatokban jelen van egy alapvető mintázat. 
A valószínűséget a véletlen mintavételezés esetén várható eltérések standard eloszlását 
feltételezve számítjuk ki. 

Ebben az esetben a nullhipotézis az, hogy az attribútum irreleváns, ennek megfelelően 
egy végtelen nagy mintahalmazra vett információnyereség nulla lenne. Azt kell kiszámí- 
tanunk, hogy a nullhipotézist feltéve egy v méretű mintahalmazban a várt pozitív és 
negatív eseteloszlástól a megfigyelt eloszlás eltérése milyen valószínűséggel léphet fel. 
Az eltérés mértékét megadhatjuk a részhalmazok tényleges pozitív és negatív esetszá- 
mának (p;, nj) a nullhipotézis fennállása esetén várt esetszámokkal (6, A) való össze- 
hasonlításával: 

Kelt a ceg bb 

ptn ptn 


A teljes eltérés kényelmesen számítható mértékét a következő összefüggés adja: 
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A nullhipotézist feltételezve a D eltérés mérték v — L szabadságfokú x? (khí-négyzet) 
eloszlást követ. Annak valószínűségét, hogy az attribútum valóban irreleváns, standard 
X táblázatok vagy statisztikai szoftver segítségével számíthatjuk ki. A 18.11. feladat- 
ban tűztük ki célul, hogy a DÖNTÉSI-FA-TANULÁS algoritmusban elvégezzük azokat 
a változtatásokat, amelyek a metszés ezen — x? metszés (x? pruning) néven ismert — 
formájához vezetnek. 

A zaj metszés segítségével kezelhető: az osztályozási hibák lineáris növekedést 
okoznak a predikciós hibában, míg az esetleírásban fellépő hibák aszimptotikus hatást 
gyakorolnak, amely egyre rosszabb, ahogy a döntési fa egyre kisebb haimazok kezelé- 
sére zsugorodik. Ha az adatok nagy zajjal terheltek, akkor a metszéssel készült döntési 
fák lényegesen jobb eredményt adnak, mint a metszés nélkül készültek. Ráadásul a met- 
széssel készült fák gyakran jóval kisebbek, ezért könnyebben érthetők. 


$ valójában a nyereség pozitív lesz, kivéve azt az esetet, amikor az arányok mind pontosan egyformák (lásd, 
18.10. feladat). 


18.3. DÖNTÉSI FÁK MEGALKOTÁSA TANULÁSSAL 765 


Egy másik túlilleszkedést csökkentő technika a keresztvalidáció (cross-validation). 
Bármely tanulási eljárásnál alkalmazható, nem csupán a döntési fa tanulásnál. Az alap- 
vető ötlet annak megbecsülése. hogy az egyes hipotézisek mennyire jól fogják meg- 
jósolni a még nem látott esetekre adandó válaszokat. Ezt úgy becsülhetjük, hogy az 
ismert adatok egy részét félretesszük, és ezekkel teszteljük a megmaradt adatok alapján 
tanulással létrehozott fa predikciós képességét. K-szoros keresztvalidációnak nevezzük, 
ha k kísérletet végzünk, és minden esetben az adatok más és más 1/k-ad részét tesszük 
félre validációs tesztcélra, majd a végén átlagoljuk az eredményeket. Az 5 és a 10 el- 
terjedten használt k értékek. Szélső esetként használják a k — n választást, amelyet 
hagyj-ki-egyet keresztvalidációs módszerként ismerünk. A keresztvalidációt tetsző- 
leges döntési fa tanulási módszerre! együtt alkalmazhatjuk (beleértve a metszést is), 
célja mindig az, hogy olyan döntési fa kiválasztását segítsük elő, amely jó predikciós 
képességgel rendelkezik. A kukucskálási jelenség elkerülése végett ezek után ezt a 
predikciós képességet egy új teszthalmazon kell mérnünk. 


A döntési fák alkalmazhatóságának kiterjesztése 


Egy sor problémát meg kell oldanunk ahhoz, hogy a döntési fa indukciót a problé- 
mák szélesebb körére kiterjeszthessük. Nagyjából felvázoljuk mindegyiket, azt java- 
solva, hogy a teljesebb megértés érdekében a kapcsolódó feladatokat oldja meg az 
olvasó. 


" Hiányzó adatok (missing data): Számos területen nem ismerhető meg minden pél- 
da összes attribútuma. Lehet, hogy az értékek nem kerültek tárolásra, vagy túl drága 
lenne a mérésük. Ez két problémát vet fel: először, ha van is egy teljes döntési fánk, 
akkor hogyan tudunk egy olyan mintát osztályozni, amelynek egy tesztelendő attri- 
bútuma hiányzik? Másodszor, hogyan módosítsuk az információnyereségre vonat- 
kozó formulát, ha néhány példa ezen attribútumának értéke nem ismert? Ezeket a 
kérdéseket a 18.2. feladatban vizsgáljuk. 

s  Sokértékű attribútumok (multivalued attributes): Ha egy attribútum nagyszámú 
értéket vehet fel, akkor az információnyereség nagysága nem megfelelő mértéke az 
attribútum hasznosságának. Szélsőséges esetben egy olyan attribútumot használ- 
nánk, mint például az ÉrteremNév attribútum, amely minden példára más és más 
értéket ad. Ez esetben példák minden részhalmaza egyelemű lesz, egyedi osztályba- 
sorolással, így az információnyereség erre az attribútumra veszi fel maximális ér- 
tékét. Mindamellett ez az attribútum irreleváns, értéktelen. Egy lehetséges megoldás 
a nyereségarány (gain ratio) használata (lásd 18.13. feladat). 

. Folytonos és egész értékű bemeneti attribútumok (continuous and integer-valued 
input attributes): A folytonos vagy az egész értékű bemeneti attribútumok -— mint 
például a Magasság és a Súly — által felvehető értékek halmaza végtelen. A döntési 
fa tanuló algoritmusok az ilyen esetekre nem generálnak végtelen elágazású csomó- 
pontokat, inkább megkeresik azt a küszöbpontot (split point), amely a legnagyobb 
információnyereséget eredményezi. Például egy adott csomópontnál az lehet a hely- 
zet, hogy a Súly 5 160 teszt adja a legnagyobb információnyereséget. Léteznek ha- 
tékony dinamikus programozási módszerek jó küszöbpontok megtalálására, de még 
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mindig messze ez a legtöbb erőforrást igénylő része a döntési fa tanulási eljárások 
valós problémákra való alkalmazásának. 

a Folytonos értékkészletű kimeneti attribútumok (continuous-valued output attri- 
butes): Ha egy numerikus értéket akarunk megjósolni, például egy műtárgy árát, ak- 
kor nem osztályozásra van szükségünk, hanem egy regressziós fára (regression tree). 
Egy ilyen fa nem egyetlen értéket (osztályt) ad vissza az egyes levél csomópontjai- 
ban, hanem egy attribútumhalmaz lineáris függvényét. Például a műtárgyak regresz- 
sziós fájának kézzel festett metszetekre vonatkozó ága a területnek, a kornak és a 
színek számának lineáris függvényéhez vezethet. A tanuló algoritmusnak kell azt 
megoldania, hogy mikor álljon le a minták csomópontokban történő szétosztásával, 
áttérve a maradék attribútumokat (vagy azok bizonyos részhalmazát) felhasználó 
lineáris regresszió megalkotására. 


Egy döntési fa tanulásra szolgáló, valós problémák megoldását célzó rendszernek 
képesnek kell lennie mindezen problémák kezelésére. A folytonos értékű változók 
kezelése különösen fontos, mivel mind a fizikai, mind a gazdasági folyamatok numeri- 
kus értékekkel jellemezhetők. Számos, üzleti forgalomban kapható programcsomag 
készült, amelyek megfelelnek mindezen a kritériumoknak, és segítségükkel több száz — 
valamilyen konkrét területen — alkalmazott rendszert fejlesztettek ki. Az ipar és keres- 
kedelem sok területén, ha minták alapján kialakított osztályozásra van szükség, akkor 
elsősorban döntési fákkal próbálkoznak. A döntési fák egyik fontos tulajdonsága, hogy 
az ember számára jól érthető a tanuló algoritmus által előállított eredmény. (Valójában 
olyan gazdasági döntések esetén, amelyeknek megkülönböztetés elleni jogszabályok- 
nak keli megfelelniük, ez jogi követelmény.) A neurális hálózatoknál hiányzik ez a fon- 
tos tulajdonság (lásd 20. fejezet). 


18.4. HIPOTÉZISHALMAZ EGYÜTTES TANULÁSA 


Az eddigiekben olyan tanulási algoritmusokat vizsgáltunk, amelyek eredményeként a 
hipotézistérből kiválasztott egyetlen hipotézist használunk arra, hogy predikciót végez- 
zünk. Az együttes tanulás (ensemble learning) alapötlete, hogy válasszunk ki a hipo- 
tézistérből egy teljes hipotéziskollekciót vagy hipotézisegyüttest (ensembte), és kom- 
bináljuk az általuk adott predikciókat. Generálhatunk például ugyanazon tanító halmaz 
alapján száz különböző döntési fát, és egy új példa esetén szavazással alakíthatjuk ki 
a legjobb predikciós osztályozási eredményt. 

Az együttes tanulás motivációja kézenfekvő. Vizsgáljunk egy M — 5 hipotézisből álló 
együttest, és tegyük fel, hogy a predikciós eredményeket egyszerű többségi szavazással 
kombináljuk össze. Ahhoz, hogy az együttes rosszul osztályozzon egy új példát, legalább 
háromnak az öt hipotézisből rossz osztályozási eredményt kell adnia! Reményünk szerint 
ez sokkal kevésbé valószínű, mint az. hogy egyetlen hipotézis rossz osztályozásra jusson. 
Tegyük fel, hogy az együttes minden h; hipotézisének p a hibavalószínűsége, azaz p 
annak valószínűsége, hogy A; rosszul osztályoz egy véletlen módon kiválasztott példát. 
"Továbbá tegyük fel, hogy a hipotézisek által elkövetett hibák fiiggetlenek. Ez esetben — 
ha p kicsi — rendkívül kicsi a valószínűsége, hogy nagy számban történjék téves osztá- 
lyozás. Egyszerű számítással (lásd 18.14. feladat) megmutatható például, hogy öt hipo- 
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tézisből álló együttest használva a hibaarány 0,1-ről kevesebb mint 0,01-ra csökken. 
Valójában a függetlenség feltételezése nem racionális, mert a hipotéziseket a tanító hal- 
maz félrevezető tulajdonságai hasonló módon vezetik félre. Mindamellett, ha a hipoté- 
Zisek legalább kismértékben eltérőek, lecsökkentve a hibáik közti korrelációt, akkor az 
együttes tanulás nagyon hasznos lehet. 

Az együttes tanulás tárgyalható más aspektusból is: gondolhatunk rá úgy, mint a hi- 
potézistér egy általános kiterjesztésére. Tekintsünk úgy magára az együttesre, mint egy 
hipotézisre, és az új hipotézistér legyen mindazon lehetséges együttesek halmaza, ame- 
lyek az eredeti hipotézistérből konstruálhatók. A 18.8. ábra mutatja, hogyan eredmé- 
nyezhet ez egy sokkal kifejezőbb hipotézisteret. Ha az eredeti hipotézistér egyszerű és 
hatékony tanulási eljárást tett lehetővé, akkor az együttes tanulás módszere egy sokkal 
kifejezőbb hipotézisosztály tanulását biztosítja. Ennek általában nem túl nagy számítási 
és algoritmikus komplexitás növekedés az ára. 

A legelterjedtebben használt együttes tanulási módszert turbózásnak (boosting) ne- 
vezzük. Ahhoz. hogy működését megértsük, be kell vezetnünk a súlyozott tanító hal- 
maz (weighted training set) fogalmát. Egy ilyen tanító halmazban minden mintához 
hozzárendelünk egy wj 2 0 súlyt. Minél magasabb ez a súly, annál nagyobb jelentősé- 
get tulajdonítunk az adott mintának a hipotézis tanulása során. Az eddigiekben áttekin- 
tett tanuló algoritmusaink kézenfekvő módon módosíthatók úgy, hogy súlyozott tanító 
halmazokkal is tudjanak működni. 

A turbózás az összes mintára w; — 1 értékkel (azaz egy normál tanító halmazzal) ín- 
dul. Ebből a halmazból generálja az első hipotézist, /tp-et. Ez a hipotézis egyes tanító- 





18.8. ábra. A együttes tanulás eredményeképpen nyert megnövekedett kifejezőerőt illusztráló példa. 
Három lineáris küszöb jellegű hipotézist vizsgálunk, mindegyik a nem vonalkázott félsíkon ad pozitív 
besorolást. Az együttesben csak arra adunk pozitív osztályozást, amelyre mindhárom pozitívat ad. 
Az eredményül kapott háromszögterület egy olyan hipotézisnek felel meg, amelyet az eredeti hipotézis- 
tér egyetlen eleme sem képes kifejezni. 


5 Azon tanulási eljárásokra, ahol ez nem lehetséges, ismétléses tanító halmazt (replicated training set) 
hozhatunk létre, ahol a j-edik minta a wj súllyal arányos példányszámban szerepel. Az esetleges nem egész sú- 
lyokat úgy kezelhetjük, hogy a mintaszámot valószínűségi változóként fogjuk fel. 
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18.9. ábra. A turbó algoritmus működése. Mindegyik árnyékolt téglalap egy példának felel meg, a tégla- 
lap magassága mutatja a példa súlyát. A pipák és keresztek mutatják, hogy a példát jól vagy rosszul 
osztályoztuk a pillanatnyi hipotézis alapján. A döntési fa mérete mutatja, hogy ennek a hipotézisnek 
mekkora a súlya a végső együttesben. 


mintákat jól osztályoz, másokat rosszul. Azt szeretnénk, ha a következő hipotézis jobb 
eredményt éme el a rosszul osztályozott mintákon, ezért megnöveljük a rosszul osztá- 
lyozottak súlyait, míg a jól osztályozottakét csökkentjük. Ebből az új, súlyozott minta- 
halmazból generáljuk a ha hipotézist. Az eljárást addig folytatjuk, míg M hipotézist nem 
generáltunk, ahol M a turbó tanulási algoritmus bemenő paramétere. Az algoritmus 
eredményeként kapott hipotézis együttes nem más, mint az M hipotézis súlyozott több- 
ségi szavazással kombinált eredője. A súlyokat aszerint határozzuk meg, hogy az egyes 
hipotézisek mennyire jól teljesítettek a tanító halmazon. A 18.9. ábrán bemutatjuk az 
algoritmus koncepcióját. Sok variánsa ismert a turbó tanulásnak, eltérő súlymódosítás- 
sal, illetve a hipotézisek különböző kombinálási lehetőségeivel. Egy kiválasztott — 
ADABOOST nevű — algoritmust mutatunk be a 18.10. ábrán. Az alkalmazott súlymódo- 
sítási eljárás jelen esetben nem túl lényeges, viszont az ADABOOST algoritmusnak van 
egy nagyon lényeges jellemzője. Tegyük fel, hogy a használt L tanulási algoritmus egy 
gyenge tanulási (weak learning) algoritmus, ami azt jelenti, hogy L mindig visszaad 
egy olyan hipotézist, amelyik legalább egy csöppet jobban teljesít a tanító halmaz 
súlyozott hibájára nézve, mint a véletlen találgatás (azaz eredménye jobb mint 5077 
bináris osztályozás esetén). Ez esetben, kellően nagy M-re az ADABOOST mindig előállít 
egy olyan hipotézist, amely a tanító mintákat tökéletesen osztályozza! Tehát az algorit- 
mus fokozza az eredeti tanuló eljárásnak a tanító mintán mért pontosságát. Ez mindig 
fennáll, attól függetlenül, hogy esetleg mennyire kevéssé kifejező az eredeti hipotézis- 
tér, és mennyire bonyolult a keresett függvény. 

"Vizsgáljuk meg, hogy mennyire jól működik a turbózás az éttermi adatainkon. Kiin- 
duló hipotézistérként az úgynevezett döntési tönkök (decision stumps) terét választ- 
juk, amelyek olyan döntési fák, amelyek csupán egy — a gyökércsomópontban elhelyez- 
kedő - tesztből állnak. A 18.11. (a) ábra alsó görbéje mutatja, hogy turbózás nélkül 
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function ADABoosrípéldák, L, M) returns egy súlyozott többségi hipotézis 
inputs: példák, minták N elemű címkézett halmaza (xy. y1). .... CXy. ya 
L. egy tanuló algoritmus 
MM, az együttesben szereplő hipotézisek száma 
local variables: w, az N mintához rendelt súlyok vektora. indulásnál 1/N 
h. az M darab hipotézisből képzett vektor 
z, az M hipotézishez rendelt súlyok vektora 
form— 1 to do 
him] — E(példák, w) 
error — 0 
forj— 1 toN do 
if hin) — yy then error — error 4 wljl 
forj— 1 toNdo 
E hím] z xy then w(j] — vel] - error - error) 
w — NORMALIZÁL(W) 
zím] — log(1 — errorjlerror 
return SÚLYOZOTT-TÖBBSÉG(h, 2) 











18.10. ábra. Az együttes tanulás turbó módszereinek ADABOoST nevű variánsa. Az algoritmus hipotézisek 
kombinációját hozza létre. A SÚLYOZOTT-TÖBBSÉG egy hipotézist generál. Ez az új hipotézis azt a ki- 
meneti értéket adja vissza, amely a h-ban található hipotézisek közül, a z-ben számon tartott súlyozással 
a legtöbb szavazatot kapta. 


ezek a döntési tönkök nem adnak valami jó eredményt, csupán 8199-os a 100 mintán 
mért predikciós teljesítményük. Amikor turbózást alkalmazunk (M — 5), akkor a telje- 
sítmény javul, eléri a 9399-ot 100 példa esetén. 

Érdekes dolog történik, amikor az együttes M mérete növekszik. A 18.11. (b) ábra 
mutatja a tanító halmazon mért teljesítményt M függvényében. Figyeljük meg, hogy M 
— 20-nál a hiba eléri a nullát (ahogy a turbózással foglalkozó elmélet megjósolta), az- 
az 20 döntési tönk súlyozott többségi szavazással összefogott kombinációja elégséges 
a 100 mintára való pontos illeszkedéshez. Ha további tönköket adunk az együtteshez, 
akkor a hiba nulla marad. A görbe mutatja ugyanakkor, hogy a teszthalmazon mért tel- 
jesítmény még hosszasan nő azután is, hogy a tanító halmazon mért hiba elérte a nul- 
lát. M — 20 esetén a teszthalmazon mért teljesítmény 0,95 (a hiba 0,05), M — 137-ig 
növelve az együttes résztvevőinek számát a teljesítmény 0,98-ra nő, ezután leesik 
0.95-re. 

Ez a megfigyelés, amely különböző mintahalmazokra és hipotézisterekre nézve 
meglehetősen robusztusnak bizonyult, nagy meglepetést keltett a felfedezésekor. 
Az Ockham borotvája elv azt sugallja, hogy ne tegyük a hipotéziseket komplexebbé, 
mint szükséges, de a görbe azt mutatja, hogy a predikciók javulnak, ahogy az együt- 
tes hipotézis összetettebbé válik! Számos magyarázatot javasoltak erre a jelenségre. 
Az egyik megközelítés szerint a turbózás nem más, mint a Bayes-tanulás közelítése 
(lásd 20. fejezet), amely egy bizonyíthatóan optimális tanulási eljárás. Ez a közelítés 
javul, ahogy több és több hipotézist adunk az együtteshez. Másik lehetséges magyará- 
zat, hogy további hipotéziseknek az együtteshez adása lehetővé teszi, hogy határozot- 
tabb legyen a megkülönböztetés a pozitív és negatív példák között, ami segít az új 
minták osztályozásában. 
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Tanító halmazon mért hiba ——me 
Teszthalmazon mért hiba... 





Turbázou döntési tönkök — 
Döntési tönk... 





A teszthalmazon kapott jó 
válaszok aránya 
Tunttáheszthalmazon mért 





Hipotézisek száma 
(a) b 


Tanító halmaz méret 


18.11. ábra. (a) A döntési tönkök és a turbózott döntési tönkök teljesítményének az étterem példán tör- 
ténő összehasonlítása M — 5 esetén. (b) A tanító halmazon és a teszthalmazon kapott jó válaszok aránya 
M-nek - az együttesben található hipotézisek számának — a függvényében. Figyeljük meg, hogy a teszt- 
halmazon mért pontosság még azután is javul egy kicsit, amikor a tanító halmazon elérte az 1-et, azaz 
miután az együttes pontosan illeszkedett az adatokra. 
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A legfontosabb megválaszolatlan kérdés, amelyet a 18.2. alfejezetben tettünk fel, a kö- 
vetkező: hogyan bizonyosodhat meg valaki arról, hogy a tanulási algoritmusa által 
létrehozott elmélet helyesen fogja megjósolni a jövőt? Formálisan: honnan tudjuk, hogy 
a h hipotézis jól közelíti az f keresett függvényt. ha nem ismerjük f-et? Évszázadok óta 
foglalkoznak ezekkel a kérdésekkel. Amíg nem találjuk meg a válaszokat, addig a gé- 
pi tanulást — a legjobb esetben is — csak zavarba hozza saját sikere. 

Az ebben az alfejezetben tárgyalt megközelítés a tanulás számítási elméletén (com- 
putational learning theory) alapul, amely az MI, a statisztika és az elméleti számítástu- 
domány közös határterülete. Ennek az elméletnek az alapvető elve a következő: bármely 
súlyosan hibás elmélet szinte bizonyosan nagy valószínűséggel felismerhető kisszámú pél- 
da vizsgálata alapján, mivel helytelen predikciót fog adni. Tehát minden hipotézis, amely 
egy kielégítően nagy tanító példahalmazzal konzisztens választ ad. nem valószínű, hogy 
súlyosan hibás lenne: azaz valószínűleg közelítőleg helyesnek (probably approximately 
correct) kell lennie. Minden olyan tanuló algoritmust, amely valószínűleg közelítőleg 
helyes hipotéziseket ad, VKH-tanuló (PAC-learning) algoritmusnak nevezünk. 

Van néhány bonyolultabb rész az előbbi gondolatmenetben. A fő kérdés a tanító és 
a tesztpéldák viszonya: végül is mi azt szeretnénk, ha a hipotézis nem csupán a tanító 
halmazon lenne közelítőleg helyes, hanem elsősorban a teszthalmazon. Az alapvető 
feltevés az, hogy a tanító és a teszthalmazt ugyanolyan valószínűség-elosztást hasz- 
nálva, véletlenszerűen és függetlenül választottuk ugyanabból a példapopulációból. 
Ezt stacionaritási (stationarity) feltevésnek nevezzük. A stacionaritási feltevés nél- 
kül az elmélet semmilyen, a jövőre vonatkozó igénnyel nem léphet fel, mivel nem lesz 
szükségszerű kapcsolat a múlt és a jövő között. A stacionaritási feltevés támasztja alá 
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azt a gondolatot, hogy a példákat kiválasztó eljárás nem rosszindulatú. Persze ha a 
tanító halmaz kizárólag furcsa példákat tartalmaz — kétfejű kutyákat például -, akkor 
a tanuló algoritmus nyilvánvalóan nem tehet mást, mint sikertelen általánosításra jut a 
felől, hogy mi módon lehet a kutyákat felismerni. 


Hány példára van szükség? 


Néhány definícióra szükségünk lesz ahhoz, hogy ezeket a felismeréseket a gyakorlatba 
át tudjuk ültetni: 


X-szel az összes lehetséges példák halmazát. 

Jelölje D azt a valószínűségi eloszlást, amely alapján a példákat választjuk. 
Legyen H a lehetséges hipotézisek halmaza. 

Legyen N a tanító halmaz elemeinek a száma. 





. 
. 


Előzetesen feltesszük, hogy a keresett f függvény eleme H-nak. Most már definiálhat- 
juk azt a hibát (error), ami egy h hipotézisnek a keresett f függvénytől való eltérését 
jellemzi a mintákra vonatkozó adott eloszlás mellett, mint annak valószínűségét, hogy 
h az f-től eltérő választ ad egy példára: 


error) — P(h(x) z fh a D alapján választva) 


Ez ugyanaz a mennyiség, mint amelyet az előzőkben bemutatott tanulási görbékkel 
mértünk a gyakorlatban. 

Egy h hipotézist közelítőleg helyesnek (approximately correct) nevezünk, ha 
erroríh) £ e, ahol c egy kis konstans. A bizonyítás megközelítése az, hogy megmutat- 
juk: N példa vizsgálata után az összes konzisztens hipotézis nagy valószínűséggel kö- 
zelítőleg helyes lesz. Úgy gondolhatunk egy közelítőleg helyes hipotézisre, mint amely 
közel van a keresett függvényhez a hipotézistérben: egy — a keresett f körül felvett — 
€-gömbön (€-ball) belül van. A 18.12. ábrán bemutatjuk az összes hipotézis H terét, 








Hossz 








18.12. ábra. A hipotézistér sematikus ábrázolása a keresett f függvény körül felvett , £-gömb" ábrázolásával 
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amelyet két részre osztottunk, egyik az £-gömb f körül, a másik a Hiossz-szal jelölt ma- 
radék. 

A következők alapján kiszámíthatjuk annak valószínűségét, hogy egy , súlyosan hibás" 
h, € Hossz hipotézis konzisztens lesz az első N példával. Tudjuk, hogy error(h,) 2 €. 
Tehát annak valószínűsége, hogy egy adott példára helyes választ ad, legfeljebb I — e. 
Ezek után az N példára vonatkozó összefüggés: 


P(h, konzisztens N példával) £(1—9" 


Annak valószínűségét, hogy Hossz legalább egy konzisztens hipotézist tartalmaz, a le- 
hetséges egyedi hipotézisek száma határozza meg: 


P(H,ossz tartalmaz egy konzisztens hipotézist) £ IHrosszl(1—€)" 5 IR (1— ey 


rossz 


Kihasználtuk, hogy IHosszl S IHI. Ezt a valószínűséget valamely kellően kis ő érték alá 
akarjuk csökkenteni: 


HIa-e)" ső 


Felhasználva, hogy (1— 2) S €", a célunk elérhető, ha lehetővé tesszük, hogy az al- 
gorítmus 


v 2 zÍnz ral) (18.D 


példát megvizsgálhasson. Ennek értelmében, ha egy algoritmus ilyen mennyiségű pél- 
dával konzisztens hipotézist ad vissza, akkor legalább 1 — ő valószínűséggel a hibája 
legfeljebb e. Más szavakkal közelítőleg helyesnek nevezzük. A szükséges példaszámot, 
ami c és ő függvényeként adható meg, a hipotézistér minta komplexitásának (sample 
complexity) nevezzük. 

Kiderült, hogy kulcskérdés a hipotézistér mérete. Mint korábban láttuk, ha H az n 
attribútumon felvehető Boole-függvények halmaza, akkor [HI — 27. Tehát a tér minta 
komplexitása 2" szerint nő. Mivel a lehetséges példák száma szintén 2", ebből az követke- 
zik, hogy a Boole-függvények terében egyetlen tanuló algoritmus sem tud jobb ered- 
ményt elérni, mint egy táblázat, ha csupán arra szorítkozik, hogy egy olyan hipotézist 
adjon vissza, amely az összes ismert példával konzisztens. Ennek megmutatására egy 
másik lehetőség az, hogy megfigyeljük: egy tetszőleges ismeretlen példára a hipotézis- 
tér ugyannyi pozitív kimenetelt jósoló konzisztens hipotézist tartalmaz, mint amennyi 
negatív kimenetelt jósol. 

A következő dilemmával kerültünk szembe: ha nem korlátozzuk a szóba jövő függvé- 
nyek terét, akkor az algoritmus nem lesz képes tanulni, viszont ha korlátozzuk a függvé- 
nyek terét, akkor fennáll a veszély, hogy kihagyjuk a keresett függvényt. Két lehetősé- 
günk van, hogy , kimeneküljünk" ebből a dilemmából. Az első, hogy nem csupán ahhoz 
ragaszkodunk, hogy az algoritmus egy tetszőleges konzisztens hipotézist adjon vissza, 
hanem ahhoz is, hogy részesítse előnyben az egyszerűeket (mint ahogy a döntési fa tanu- 
Jásnál tettük). Ezen algoritmusok elméleti tárgyalása túlmegy ennek a könyvnek a keretein, 
de megemlítjük, hogy azon esetekben, amikor az egyszerű konzisztens hipotézisek keresése 
kezelhető probléma, a mintakomplexitás-eredmények jobbak, mint a csupán konziszten- 
cián alapuló vizsgálatoké. A másik menekülési lehetőség, amelyet követni is fogunk, 
hogy a Boole-függvények teljes halmazából a megtanulható függvények részhalmazára 
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fogunk koncentrálni. Az ötlet abban áll, hogy legtöbb esetben nincs szükségünk a Boole- 
függvények teljes kifejezőerejére, korlátozottabb nyelvek is kielégítők számunkra. A kö- 
vetkezőkben egy ilyen korlátozottabb nyelvet vizsgálunk meg részletesebben. 


Döntési listák tanulása 


A döntési lista (decision list) egy kötött formájú logikai kifejezés. Egy tesztsorozatból 
áll, amely tesztek mindegyike literálisok konjunkciója. Ha egy teszt valamelyik példa 
leírására alkalmazva pozitív eredményt ad, akkor a döntési lista határozza meg a példára 
adandó választ. Ha a teszt eredménye negatív, akkor a lista következő tesztjével foly- 
tatódik a feldolgozás.§ A döntési listák emlékeztetnek a döntési fákra, de a globális struk- 
túrájuk egyszerűbb, ezzel szemben az egyes tesztek bonyolultabbak, mint a döntési fák- 
nál. A 18.3. ábra egy döntési listát mutat be, amely a következő hipotézist reprezentálja; 


Vx VárjunkE(x) 62 Vendégektx, Néhány) V (Vendégekíx, Tele) A PénteklSzombattx)) 


Ha megengedünk tetszőleges méretű teszteket, akkor a döntési listák bármely Boole- 
függvény reprezentálására képesek (lásd 18.15. feladat). Másrészről, ha az egyes tesz- 
tek méretét k literálisra korlátozzuk, akkor lehetővé válik, hogy a tanuló algoritmus 
kisszámú példa alapján sikeresen általánosítson. Ezt k-DL nyelvnek nevezzük. Köny- 
nyen megmutatható, hogy a k-DL nyelvek részhalmazként tartalmazzák a k-DF nyel- 
veket, amelyek a legfeljebb k mélységű döntési fák halmazát alkotják. Fontos, hogy 
egy adott nyelv, amelyre k-DL jelöléssel hivatkozunk, függ azoktól az attribútumoktól, 
amelyekkel a példákat leírjuk. A továbbiakban k-DL(n) lesz a jelölésünk azokra a k-DL 
nyelvekre, amelyek ni logikai attribútumot használnak. 

Első feladatunk annak megmutatása, hogy a k-DL nyelvek megtanulhatók, azaz bár- 
mely k-DL függvény pontosan közelíthető, ha kellő számú tanító mintán tanultunk. 
Ehhez ki kell számítanunk a nyelvben felvehető hipotézisek számát. Legyen a tesztek 
nyelve - n attribútumot használva, legfeljebb k literális konjunkciója — Conj(n, k). 
A döntési listákat tesztekből építjük fel, és minden teszthez egy Igen vagy Nem választ 
rendelhetünk, illetve harmadik lehetőségként a teszt hiányozhat a listáról, ezért legfel- 
jebb 31Corin0l különböző teszthalmaz létezhet. Ezek a tesztek tetszőleges sorrendben 
alkalmazhatók, így 


Ik-DLAmI £ Zenit AljConjín.k)]! 
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Igen igen 








18.13. ábra. Az éttermi problémára alkotott döntési lista 


6 Egy döntési lista tehát szerkezetében megegyezik a Lisp nyelv cow állításával. 
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Az n attribútumot használó k literális lehetséges konjunkcióinak száma: 
k 
€ 
Idonjtn.ky1— x 7] -0W) 
i 


1-0 
Így néhány lépés után: 
Ik-DLEDI — 20 log 


Ezt a (18.1) egyenletbe helyettesítve megmutathatjuk, hogy a k-DL függvények VKH- 
tanulásához szükséges minták száma polinomiálisan nő r1-nel: 


N 21 Íin14.ow ozat) 
el 6 


Ennek értelmében bármely algoritmus, amely konzisztens döntési listát ad vissza, kis k 
Értékek esetén elfogadható példaszám alapján VKH-tanulással képes előállítani egy k- 
DL függvényt. 

A következő feladatunk, hogy hatékony algoritmust találjunk, amely konzisztens 
döntési listát eredményez. A DÖNTÉSI-LISTA-TANULÁS nevű mohó algoritmust fogjuk 
használni. Ez ismételten talál egy olyan tesztet, amely pontosan a tanító halmaz vala- 
mely részhalmazának felel meg. Amikor talál egy ilyen tesztet, akkor azt hozzáadja a dön- 
tési listához, egyben eltávolítva a tesztnek megfelelő példákat a tanító halmazból. Ezek 
után létrehozza a döntési lista hátralevő részét pusztán a maradék példákra alapozva. Ezt 
addig ismétli, amíg nem marad több példa. Az algoritmust a 18.14. ábra mutatja. 

Ez az algoritmus nem specifikálja, hogy milyen módszert használjunk a következő — 
a döntési listához adni kívánt — teszt kiválasztásához. Bár a bemutatott formálisan elért 
eredmények nem függnek a kiválasztás módszerétől, mégis az látszik józannak, ha 
előnyben részesítjük azokat az egyszerű teszteket, amelyek az osztályozott példák nagy 
részhalmazainak felelnek meg. Ennek eredményeként a döntési lista a lehető legtömö- 
rebb lesz. A legegyszerűbb stratégia, ha azt a legrövidebb t tesztet keressük meg, amely 
egy tetszőleges, egyforma osztálybasorolással rendelkező részhalmaznak megfelel, 
figyelmen kívül hagyva a részhalmaz méretét. Még ez a megközelítés is egész jól mű- 
ködik, mint az a 18.15. ábrán látható. 





function DÖNTÉSI-LISTA-TANULÁS(példák) returns egy döntési lista vagy kudarc 

if példák üres then return a triviális döntési lista, Nem 

1 — egy teszt, amely pontosan megfelel a példák egy példák, nemüres részhalmazának, azaz a példák, 
minden elemére a teszt vagy pozitív, vagy negatív értéket ad 

if nincs ilyen ! then return Áudarc 

if példák, elemeire a teszt pozitív then o — Igen else o — Nem 

return egy döntési lista. amelynek első eleme 1, a válasz c, és a maradék teszteket a 
DÖNTÉSI-LISTA-TANULÁS( példák — példák) adja 








18.14. ábra. Egy döntési lista tanulásra használható algoritmus 
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18.15, ábra. A DÖNTESI-LISTA-TANULÁS algoritmusnak az éttermi adatokon felvett tanulási görbéje. 
Az összehasonlítás kedvéért feltüntettük a DÖNTÉSI-FA-TANULÁS algoritmus görbéjét is. 


Elemzés 


A tanulás számítási elmélete új szempontból világította meg a tanulás problémáját. 
Az 1960-as évek elején a tanulás elmélet az identifikáció határátmenetben (identifi- 
cation in the limit) problémájára koncentrált. E szerint egy identifikációs algoritmusnak 
mindenképpen vissza kell adnia egy olyan hipotézist, amely pontosan megegyezik a ke- 
resett függvénnyel. Erre a következőkben ismertetett eljárás ad egy lehetséges módszert. 
Először is rendezzük a H hipotézistér minden elemét valamilyen egyszerűség mérték sze- 
rint. Ezek után válasszuk azt a legegyszerűbb hipotézist, amely konzisztens az összes már 
rendelkezésre álló példával. Ahogy újabb példák érkeznek, a módszer fel fogja adni az 
egyszerűbb hipotézist, ha az új példák érvénytelenítették, és helyette egy bonyolultabbat 
választ. Amikor eléri a keresett függvényt, akkor azt már soha nem fogja feladni. Sajnála- 
tos, hogy számos hipotézistérben óriási nagy lehet a keresett függvény eléréséhez szüksé- 
ges idő, valamint a szükséges példák száma. Ezért a tanulás számítási elmélete nem ragasz- 
kodik ahhoz, hogy a tanuló ágens megtalálja a környezetét vezérlő , egyedüli helyes 
törvényt". Ehelyett inkább egy olyan hipotézist keres. amely egy bizonyos prediktív pon- 
tosságot elér. A tanulás számítási elmélete ezen felül erősen hangsúlyozza a hipotézis 
nyelv kifejezőképessége és a tanulás komplexitása közötti kompromisszum fontosságát. 
Ez az elmélet vezetett egy fontos tanuló algoritmus osztályhoz, a szupport vektorgépekhez. 

Az általunk bemutatott, VKH-tanulásra vonatkozó eredmények a legrosszabb esetre 
érvényesek, nem feltétlenül mutatva azt az átlagos esetre vonatkozó mintakomplexitást, 
amelyeket viszont a bemutatott tanulási görbék tükröznek. Egy, az átlagos esetre vonat- 
kozó analízisnek további feltételezésekkel kell! élnie a minták eloszlásáról, valamint 
a keresett függvények eloszlásáról. Miközben ezeket a kérdéseket egyre jobban meg- 
értjük, a tanulás számítási elmélete folyamatosan a gépi tanulással foglalkozó kutatók 
hasznos útmutatójának bizonyul. Ezek a kutatók algoritmusaik módosításában vagy 
algoritmusaik tanulási képességének meghatározásában érdekeltek. A döntési listák 
mellett a Boole-függvények szinte minden ismert alosztályára, a neurális hálókra (lásd 
20. fejezet), valamint az elsőrendű logikai állítások halmazaira (lásd 19. fejezet) szület- 
tek eredmények. Az elért eredmények azt mutatják, hogy a tisztán indukciós tanulás 
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rendkívül nehéz. Tisztán indukciós tanuláson azt a helyzetet értjük, amelyben az ágens 
nem rendelkezik semmilyen, a keresett függvényre vonatkozó, előzetes ismerettel. Mint 
a 19. fejezetben megmutatjuk. az előzetes tudásnak az induktív tanulás vezérlésére való 
felhasználása lehetővé teszi, hogy meglehetősen nagy állításhalmazokat elfogadható 
mintaszám alapján megtanuljunk, még egy olyan nyelven is, amelynek kifejezőereje 
megegyezik az elsőrendű logikáéval. 


18.6. ÖSSZEFOGLALÁS 


Ebben a fejezetben determinisztikus függvények példák alapján való induktív tanulására 
koncentráltunk. A főbb pontok a következők voltak: 


s A tanulásnak számos formája van, amely a cselekvő alrendszer jellegétől. a javítani 
kívánt komponenstől és a rendelkezésre álló visszacsatolástól függ. 

s Ha akár egy tanár, akár a környezet lehetővé teszi a minták helyes értékének vissza- 
csatolását, akkor ellenőrzött tanulási (supervised learning) problémáról beszé- 
lünk. A feladat, amelyet induktív tanulásnak (inductive learning) is nevezhetünk, 
abban áll, hogy egy függvényt kell megtanulnunk annak bemeneti és kimeneti mintái 
alapján. Diszkrét értékkészletű függvény tanulását osztályozásnak (classification), 
folytonos értékű függvény tanulását pedig regressziónak (regression) nevezzük. 

s Az induktív tanulás magában foglalja, hogy egy. a példákkal konzisztens hipotézist 
kell találnunk. Az Ockham borotvája (Ockhamvs razor) elv értelmében célszerű 
a legegyszerűbb konzisztens hipotézis választása. Ennek a feladatnak a nehézségét a 
választott reprezentáció döntően befolyásolja. 

. A döntési fák (decision trees) alkalmasak tetszőleges Boole-függvény reprezentá- 
lására. Az információnyereségre (information gain) alapozó heurisztika hatékony 
módszert biztosít egyszerű, konzisztens döntési fák konstruálására, 

s. A tanulási algoritmus teljesítményét a tanulási görbén (learning curve) mérhetjük le, 
amely a teszthaimazon (test set) mért predikciós pontosságot mutatja a tanító hal- 
maz (training set) méretének függvényében. 

s Az együttes tanulási módszerek, például a turbózás (boosting), gyakran jobb ered- 
ményt érnek el, mint az egyedi módszerek. 

s A tanulás számítási elmélete (computational learning theory) az induktív tanu- 
lás minta komplexitásának és számítási komplexitásának analízisére koncentrál, 
Kompromisszumot kell kötnünk a hipotézis nyelv kifejezőképessége és a tanulás 
nehézsége között. 


Irodalmi és történeti megjegyzések 


Az I. fejezet felvázolta az induktív tanulás filozófiai vizsgálatának történetét. William 
of Ockham (1280-1349) volt korának legnagyobb hatású filozófusa és a középkori is- 
meretelmélet, a logika és a metafizika egyik nagy alakja. Neki tulajdonítják azt a mon- 
dást, ami , Ockham borotvája" néven rögzült a köztudatban. Latinul: Entia non sunt 
multiplicanda praeter necessitatem, ami azt jelenti magyarul, hogy , A dolgokat nem 
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kell a szükségesnél jobban bonyolítani". Sajnos ez a dicséretes mondás sehol sem talál- 
ható meg a műveiben pontosan így megfogalmazva. 

Az EPAM (Elementary Perceiver And Memorizer, Elemi észlelő és megjegyző) volt 
az első rendszerek egyike, amely döntési fákat (diszkriminációs hálókat, discrimination 
nets) használt (Feigenbaum, 1961). Az EPAM létrehozásának célja az emberi fogalom- 
tanulás kognitív-szimulációs modelljének megalkotása volt. A CLS-rendszer (Hunt és 
társai, 1979) heurisztikus előretekintő eljárást használt a döntési fák konstrukciójára. 
Az ID3 (Ouinlan, 1979) hozta azt a kulcsfontosságú ötletet, hogy a heurisztikus függ- 
vény használja az információtartalmat. Az információelméletet Claude Shannon fejlesz- 
tette ki a kommunikáció tanulmányozására (Shannon és Weaver, 1949). (Shannon hoz- 
zájárult a gépi tanulás területéhez is, az egyik legkorábbi példát szolgáltatva mechanikus 
egerével, amely egy útvesztőben navigált a kísérlet-kudarc elvet használva.) A döntési 
fák e metszését Ouinlan írta le először (Ouinlan, 1986). Az ipari felhasználásra alkal- 
mas €4.5 döntési fa programcsomag is Ouinlan munkáiban található meg (Ouinlan, 
1993). A döntési fa tanulásnak egy, az előzőktől független hagyománya alakult ki a sta- 
tisztikusok körében. A Classification and Regression Trees (Breiman és társai, 1984), 
amelyet röviden , CART könyv"-nek neveznek, az alapvető irodalom e tekintetben. 

A tanulás számos másik algoritmikus megközelítését is vizsgálták. A pillanatnyilag- 
legjobb-hipotézis (current-best-hypothesis) megközelítés egyetlen hipotézissel foglal- 
kozik, specializálva, ha túl tágnak bizonyul, általánosítva, ha túl szűk. Ez a filozófiában 
már régóta ismert elv (Mill, 1843). A kognitív pszichológia korai munkájában szintén 
ezt javasolták, mint az emberi fogalom tanulás természetes formáját (Bruner és társai, 
1957). Az Mi-területen ez a megközelítés elsősorban Patrick Winston munkájához köt- 
hető, aki PhD-disszertációjában (Winston. 1970) a komplex objektumok leírásának 
tanulásával foglalkozott. A verziótér (version space) módszer (Mitchell, 1977; 1982) 
eltérő megközelítésen alapul, az összes konzisztens hipotézissel egyszerre foglalkozik, 
elhagyva azokat, amelyek az új példákkal inkonzisztenciát mutatnak. Ezt a megközelí- 
tést a META-DENDRAL kémiai szakértő rendszerben használták (Buchanan és Mitchell, 
1978), majd később Mitchell LEx rendszerében (Mitchell, 1983), ami matematikai ana- 
lízis problémák tanulással történő megoldását célozta. A harmadik nagyhatású irányzat 
kialakítása Michalski és társai munkájához köthető, akik az AC algoritmusok sorozatával 
foglalkoztak, amelyek logikai szabályok halmazát tanulták (Michalski. 1969; Michalski 
és társai, 1986b). 

Az együttes tanulás a tanuló algoritmusok teljesítménynövelésének egyre népszerűbb 
módszere. A zsákolás (bagging)" (Breiman, 1966) az első hatékony módszer, amely több- 
féle indító (bootstrap) adathalmaz alapján megtanult hipotézisek kombinációját hozza létre. 
Ezeket az adathalmazokat az eredeti alulmintavételezésével állítják elő. A fejezetben is- 
metrtetett turbózás (boosting) módszere eredetileg Schapire elméleti munkájából (Scha- 
pire, 1990) származik. Az AdaBoost algoritmust Freund és Schapire dolgozta ki (Freund 
és Schapire, 1996), és Schapire adta meg elméleti analízisét (Schapire, 1999). Friedman 
És társai statisztikai alapon tárgyalják a turbózás módszerét (Friedman és társai, 2000). 

A tanulási algoritmusok elméleti vizsgálata Gold munkájával kezdődött (Gold, 1967) 
az identifikáció határátmenetben (identification in the limit) probléma tanulmányo- 


7 A bagging név eredetileg a ,boolstrap aggregating" rövidítéseként jelent meg, de az angol ,bag" szó 
jelentését nagyrészt átvette, ezért fordítottuk ,zsákolásnak". (A ford.) 
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zásával. Ez a megközelítés ugyan részben tudományfilozófiai felfedezésből eredt (Pop- 
per, 1962), de alkalmazásának legfőbb területe nyelvtanok példamondatok alapján törté- 
nő tanulása volt (Osherson és társai, 1986). 

Míg az identifikáció határátmenetben megközelítés a végső konvergenciára koncent- 
rál, addig a Kolmogorov-komplexitás (Kolmogorov complexity) vagy más néven 
algoritmikus komplexitás (algorithmic complexity), amelyet egymástól függetlenül 
Solomonoff (1964) és Kolmogorov (1965) fejlesztett ki, formális definíciót próbál adni 
az Ockham borotvája elvben használt egyszerűségnek. Hogy valahogy kimeneküljenek 
tól, azt javasolták, hogy az egyszerűséget annak a legrövidebb programnak a hosszával 
mérjék, amely egy általános Turing-gépen helyesen adja vissza a megfigyelt adatokat. 
Bár sok különböző általános Turing-gépet lehet létrehozni, és így több különböző , leg- 
rövidebb" program lehetséges, ezek hossza legfeljebb csak egy konstansban tér el, amely 
független az adatok mennyiségétől. Ezt a gyönyörű eredményt, amely betekintést nyújt 
abba, hogy bármely előzetes reprezentációs eltérést végül maguk az adatok győznek le, 
csupán az teszi tönkre, hogy a legrövidebb program hosszának kiszámítása eldönthe- 
tetlen problémára vezet. Közelítő mértékeket lehet alkalmazni, például a legrövidebb 
leíró hosszt (minimum description length) vagy LLH-t (Rissanen, 1984), amivel ki- 
magasló gyakorlati eredményeket értek el. Li és Vitányi írása a Kolmogorov komplexi- 
tás legjobb összefoglalása (Li és Vitányi, 1993). 

A tanulás számítási elméletét — azaz a VKH-tanulás elméletét — Lesli Valiant vezette 
be (Valiant, 1984). Valiant munkája a számítási komplexitásra és a mintakomplexitásra 
helyezte a fő hangsúlyt. Michael Kearnsszel együtt Valiant megmutatta, hogy számos 
olyan fogalomosztály van, amely VKH-tanulással nem kezelhető probléma, még akkor 
sem, ha a példák elegendő információt nyújtanak. Bizonyos problémaosztályokban, 
például döntési listáknál, elértek néhány pozitív eredményt (Rivest, 1987). 

A mintakomplexitás vizsgálatának ettől független tradícióját találhatjuk a statiszti- 
kusok körében, amely az egyenletes konvergencia elméletének (uniform convergence 
theory) vizsgálatával kezdődött (Vapnik és Cservonenkis, 1971). Az úgynevezett VC- 
dimenzió nagyjából a VKH tanulásból származó mértékhez hasonló — bár annál álta- 
lánosabb — mértéket ad. A VC-dimenzió, ellentétben a VKH-analízissel, folytonos 
függvényosztályokra is alkalmazható. A VKH-analízis és a VC elmélet között először 
a , négy német", Blumer, Ehrenfeucht, Haussler és Warmuth (1989) teremtett kapcso- 
latot (akik közül valójában egyik sem német). A VC elmélet további fejlődése vezetett 
a szupport vektorgép vagy SVM? (support vector machine) kidolgozásához (Boser és 
társai, 1992; Vapnik, 1998). A szupport vektorgéppel a 20. fejezetben foglalkozunk. 

Nagyon sok, a gépi tanulással foglalkozó fontos publikációt gyűjtöttek egybe a 
Readings in Machine Learning c. kötetben (Shavlik és Dietterich, 1990). A kétkötetes 
Machine Learning ! (Michalski és társai. 1983), illetve Machine Learning 2 (Michalski 
és társai, 1986a) is sok fontos közlést tartalmaz, továbbá hatalmas bibliográfiát. Weiss 
és Kulikowski a függvény tanulás áttekinthető bevezetését adja gépi tanulási, statiszti- 
kai és neurális alapokon (Weiss és Kulikowski, 1991). A STATLOG projektben (Michie 
és társai, 1994) végezték a tanuló algoritmusok teljesítményének messze legkimerítőbb 
összehasonlítását. A jelenleg is folyó, a gépi tanulással foglalkozó fontos kutatási ered- 


§ Magyarul is az SVM rövidítés terjedt el. (A ford.) 
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mények az International Conference on Machine Learning éves kiadványaiban, a 
Neural Information Processing Systems konferencián, a Machine Learning és a Jour- 
nal of Machine Learning Research folyóiratokban, továbbá a fontosabb MI-újságokban 
jelennek meg. A tanulás számítási elméletének eredményei megjelennek az éves ACM 
Workshop on Computational Learning Theory (COLT) kiadványokban, valamint 
Kearns és Vazirani (1994), továbbá Anthony és Bartlett (1999) publikációiban. 


Feladatok 


18.1. 


18.2. 


18.3. 


184. 


18.§. 


18.6. 


18.7. 


Vizsgálja meg a beszélni, illetve egy nyelvet megérteni tanuló gyerek problémá- 
ját! Magyarázza meg, hogy ez a folyamat hogyan illeszkedik az általános tanu- 
lási modellhez, és megfelelően azonosítsa a modell egyes komponenseit! 


Ismételje meg a 18.1. feladatot a tenisz (vagy valamilyen ön által ismert sport) 
tanulásának esetére! Ez felügyelt vagy megerősítéses tanulás? 


Rajzoljon fel egy döntési fát arra a problémára, hogy az útkereszteződésben 
elinduljunk-e előre. ha a lámpa éppen most váltott zöldre! 


Soha nem teszteljük kétszer ugyanazt az attribútumot a döntési fa egy útvonala 
mentén. Miért? 


Tegyük fel, hogy egy döntési fa segítségével generálunk egy tanító mintahal- 
mazt, majd döntési fa tanulást alkalmazunk erre a halmazra. A tanulási algorit- 
mus végül is a helyes döntési fát fogja visszaadni, ha a tanító halmaz mérete a 
végtelenhez tart? Miért. vagy miért nem? 


Egy jó , butácska" tanulási algoritmus a következő: készítsünk egy táblázatot az 
összes tanítópéldából. Vizsgáljuk meg, hogy milyen kimenet szerepel a legtöbb- 
ször a tanítópéldákban: jelöljük ezt d-vel. Ezek után, ha olyan minta jelenik meg 
a bemeneten, ami nincs a táblázatban, akkor adjunk vissza d-t. Olyan bemene- 
tekre, amelyek megtalálhatók a táblában, adjuk vissza a táblázatban a bemenet- 
hez asszociált kimeneti értéket (vagy ha egynél több kimeneti érték van azonos 
bemenethez, akkor a leggyakrabban előfordulót). Implementálja ezt az algorit- 
must, és vizsgálja meg egy példának választott területen (például az étterem 
problémán) azt, hogy mennyire működik jól! Ennek alapján fogalmat alkotha- 
tunk a tanulás területének alapszintjéről — a minimális elvárható teljesítményről, 
amelyet minden tanuló algoritmusnak el kell érnie. 


"Tegyük fel, hogy egy új algoritmussal tanulási kísérletet folytat. Egy adathalmazt 
használ, amiben 25-25 példa van az előforduló két osztályra. Azt tervezi, hogy a 
hagyj-ki-egyet keresztvalidációs módszert fogja használni. Összehasonlítási 
alapként egy egyszerű többségi szavazót használ. (A többségi szavazónak meg- 
adva egy tanító halmazt, a bemenetektől függetlenül mindig azt a kimenetet 
adja, amely kimeneti érték a halmazban legtöbbször előfordul.) Azt várta, hogy 
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a többségi szavazó, a hagyj-ki-egyet keresztvalidációban nagyjából 5096-ot fog 
elérni, de meglepetésére 096 az eredmény. Meg tudja magyarázni, hogy miért? 


18.8. A döntési fák rekurzív előállítása során néha előfordul, hogy pozitív és negatív 
példák vegyes halmaza marad egy levélcsomópontban, még akkor is, ha az ösz- 
szes attribútumot használtuk már. Tegyük fel, hogy p pozitív és n negatív pél- 
dánk van. 

(a) Mutassa meg, hogy a DÖNTÉSI-FA-TANULÁS algoritmusban használt megol- 
dás, amely a többségi osztályozást választja, minimalizálja a példahalmazra 
vonatkozó abszolút hibát a levélnél! 

(b) Mutassa meg, hogy a p/(p -t n) osztály-valószínűség (class probability) 
eredményként való visszaadása minimalizálja négyzetes hiba összegét! 


18.9. Tegyük fel, hogy egy tanulási algoritmus konzisztens hipotézist keres, és az osz- 
tályozandó példákat véletlen módon generáljuk. A példákat egyenletes eloszlás- 
sal választjuk az n Boole-attribútum alapján kialakított 2n példa lehetőségből. 
Számítsa ki, hány példa kell ahhoz. hogy egy ellentmondás felmerülésének a 
valószínűsége 0,5 legyen! 


18.10. Tegyük fel, hogy egy attribútum a példák E halmazát E, részhalmazokra bontja, 
és mindegyik részhalmazban p; pozitív és n; negatív példa van. Mutassa meg, 
hogy ha a p;/(p; 4 n;) arány nem egyforma minden i-re, akkor az attribútum in- 
formációnyeresége biztosan pozitív! 


18.11. Módosítsa a DÖNTÉSI-FA-TANULÁS algoritmust úgy, hogy tartalmazza a x? met- 
szést! A részleteket megtalálhatja Ouinlan írásában (Ouinlan, 1986). 


18.12. A fejezetben leírt standard DÖNTÉSI-FA-TANULÁS algoritmus nem képes azon ese- 
tek kezelésére, amelyekben néhány példa esetén hiányoznak attribútumértékek. 
(a) Először is valamilyen módszerre van szükségünk, amellyel egy adott dönté- 
si fa alapján be tudunk sorolni példákat akkor is, ha a fában olyan attribú- 
tumokra vonatkozó tesztek szerepelnek, amelyek értéke hiányozhat egyes 
példáknál. Tegyük fel. hogy az X példa A attribútumra vonatkozó értéke 
hiányzik, és a döntési fa teszteli A-t egy olyan csomópontban, amit X elér. 
Ennek az esetnek egyik kezelési lehetősége, hogy úgy teszünk, mintha a pél- 
da az összes lehetséges attribútumértékkel rendelkezne, de súlyozzuk az egyes 
értékeket azzal a gyakorisággal, amelyet az összes olyan példán mérünk, 
amely eléri a döntési fa ezen csomópontját. A besorolási algoritmusnak min- 
den olyan csomópont összes ágát követnie kell, amelyben egy érték hiány- 
zik, és mindegyik út mentén össze kell szoroznia a súlyokat. Írja meg azt a 
módosított döntési fa algoritmust, amely rendelkezik ezzel a tulajdonsággal! 

(b) Módosítsa az információnyereség számítást a következő módon: a fa építé- 
sének fázisában egy adott csomópontba jutó tetszőleges C tanító példa- 
halmaznál azok a példák, amelyeknek hiányzik bármely hátralevő (még nem 
vizsgált) attribútumhoz tartozó értéke, a C halmazban ezen attribútumra elő- 
forduló értékgyakoriság szerint kapjanak , mint-ha" értéket! 
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18.13. 


18.14. 


18.15. 


A 18. fejezetben megmutattuk, hogy azok az attribútumok, amelyeknek nagyon 
sokféle lehetséges értékük van, problémát jelenthetnek az információnyereség 
számításánál. Ezek az attribútumok jó eséllyel nagyon sok kis osztályra, akár 
egyelemű osztályokra bontják a halmazt, ezért úgy tűnik a nyereség számításá- 
nál, hogy nagyon fontosak az adott csomópontban. A nyereségarány (gain ratio) 
kritérium az attribútumokat az általuk hozott információnyereség és a saját belső 
információtartalmuk arányával méri. A belső információtartalom arra a kérdésre 
adott válasz, hogy , Mi az értéke ennek az attribútumnak?". A nyereségarány 
kritérium ennek megfelelően azt próbálja mérni, hogy mennyire hatékony infor- 
mációt biztosít a példa helyes osztályozásához ez az attribútum. Alkossa meg az 
attribútum információtartalmának matematikai kifejezését, és módosítsa a DÖN- 
TÉSI-FA-TANULÁS algoritmust nyereségarány-alapúra! 


Egy együttes tanulási algoritmust vizsgál, amely M megtanult hipotézis eredmé- 
nyének egyszerű többségi szavazását használja. Tegyük fel, hogy az összes hí- 
potézisnek e a hibája, és az egyes hipotézisek által elkövetett hibák függetlenek 
a többiek hibájától. Adja meg M és € függvényében azt az összefüggést, amely- 
lyel az együttes tanulással előállított eszköz hibája számítható, és számítsa ki 
M - 5, 10 és 20, illetve c — 0,1, 0,2 és 0,4 esetén! Ha feladjuk a függetlenségre 
vonatkozó feltételezést, akkor előfordulhat-e, hogy az együttes hibája rosszabb 
lesz, mint c? 


Ez a feladat a döntési listák kifejező erejével foglalkozik (lásd 18.5. alfejezet). 

(a) Mutassa meg, hogy egy döntési lista képes bármely Boole-függvény repre- 
zentálására, ha nem korlátozzuk a tesztek méretét! 

(b) Mutassa meg, hogy ha egy teszt legfeljebb X literálist tartalmazhat, akkor 
a döntési lista minden olyan függvény reprezentálására képes, amely egy 
k mélységű döntési fávat reprezentálható! 


19. A TUDÁS SZEREPE A TANULÁSBAN 


Ebben a fejezetben a tanulással foglalkozunk, de csak akkor, amikor már tudunk is 
valamit. 


Az előbbi három fejezetben bemutatott tanulási módszerek mindegyikében az volt az 
alapötlet, hogy egy olyan függvényt konstruálunk, amelynek bemeneti/kimeneti visel- 
kedése megegyezik azzal, amit az adatoknál megfigyeltünk. Bármilyen esetet is né- 
zünk, a tanulási módszer tulajdonképpen nem más, mint egy megfelelő függvénynek 
a hipotézistérben történő megkeresése, a függvény formájára vonatkozó igen elemi fel- 
tételezésekből kiindulva. Ilyen feltételezés lehet például, hogy a függvény , egy másod- 
rendű polinom?" vagy ,egy döntési fa", vagy az az elfogultság. hogy ,.az egyszerűbb 
a jobb". Ennek megvalósítása felért azzal, mintha azt mondanánk, hogy mielőtt valami 
újat tanulnánk, el kellene felejteni (majdnem) mindent, amit tudunk. Ebben a fejezet- 
ben olyan tanulási módszereket tanulmányozunk, amelyek a priori tudásból (prior 
knowledge) merítenek előnyöket. Az esetek többségében az a priori tudást elsőrendű 
elméletek segítségével reprezentáljuk. Így most először fogjuk összekapcsolni a tudás- 
reprezentációra és a tanulásra vonatkozó eredményeket. 


19.1. A TANULÁS LOGIKAI MEGFOGALMAZÁSA 


A 18. fejezetben a tisztán induktív tanulást olyan folyamatnak tekintettük, amely egy, 
az adatokkal konzisztens hipotézist keresett. Most ezt a definíciót olyan esetre ponto- 
sítjuk, amikor a hipotézist logikai állítások halmazával reprezentáljuk. A példaleírások 
és besorolások szintén logikai állítások, egy új példát pedig úgy tudunk osztályozni, 
hogy egy osztályozó állítást a hipotézisből és a példa leírásából kikövetkeztetünk. Ezzel 
a megközelítéssel a hipotéziseket inkrementálisan, állításonként építhetjük. A megkö- 
zelítés lehetővé teszi az a priori tudás használatát is. mivel a már megismert állításokat 
bevethetjük új példák osztályozásába. A tanulás logikai megfogalmazásában először lát- 
szólag sok a munka, ez azonban a tanulás számos aspektusát segíti tisztázni. Ez lehető- 
vé teszi, hogy a 18. fejezetben megismert egyszerű tanulási módszereket jócskán túlszár- 
nyaljuk azáltal, hogy a logikai következtetés teljes erejét tanulási célokra használjuk. 





Példák és hipotézisek 


Emlékezzünk a 18. fejezetben a tanulási problémára bemutatott étterem példára: egy 
olyan döntési szabály megtanulására, hogy vajon érdemes-e egy asztalra várni. A pél- 
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dákat olyan attribútumokkal (attributes) írtuk le, mint az Alternatíva, Bár, Pén- 
tek/Szombat stb. Logikai megközelítésben egy példa egy logikai állítással leírt objek- 
tum; az attribútumok pedig unáris predikátumok. Nevezzük általánosságban az i-edik 
példát X-nek. A 18.3. ábra első példáját az alábbi állítások írják le: 


Alternatíva(X)) A -BártXI) A -Péntek/ Szombat(XI) A ÉhestX fh Y se 


A DAX;) jelöléssel az X; leírására fogunk hivatkozni, ahol D;, tetszőleges. egyargumen- 
tumú logikai kifejezés lehet. Az objektumok osztályozását a 


VárjunkE(X) 


állítás végzi. Pozitív példák esetén a 0(X,), negatív példák esetén a -(XX;) általános je- 
lölést fogjuk használni. A teljes tanító halmaz az összes leíró és besoroló állítás 
konjunkciója. 

Logikai megközelítésben az induktív tanulás célja a 0 célpredikátummal ekvivalens 
logikai kifejezés megtalálása, amivel korrektül tudjuk a példákat osztályozni. Mind- 
egyik hipotézis egy-egy javaslat a keresett logikai kifejezésre, amit mi a célpredikátum 
definíciójelöltjének (candidate definition) nevezünk. Jelöljük C;-vel a definíciójelöltet, 
ekkor mindegyik H; hipotézis egy Vx 0(x) 5 CXx) formájú kifejezés. Például a dönté- 
si fa azt fejezi ki, hogy a célpredikátum egy objektum esetében csak akkor igaz, ha az 
igaz-hoz vezető egyik ága teljesül. Így a 18.6. ábrán látható döntési fa a következő lo- 
gikai definíciót fejezi ki (amelyre a jövőben H,-rel fogunk hivatkozni): 


Vr VárjunkE(r) 5 Vendégek(r, Néhány) 
Vv Vendégekír, Tele) A Éhes(r) A Konyhatr, Francia) 
V Vendégekír, Tele) A Éhes(r) A Konyha(r, Thai) 
A Péntek/ Szombat(r) 
V Vendégekír. Tele) A Éhes) A Konyha(r, Burger) (19. 


Mindegyik hipotézis azt jósolja meg, hogy példák egy bizonyos halmaza, nevezetesen 
azok, amelyek kielégítik a hipotézisdefiníció jelöltjét, a célpredikátumnak megfelelő 
példák lesznek. Ezt a halmazt a predikátum kiterjedésének (extension) nevezzük. Két 
különböző kiterjedéssel rendelkező hipotézis így logikailag ellentmondásban van egy- 
mással, hiszen legalább egy példa esetén eltérő eredményt jósolnak. Ha viszont azonos 
a kiterjedésük, akkor logikailag ekvivalensek. 

A H hipotézistér ezek után az összes olyan hipotézis (A, ..., H,,) halmaza, amelyek 
kezelésére a tanuló algoritmust tervezték. Például DÖNTÉSI-FA-TANULÁS algoritmus az 
adott attribútumokkal kialakítható összes döntési fa hipotézissel képes foglalkozni; így 
hipotézistere az összes döntési fát tartalmazza. Feltehetően a tanuló algoritmus hisz 
abban, hogy az egyik hipotézis korrekt, azaz hisz a 


HEV HIV HV... V Hy (19.2) 


logikai kifejezésben. Ahogy a példák érkeznek, a példákkal nem konzisztens (con- 
sistent) hipotéziseket ki lehet zárni. Vizsgáljuk meg alaposabban a konzisztencia ezen 
fogalmát. Nyilvánvaló, hogy ha a A; hipotézis a teljes tanító halmazzal konzisztens, 
akkor mindegyik példával konzisztensnek kell lennie. Mit jelent viszont az, hogy vala- 
melyik példával ellentmondásban van? Ez kétféle módon történhet meg: 
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" A hipotézis szempontjából egy példa hamis negatív (false negative), ha a valóságban po- 
zitív, de a hipotézis szerint negatív. Például a következő leírással rendelkező X 13 új példa: 


Vendégek(X13, Tele) A BecsültVárakozásEtXI3, 0-I0) A —Éhes(XI3) A ... A 
A VárjunkE(X3) 


a korábban definiált H, hipotézis számára hamis negatív példa lesz. /7,-ből, illetve a 
példa leírásából kikövetkeztethető mind a VárjunkE(X13) — ezt állítja a példa, mind 
a aVárjunkE(X13) — ezt állítja a hipotézis. Tehát a hipotézis és a példa logikailag el- 
lentmondásban van. 

s A hipotézis szempontjából egy példa hamis pozitív (false positive), ha a valóság- 
ban negatív, de a hipotézis szerint pozi. 





Ha egy példa hamis negatív vagy hamis pozitív egy hipotézis szempontjából, akkor 
a példa és a hipotézis logikailag ellentmondásban van egymással. Feltéve, hogy a pél- 
da a tények korrekt megfigyelésén alapul, a hipotézist kizárhatjuk. Logikailag ez a kö- 
vetkeztetés a rezolúciós szabállyal pontos analógiában van (lásd 9. fejezet). Hipotézi- 
sek diszjunkciója felel meg egy klóznak, a példa pedig megfelel annak a literálisnak, 
amely a klózban levő egyik literálissal rezolvál. Egy szokásos logikai következtető 
rendszer tehát elméletileg tud példákból tanulni oly módon, hogy egy vagy több hipo- 
tézist kizár. Tegyük fel például, hogy a példát az 7, állítással jelöljük, és a hipotézistér 
Hi v Ha v Hz V H4. Ha I ellentmondásban van H2-ve! és H3-mal, akkor a logikai 
következtető rendszer származtatni tudja az új H, V H4 hipotézisteret. 

Tehát az induktív tanulást logikai leírással olyan folyamatként jellemezhetjük, mint 
amelyik fokozatosan kizárja a példáknak ellentmondó hipotéziseket, leszűkítve a lehető- 
ségek körét. Mivel a hipotézistér rendszerint nagy (vagy elsőrendű logika esetén egye- 
nesen végtelen), nem javasoljuk egy rezolúcióalapú tételbizonyító rendszer építését és 
a hipotézistér teljes számbavételét. Ehelyett két megközelítést tárgyalunk, amelyek sokkal 
kisebb erőfeszítéssel logikailag ellentmondásmentes hipotéziseket képesek találni. 


A pillanatnyilag legjobb hipotézis keresése 


A pillanatnyilag legjobb hipotézis (current-best-hypothesis) keresési eljárás alapgon- 
dolata az, hogy egyetlen hipotézist vegyünk figyelembe, és ha új példa érkezik, akkor 
ennek figyelembevételével alakítsuk át a hipotézist annak érdekében, hogy az ellent- 
mondás-mentességet fenntartsuk. Az algoritmus alapját John Stuart Mill írta le (Mill. 
1843), de könnyen lehet, hogy már korábban megalkották. 

Tegyük fel, hogy van valamilyen hipotézisünk, például H,, amit már meglehetősen 
megkedveltünk. Amíg egy új példával sincs ellentmondásban, semmit sem kell tennünk. 
Aztán egyszer csak egy hamis negatív példa (X3) érkezik. Mit csináljunk? A 19.1. (a) 
ábra sematikusan úgy mutatja be H,-t, mint egy területet, a négyszögön belül minden H, 
kiterjedésébe tartozik. Az eddig látott példákat .,-t-" vagy ..—" jelöli, és látható, hogy H, 
jól sorolja be az összes példát, mint VárjunkE pozitív vagy negatív példáit. A 19.1. (b) 






1 Hamis pozitív" és hamis negatív" kifejezéseket először a gyógyításban használták arra, hogy a téves 
Taboratóriumi eredményeket jellemezzék. Egy eredmény akkor hamús pozitív, ha azt jelzi, hogy a páciens az 
adott betegségben szenved, míg valójában nem ez a helyzet. 
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19.1. ábra, (a) Egy konzisztens hipotézis. (b) Egy hamis negatív példa. (c) A hipotézist általánosítottuk. 
(d) Egy hamis pozitív példa. (e) A hipotézist szűkítettük. 


ábrán egy új — hamis negatív — példa jelenik meg (bekarikázva): a hipotézis azt állítja, hogy 
negatív, pedig valójában pozitív példa. A hipotézis kiterjedését növelni kell ahhoz, hogy 
tartalmazza ezt a példát is. Ezt a lépést általánosításnak (generalization) nevezzük: egy 
lehetséges általánosítás a 19.1. (c) ábrán látható. Ezután a 19.1. (d) ábrán egy hamis pozi- 
tív példát látunk: a hipotézis azt állítja, hogy pozitív, pedig valójában negatív. A hipotézis 
kiterjedését csökkenteni kell ahhoz, hogy kizárjuk ezt a példát. Ezt szűkítésnek (special- 
Ízation) nevezzük; a 19.1. (e) ábrán a hipotézis egy lehetséges szűkítését látjuk. 

Most már specifikálni tudjuk a 19.2. ábrán látható PILLANATNYILAG-LEGJOBB-TANULÁS 
algoritmusát. Vegyük észre, hogy valahányszor általánosítjuk vagy szűkítjük a hipotézist, 
ellenőriznünk kell az összes többi példára, hiszen nincs garancia arra, hogy a kiterjedés 
önkényes növelése/csökkentése elkerüli bármelyik másik negatív/pozitív példa befoglalá- 
sát/kirekesztését. 

Az általánosítást és a szűkítést úgy definiáltuk, mint olyan műveleteket, amelyek a 
hipotézis kiterjedését változtatják meg. Most pontosan meg kell határoznunk azt, hogy 
ezek a műveletek hogyan implementálhatók olyan színtaktikus műveletekként, amelyek 
a hipotézishoz rendelt definíciójelöltet úgy változtatják meg, hogy azt egy program végre 
tudja hajtani. Ehhez először ís vegyük észre, hogy az általánosítás és a szűkítés egyben 
hipotézisek közötti logikai relációk. Ha a C) definíciónak megfelelő Hy hipotézis a C; 
definíciónak megfelelő H. hipotézis általánosítása, akkor fenn kell állnia annak, hogy: 


Wx CC) — CI) 





function PILLANATNYILAG-LEGJOBB-TANULÁSÍpéldák) returns egy hipotézis. 


H — egy olyan hipotézis, amelyik a példák halmaz első példájával konzisztens 
for each a példák további példáira do 
if a H alapján e hamis pozitív then 
H — choose H olyan szűkítését, amely konzisztens a példák példáival 
else if a alapján e hamis negatív then 
H — choose H olyan általánosítását, amely konzisztens a példák példáival 
Íf ha nem található konzisztens szűkítésfáltalánosítás then fail 
return H 








19.2. ábra. A pillanatnyilag-legjobb-hipotézis tanuló algoritmus. Konzisztens hipotézist keres és Visz- 
szalép, ha nem található konzisztens szűkítés/általánosítás. 
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Tehát ahhoz, hogy a H) hipotézis általánosítását létrehozzuk, egyszerűen egy olyan Ci 
definíciót kell találnunk, amelyik logikailag következik C,-ből. Ezt könnyen megtehet- 
jük. Ha például CX(x) Altematíva(x) A Vendégek(x. Néhány), akkor egy általánosítási 
lehetőség a Cj(x) — Vendégek(x, Néhány). Ezt feltételek törlésének (dropping condi- 
tions) nevezzük. Felfoghatjuk úgy, hogy egy gyengébb definíció jön létre, így a pozitív 
példák nagyobb halmazát teszi lehetővé. Számos egyéb általánosítási eljárás is létezik, 
azon nyelvtől függően, amelyen a műveleteket végezzük. Hasonlóképpen, egy hipoté- 
zist szűkíteni tudunk, ha további feltételeket adunk a hozzá tartozó definíciójelölthöz, 
illetve ha eltávolítunk tagokat egy diszjunktív definícióból. Lássuk, hogyan működik ez 
az éttermi feladatban, 18.3. ábra adatait használva: 


s. Az első példa - XI — pozitív. Alternatíva(X 1) igaz, tehát vegyük fel a következő ki- 
induló hipotézist: 


Hy: Wx VárjunkE(x) 6 Alternatíva(x) 


s A második példa — X. — negatív. H, alapján pozitív lenne, így hamis pozitív. Ezért 
szűkítenünk kell H,-et. Ezt megtehetjük például úgy, hogy egy olyan további felté- 
telt adunk hozzá, amely feltétel kizárja X2-t. Egy lehetőség: 


Ho: Wx VárjunkE(x) 6 Alternatíva(x) A Vendégek(x. Néhány) 


s A harmadik példa — X3 — pozitív. H- alapján negatív lenne, így hamis negatív. Tehát 
általánosítanunk kell H2-t. Ezt elérhetjük, ha töröljük A/ternatíva feltételt, amely a 
következő hipotézisre vezet: 


Hz: Vx VárjunkE(x) £ Vendégektx, Néhány) 


s A negyedik példa — X4 — pozitív. 3 alapján negatív lenne, így hamis negatív. Így 
áÁltalánosítanunk kell H3-at. Nem törölhetjük Vendégek feltételt, mert ez egy mindent 
tartalmazó hipotézishez vezetne, ami ellentmondásban van X.-vel. Egyik lehetőség 
a következő diszjunkció bevezetése: 


Ha: Vx VárjunkE(x) 62 Vendégekíx, Néhány) 
V (Vendégekíx, Tele) A Péntek/ Szombat x)) 


A hipotézis ezek után már kezd ésszerűnek tűnni. Nyilvánvaló, hogy más lehetőségek 
is vannak, amelyek konzisztensek az első négy példával, kettő ezek közül: 


H4: Vx VárjunkEtx) 42 -BecsültVárakozásíx, 30-60) 


Há Vx VárjunkE(x) 5 Vendégekíx, Néhány) 
V (Vendégekíx, Tele) N BecsültVárakozásíx, 10-30) 


A PILLANATNYILAG-LEGJOBB-TANULÁS algoritmusát nem determinisztikusan írjuk le, 
mivel bármely ponton számos olyan szűkítési vagy általánosítási lehetőség lehet, 
melyek bármelyikét alkalmazhatjuk. A már meghozott döntések nem szükségszerűen 
vezetnek a legegyszerűbb hipotézishez, sőt olyan megoldhatatlan szituációhoz is vezet- 
hetnek, amelyben nincs a hipotézisnek olyan egyszerű módosítása, amely minden adat- 
tal konzisztens hipotézist állít elő. Ilyen esetekben a programnak egy előző választási 
ponthoz kell visszalépnie. 
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A PILLANATNYILAG-LEGJOBB-TANULÁS algoritmusát — és különböző változatait — 
számos gépi tanulást felhasználó rendszerben alkalmazták, először Patrick Winston 
(Winston, 1970) , ív-tanuló" programjában. Azonban ha a tér nagy, és nagyszámú pél- 
dával dolgozunk, akkor bizonyos nehézségek merülnek fel: 


1. Az összes előző példa újraellenőrzése minden egyes módosításnál nagyon munka- 
igényes. 

2. Nehéz jó keresési heurisztikát találni, és a visszalépések örökké tarthatnak. Mint a 
18. fejezetben már láttuk, a hipotézistér kétszeresen exponenciálisan nagy tér lehet. 





Legkisebb megkötés elvű keresés 


A visszalépésre azért van szükség, mert a , pillanatnyilag-legjobb-hipotézis" eljárásban 
választani kell egy legjobb becslést. egy partikuláris hipotézist, akkor is. ha még nincs 
elég adatunk ahhoz, hogy biztosak legyünk a választásunk helyességében. Ehelyett azt 
tehetjük, hogy az összes olyan és csak olyan hipotézist megtartjuk, amelyek az eddigi 
adatainkkal konzisztensek. Ezek után mindegyik új eset vagy nincs hatással, vagy kizár 
néhányat a hipotéziseink közül. Emlékezzünk arra, hogy a hipotézistér egy diszjunktív 
állításnak tekinthető: 


HEV HV HV. V.H, 


Ahogy egyre több hipotézis bizonyul a példákkal inkonzisztensnek, ez a diszjunktív 
állítás zsugorodik, csak azokat a hipotéziseket tartva meg, amelyeket nem szűrtünk ki. 
Feltéve, hogy az eredeti hipotézistér tartalmazza a helyes választ, a redukált diszjunktív 
állításnak is szükségszerűen tartalmaznia kell azt, hiszen csak inkorrekt hipotéziseket 
szűrtünk ki. A megmaradt hipotézisek halmazát nevezzük verziótérnek (version 
space). Az ilyen elven működő tanulási algoritmust (amelyet a 19.3. ábrán vázoltunk 
fel) verziótér tanulási algoritmusnak (más néven jelölteltávolítási — candidate elimi- 
nation — algoritmusnak) nevezzük. 

Fontos tulajdonsága ennek a megközelítésnek. hogy inkrementális: soha nem kell 
visszalépnünk és újravizsgálnunk a régi példákat. Az összes megmaradt hipotézis 
garantáltan konzisztens az összes példával. Másrészt legkisebb megkötés elvű (least 





function VERZIÓ-TÉR-TANULÁSÍpéldák) returns egy verziótér 
local variables: V, a verziótér; az összes hipotézis tere 


V — az összes hipotézis halmaza 
for each a példák összes e példájára do 

if V nem üres then VERZIÓ-TÉR-MÓDOSÍTÁS(V, e) 
return V 





function VERZIÓ-TÉR-MÓDOSÍTÁS(V. e) returns egy módosított verziótér 
V.— (ht V: h konzisztens e-vel) 








19.3. ábra. Verziótér tanuló algoritmus. V-nek olyan részhalmazát tanulja meg, amelynek elemei a pél- 
dákkal konzisztensek. 
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Itt minden inkonzisztens 
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19.4. ábra. A verziótér a példákkal konzisztens összes hipotézist tartalmazza 





commitment) algoritmusnak is nevezhetjük, ugyanis nem tesz önkényes választásokat 
(vö. a II. fejezetben található részben rendezett tervkészítő algoritmussal). Van viszont 
egy nyilvánvaló probléma. Már leszögeztük, hogy a hipotézistér óriási, hogyan tudjuk 
akkor leírni ezt az óriási diszjunktív állítást? 

A következő egyszerű analógia sokat segít a megértésben. Hogyan ábrázoljuk az ösz- 
szes IL és 2 közé eső valós számot? Végül is végtelen sok ilyen van! A megoldás az 
intervallumábrázolás, amelyik csak a halmaz határait specifikálja: (1, 2]. Ez azért 
működik, mert a valós számok felett értelmezett egy rendezés. 

A hipotézistér felett is rendelkezünk rendezéssel, nevezetesen az általánosítás/szűkítés 
alapján. Ez egy részleges rendezés, ami azt jelenti, hogy a határ nem egy pont, hanem a 
hipotézisek egy halmaza: a határhalmaz (boundary set). A nagyszerű a dologban az, 
hogy a teljes verziótér reprezentálható csupán két batárhalmaz: egy legáltalánosabb határ- 
halmaz (a G halmaz) és egy legszűkebb határhalmaz (az S halmaz) segítségével. E ket- 
tő közé eső bármely hipotézis garantáltan konzisztens az összes példával. Mielőtt ezt 
bizonyítjuk, röviden foglaljuk össze az eddigieket: 


s A jelenlegi verziótér azon hipotézisek halmaza, amelyek az összes eddigi példával 
konzisztensek. Ezt az $ halmaz és a G halmaz segítségével ábrázoljuk, mindkettő a 
hipotézisek valamilyen halmaza. 

s Az halmaz összes eleme konzisztens az összes eddigi megfigyeléssel, és nincs 
ennél szűkebb konzisztens hipotézis. 

s A G halmaz összes eleme konzisztens az összes eddigi megfigyeléssel, és nincs 
ennél általánosabb konzisztens hipotézis. 
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Azt kívánjuk meg, hogy a kezdeti tér (mielőtt bármelyik példát megvizsgáltuk volna), 
az összes elképzelhető hipotézist tartalmazza. Ezt úgy biztosítjuk, hogy a G halmazt 
egyszerűen az Igaz értékre állítjuk (az a hipotézis, amely mindent tartalmaz), az $ hal- 
mazt pedig egyszerűen a Hamis értékre állítjuk (az a hipotézis, amelynek kiterjedése 
üres). 

A 19.4. ábra a verziótér határhalmazokkal való ábrázolásának általános struktúráját 
mutatja. Ahhoz, hogy megmutassuk, hogy ez az ábrázolás elégséges, két tulajdonságra 
van szükségünk: 


1. Mindegyik konzisztens hipotézis (amelyik nem valamelyik határhalmaz eleme) szű- 
kebb. mint a G halmaz valamelyik eleme, és általánosabb, mint az S halmaz valame- 
lyik eleme. (Azaz nincsenek kívül , kóbor" elemek.) Ez közvetlenül következik az § és 
G definíciójából. Ha lenne egy kóbor A, akkor az vagy nem lehetne szűkebb G valamely 
eleménél, tehát G-hez kellene tartoznia, vagy nem lehetne általánosabb S valamely ele- 
ménél, ebben az esetben viszont 5-hez tartozna. 

2. Mindegyik hipotézis, amelyik szűkebb a G halmaz valamely eleménél, és általáno- 
sabb az S halmaz valamely eleménél, konzisztens hipotézis (azaz a határok között 
nincsenek , lyukak"). Bármely - az S és G közé eső — h-nak az összes olyan negatív 
példát vissza kell utasítania, amelyet G minden egyes tagja visszautasít (mivel szű- 
kebb), ugyanakkor el kell fogadnia az összes pozitív példát, amelyet az S akármelyik 
tagja elfogad (mivel általánosabb). Így A az összes példát jól kezeli, tehát nem lehet 
inkonzisztens. A 19.5. ábra mutatja be a helyzetet: nincs ismert példa, amely §-en 
kívül, de G-n belül helyezkedik el, így a kettő közt elhelyezkedő összes hipotézis- 
nek konzisztensnek kell lennie. 





19.5. ábra. A G és az S elemeinek kiterjesztései. A kettő között nemn található ismert példa. 


Bemutattuk tehát, hogy ha S-t és G-t definíciójuknak megfelelően kezeljük, akkor a 
verziótér kielégítő leírását adják. Az egyetlen hátralévő probléma, hogy hogyan módo- 
sítsuk §-t és G-t egy új példa esetén (a VERZIÓ-TÉR-MÓDOSÍTÁS függvény feladata). El- 
sőre ez meglehetősen bonyolultnak tűnik, de a definíciók és a 19.4. ábra alapján nem 
túl nehéz az algoritmus előállítása. 

Az 5 és G halmazok S; és G; elemeivel kell foglalkoznunk. Az új példa bármelyik 
esetén lehet hamis pozitív vagy hamis negatív. 
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1. §;-re hamis pozitív. Azt jelenti, hogy S; túl általános, de mivel S;-nek (a definíciója 
értelmében) nincs konzisztens szűkítése, így 5;-t eltávolítjuk az S halmazból. 

2. Sre hamis negatív. Azt jelenti, hogy S; túl szűk, így S-t az összes közvetlen általá- 
nosításával helyettesítjük, feltéve, hogy ezek szűkebbek, mint G egyes elemei. 

3. Gyre hamis pozitív. Azt jelenti, hogy G; túl általános, így az összes közvetlen szű- 
kítésével helyettesítjük, feltéve, hogy ezek általánosabbak, mint S egyes elemei. 

4. G;-re hamis negatív. Azt jelenti, hogy G; túl szűk, de mivel nincs konzisztens álta- 
lánosítása (definíciója értelmében), így G;-t eltávolítjuk a G halmazból. 


Ezeket a műveleteket minden új példára elvégezzük addig, amíg az alábbi három eset 
valamelyike fel nem lép: 


1. Pontosan egy hipotézis marad a verziótérben, ebben az esetben ezt adjuk vissza mint 
az egyetlen hipotézist. 

2. A verziótér összeomlik - vagy S, vagy G üressé válik, azt jelezve, hogy nincs a tanító 
halmazra nézve konzisztens hipotézis. Ez megegyezik az egyszerű döntési fa algo- 
ritmus sikertelen kimenetelével. 

3. Kifogyunk a példákból, miközben számos hipotézis maradt a verziótérben. Ez azt je- 
lenti, hogy a verziótér a hipotézisek diszjunkcióját reprezentálja. Ha egy új példa 
esetén a diszjunkció összes tagjában azonos eredményt kapunk, akkor ezt adhatjuk 
vissza mint a példa besorolását. Ha az eredmények nem egyeznek meg, akkor egyik 
lehetőségként alkalmazhatjuk a többségi szavazást. 


Gyakorlás céljára hagyjuk a VERZIÓ-TÉR-TANULÁS algoritmusnak az éttermi adatokra 
való alkalmazását. 
A verziótér megközelítésnek két alapvető hátránya van: 


s Ha a problématerület adatai zajt tartalmaznak, vagy ha az attribútumok a pontos 
besoroláshoz nem elégségesek, akkor a verziótér mindig összeomlik. 

Ha korlátlan méretű diszjunkciót megengedünk a hipotézistérben, akkor az S halmaz 
mindig tartalmazni fog egy egyedi legszűkebb hipotézist, nevezetesen az összes 
eddig látott pozitív példa diszjunkcióját. Hasonlóképpen a G halmaz tartalmazni 
fogja a negatív példák diszjunkciójának negáltját. 

Egyes hipotézistereknél az S- és a G-beli elemek száma az attribútumok számában 
exponenciálisan növekedhet annak ellenére, hogy az ilyen hipotézisterekhez ismer- 
tek hatékony tanuló algoritmusok. 


. 


A zaj problémájára napjainkig nem ismert teljes. sikeres megoldás. A diszjunktív kap- 
csolatok problémája kezelhető oly módon, hogy csak korlátozott méretű diszjunktív 
formákat engedünk meg, vagy az általánosabb predikátumokra egy általánosítási hie- 
rarchiát (generalization hierarchy) vezetünk be. Például a BecsültVárakozás(x, 30-60) 
v BecsültVárakozástx, 560) helyett használhatjuk a HosszúVárakozásíx) literált. Az ál- 
talánosítási és a szűkítési műveletek egyszerűen kiterjeszthetők ennek kezelésére. 

A verziótér algoritmus tiszta változatát először a Meta-DENDRAL rendszerben alkal- 
mazták. Ezt a rendszert olyan szabályok megtanulására tervezték, amelyek azt ítják le, 
hogy egy tömegspektrométerben a molekulák hogyan esnek szét darabokra (Buchanan 
és Mitchell, 1978). A Meta-DENDRAL képes volt olyan szabályok generálására. amelyek 
elég újak voltak egy analitikus kémiával foglalkozó újságban való publikálhatósághoz. 
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Ezek voltak az első - egy számítógépes program által felfedezett — valós tudományos 
eredmények. Az algoritmust az elegáns LEx rendszerben (Mitchell és társai, 1983) szin- 
tén használták, ez a rendszer saját sikereinek és kudarcainak tanulmányozása alapján 
szimbolikus integrálási problémák megoldásának megtanulására volt képes. Bár a ver- 
Ziótér-módszerek valószínűleg a legtöbb valós probléma tanulása esetén - főleg a zaj 
miatt — nem praktikusak, jó betekintést adnak a hipotézistér logikai szerkezetébe. 
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Az előbbi részben az induktív tanulás egyszerű sémájával foglalkoztunk. Ahhoz, hogy 
a háttértudás szerepét megérthessük, beszélnünk kell a hipotézisek, a példaleírások és a 
besorolások közötti kapcsolatról. Jelölje a Leírások az összes példaleírás konjunkcióját 
és a Besorolások a példabesorolások konjunkcióját. A , megfigyelést megmagyarázó" 
Hipotézis-nek akkor a következő tulajdonsággal kell rendelkeznie (emlékezzünk, hogy 
a jelentése a , logikailag maga után vonz"): 


Hipotézis A Leírások F Besorolások (19.53) 


Az ilyen kapcsolatot, ahol a Hipotézis az , ismeretlen", vonzatkényszernek (entail- 
ment constraint) nevezzük. Ennek a kényszernek a megoldása a tiszta induktív 
tanulás, amikor a Hipotézis-t valamilyen előre definiált hipotézistérből vesszük. Ha 
például a döntési fát logikai formulának tekintjük (lásd 783. oldal (19.1) képlet), 
akkor egy döntési fa, amely az összes példával konzisztens, kielégíti a (19.3) képle- 
tet. Természetesen abban az esetben, ha a hipotézisek logikai formáját semmiben nert 
korlátozzuk, a Hipotézis — Besorolások szintén teljesíti a kényszert. Általában az 
Ockham borotvája elve azt sugallja, hogy kis konzisztens hipotéziseket kellene előny- 
ben részesíteni, valami jobbat kell tehát kitalálnunk annál. minthogy csupán a példá- 
kat memorizáljuk. 

Az induktív tanulás ezen egyszerű képe az 1980-as évek elejéig uralkodott. A korsze- 
rű megközelítés az, hogy olyan ágenseket tervezünk, amelyek már tudnak valamit, és HE! 
amelyek igyekeznek, hogy még többet tudjanak. Lehet, hogy ez nem tűnik félelmetesen 
mély gondolatnak, azonban igen nagy különbséget jelent, ha az ágensek tervezését 
tekintjük. Sőt az is lehet, hogy ez a megközelítés valamilyen mértékben hozzájárul an- 
nak megértéséhez, hogy a tudomány maga hogyan működik. Az általános séma a 19.6. 


ábrán látható. 
Háttértudás 


Tudásal: 
Megfigyelések induktív t: amul 








Hipotézisek —— im Jóslások 














19.6. ábra, A kumulatív tanulási folyamat felhasználja és idővel folyamatosan bővíti a háttértudás készletét 
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Amennyiben egy háttértudást felhasználó autonóm tanuló ágenst szeretnénk felépíteni, 
az ágensnek legelőször valamilyen módszerrel meg kell szereznie a háttértudást, hogy 
utána azt az új tanulási epizódokban felhasználhassa. E módszernek önmagában is egy 
tanulási folyamatnak kell lennie. Az ágens életútját így kumulatív vagy inkrementális 
fejlődés jellemzi. Az ágens feltételezhetően a semmiből kezdhet, egy jó kis induktív 
program mintájára. Ha egyszer azonban evett már a Tudás Fájából, többé ilyen naiv 
spekulációra nem adhatja a fejét, és a háttértudást a minél hatásosabb tanulásra kell 
fordítania. A kérdés most az, hogyan tudjuk ezt megvalósítani. 


Néhány egyszerű példa 


Nézzünk néhány ,józan ész" példát a háttértudás felhasználásával történő tanulásra. 
Sok, a következtetésen alapuló, látszólag racionális viselkedésről ki fog derülni, hogy 
ha a megfigyeléseket is figyelembe kell venni, nyilvánvaló lesz, hogy az ágens nem 
a tiszta indukció egyszerű elvét követi. 


s Néha az általános konklúziót már egyetlenegy megfigyelés alapján megfogalmaz- 
hatjuk. Gary Larson egy karikatúrájában Zog, a szemüveges ősember egy fanyárs 
végére tűzött gyíkot süt a tűz felett. Kevésbé intelligens barlangtársainak bámulatba 
ejtett csoportja figyeli: ők az ennivalót a tűz felett csupasz kezükben tartják. Ez a 
megvilágosító tapasztalat elegendő, hogy a csoport tagjai a fájdalommentes főzés 
elvét elsajátítsák. 

". Vagy vegyük például a Brazíliába érkező utazó esetét, amikor is az első brazil 
bennszülöttel találkozik. Hallván, hogy az portugálul beszél, utazónk egyből meg- 
állapítja, hogy Brazíliában mindenki beszél portugálul, felfedezvén azonban, hogy 
a bennszülöttet Fernandónak hívják, ezt a felfedezését az összes brazil férfira egy- 
általán nem terjeszti ki. Hasonló esetek a tudományra is jellemzők. Amikor például 
egy kezdő fizikushalligató egy adott hőmérsékletű rézmintának a sűrűségét és az 
elektromos vezetőképességét méri, a mérési eredményeket magabiztosan általáno- 
sítja a réz minden lehetséges darabkájára. Ha azonban a minta tömegét méri, meg 
sem fordul a fejében, hogy más rézdarabkáknak is ez lenne a tömege. Ez az álta- 
lánosító feltevés viszont egészen értelmes lenne, ha például az amerikai 1 centes 
érmékről lenne szó. 

e Végül vegyük egy gyógykezelésben járatlan, diagnosztikai szempontból azonban 
képzett orvostanhallgató esetét, aki egy páciens és egy szakértő belgyógyász kon- 
zultációját figyeli. Egy sor kérdés és felelet után a szakértő egy bizonyos anti- 
biorikumos gyógykezelést ír elő a páciens részére. A hallgatónk azt az általános 
szabályt fogalmazza meg, hogy ez a konkrét antibiotikum hatásos erre a konkrét 
típusú fertőzésre. 


Ezek mind olyan esetek, amikor au háttértudás felhasználása sokkal gyorsabb tanulást 
tesz lehetővé ahhoz képest, mint amit a tisztán induktív programtól el lehetne várni. 
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Néhány általános séma 


Az előző példákban azért fordulunk a háttértudáshoz, hogy a megválasztott általánosítást 
megpróbáljuk igazolni. Most azt nézzük meg, mik azok a vonzatkényszerek, amelyek ott 
rejtőznek. A kényszerek a Hipotézis-en, a megfigyelt Leírások-on és a Besorolások-on 
kívül a Háttértudás-ra is kiterjednek. 

A gyíksütés esetén az ősemberek úgy általánosítottak, hogy megmagyarázták a nyárs 
sikerét: a nyárs megtartja a gyíkot a tűz felett, miközben a kéz sértetlen marad. Ebből a 
magyarázatból azt az általános szabályt vonhatják le, hogy egy hosszú, merev, hegyes 
objektum alkalmas a kis, puha testű, ehető dolgok sütéséhez. Az ilyen általánosító folya- 
matot magyarázatalapú tanulásnak vagy MAT-nak (explanation-based learning, 
EBL) nevezzük. Figyeljük meg, hogy az általános szabály az ősemberek birtokában 
lévő háttértudásból logikai módon következik. A MAT által teljesített vonzatkényszerek 
tehát a követezők: 


Hipotézis A Leírások F Besorolások 
Háttértudás H Hipotézis 


Az első kényszer a (19.3) képlettel megegyezik, azért a MAT-ot eredetileg a példákból 
való tanulás jobb módszerének tekintették. Azonban amiatt, hogy a háttértudásnak ele- 
gendőnek kell lennie a Hipotézis megmagyarázásához is, ami viszont a megfigyelést 
magyarázza meg, a megfigyelt esetből az ágens igazából semmi tényszerűen újat nem 
tanul. Az ágens a példát akár ki is következtethette volna az ismert tudásanyag alapján, 
bár elképzelhető, hogy ez elfogadhatatlan mennyiségű számítással járt volna együtt. 
Újabban a MAT-ot úgy tekintik, mint az egyik olyan módszert, amely elsődleges elmé- 
leteknek speciális célú tudásba való konvertálását végzi. A MAT algoritmussal a 19.3. 
alfejezetben foglalkozunk. 

A Brazíliába utazónak egészen más a helyzete. Az utas szükségszerűen nem is képes 
megmagyarázni, hogy Fernando miért beszél úgy, ahogy beszél, amíg az idevágó pápai 
bullákat nem ismeri. Az általánosításra azonban képes lesz a történelemben teljesen 
járatlan utas is. Ebben az esetben a releváns háttértudás az, hogy minden egyes ország- 
ban az emberek többsége ugyanazt a nyelvet beszéli. Azt azonban nem tételezzük fel, 
hogy minden brazil embert Fernandónak hívnak, mert az effajta szabályosság a nevekre 
nem vonatkozik. Hasonlóképpen, az elsőéves fizikushallgató is nehezen tud magya- 
rázatot adni a réznél felfedezett vezetési és sűrűségi értékekre. Azt azonban tudja, hogy 
a vezetést az objektum anyaga és annak hőmérséklete határozza meg együttesen. Mind- 
egyik esetben az a priori Háttértudás szerepe az, hogy a célpredikátum szempontjából 
releváns tulajdonsághalmazok körülhatárolhatók legyenek. Ez a tudás megfigyelések- 
kel együtt lehetővé teszi, hogy az ágens új, általános szabályt hozzon létre megfigyelé- 
seinek megmagyarázására: 


Hipotézis A Leírások F Besorolások 
Háttertudás N Leírások A Besorolások F Hipotézis (19.4) 


Ezt a fajta általánosítást relevanciaalapú tanulásnak vagy RAT-nak (relevance-based 
learning, RBL) nevezzük (bár ez az elnevezés még nem mondható teljesen elfogadott- 
nak). Vegyük észre, hogy annak ellenére, hogy a RAT a megfigyelések tartalmát fel- 
használja, a megfigyelések és a háttértudás logikai tartalmán túlmutató hipotéziseket 


794 19. A TUDÁS SZEREPE A TANULÁSBAN 


nem eredményez. Ez a tanulás egy deduktív formája, és egymagában nem lehet felelős 
új tudásanyagnak az alapokból való létrehozásáért. 

A szakértőt figyelő orvostanhallgató esetében feltételezzük, hogy a hallgató előzetes 
tudása elegendő ahhoz, hogy a páciens D betegségét a tünetekből megállapítsa. Ez 
azonban nem elegendő annak indoklására, hogy az orvos miért éppen az M orvosságot 
írta fel. A hallgatónak egy másik szabályt kell javasolnia, azaz, hogy az M orvosság a 
D-vel szemben hatásos. Ezzel a szabállyal és a hallgató előzetes tudásával most már ké- 
pes magyarázatot adni, hogy az orvos ebben a konkrét esetben miért az M gyógyszert 
írja fel. A példát általánosíthatjuk egy vonzatkényszer megadásával: 


Háttértudás A Hipotézis A Leírások F Besorolások (19.5) 


Példák magyarázatát tehát a háttértudás és az új hipotézis együttesen adja meg. 
A tisztán induktív tanuláshoz hasonlóan a tanuló algoritmusnak a lehető legegyszerűbb 
és a kényszerekkel konzisztens hipotéziseket kellene előállítania. A (19.5) kényszert 
teljesítő algoritmusokat tudásalapú induktív tanulásnak vagy TIT-nek (knowledge- 
based inductive learning, KBIL) nevezzük. 

A 19.5. alfejezetben részletesen leírt TIT algoritmusokat főleg az induktív logikai 
programozás, ILP (inductive logical programming) területén tanulmányozták. 
Az előzetes tudásnak egy ILP-rendszerben két kulcsszerepe van a tanulás komplexitá- 
sának csökkentésében: 


1. Tekintettel arra, hogy a megfogalmazott hipotézisek mindegyikének konzisztensnek 
kell lennie a megfigyelésekkel és az előzetes tudással is, ténylegesen egy redukált 
hipotézistérrel van dolgunk, hiszen ez a hipotézistér csakis azokat az elméleteket 
tartalmazza, amelyek az eddig ismert dolgokkal konzisztensek. 

2. Bármilyen adott megfigyeléshalmaz esetén a megfigyelések magyarázatát megadó 
hipotézis lényegesen redukált méretű lehet, hiszen a megfigyeléseket magyarázó új 
szabályok meghatározásához az előzetes tudás is rendelkezésünkre áll. Viszont minél 
kisebb a hipotézis, annál könnyebb azt megtalálni. 


Az a priori tudás befogadásán túl, az ILP-rendszerek képesek arra, hogy hipotéziseket 
általános elsőrendű logikában és nem a 18. fejezetben használt, korlátozott attribútumalapú 
nyelven fogalmazzák meg. Ez azt is jelenti, hogy az ILP-rendszerek képesek olyan környe- 
zetekben tanulni, amelyek érthetetlenek az egyszerűbb rendszerek számára. 


19.3. MAGYARÁZATALAPÚ TANULÁS 


Ahogy a fejezet bevezetőjében elmagyaráztuk, a magyarázatalapú tanulás olyan mód- 
szer. ami megfigyelésekből általános szabályokat nyer ki. Tekintsük például az algeb- 
rai kifejezések egyszerűsítését és differenciálását (lásd 9.15. feladat). X2-et X szerint 
differenciálva 2X-et kapunk (vegyük észre, hogy az aritmetikai ismeretlent nagy X 
betűvel jelöljük az x logikai változótól megkülönböztetve). Egy logikai következtető 
rendszerben a célt így a KÉRDEZ(DeriválX", X) — d, TB) kifejezéssel fejezhetjük ki, 
ahol a megoldás a d — 2X. 

Bárki, aki a differenciálszámítást ismeri, a megoldást , ránézésre" tudja. Az ilyen 
problémákkal első alkalommal találkozó hallgatónak vagy netán a tapasztalatot nélkü- 
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löző programnak sokkal nehezebb lesz a dolga. A differenciálás közismert szabályai 
segítségével a kifejezést előbb-utóbb az 1 x (2 x (XC-I) alakra lehet hozni, és ez 
előbb-utóbb elvezet minket a 2X-hez. A szerzők logikai programjának ez 136 bizonyí- 
tási lépésbe került, amiből 99 lépés a bizonyítás zsákutca elágazásaira esett. Ezt tapasz- 
talva azt szeretnénk, ha a program ugyanennek a problémának a megoldását a követke- 
ző alkalommal lényegesen gyorsabban adná meg. 

A memoizálás (memoization) módszerét a számítógép-tudományban régóta alkalmaz- 
zák, miszerint a számítások meggyorsíthatók az eredmények eltárolása révén. A memo- 
függvény alapgondolata, hogy bemenet/kimenet párokat gyűjtünk ki egy külön adatbázis- 
ba. Meghíváskor a függvény először megvizsgálja az adatbázist, hátha a probléma teljes 
újbóli megoldását így meg tudja kerülni. A magyarázatalapú tanulás ezt az ötletet to- 
vábbfejleszti úgy, hogy egy általános szabályt fogalmaz meg, amely az esetek egész osz- 
tályát képes lefedni. A differenciálás esetében a memoizálás emlékezne ugyan arra, hogy 
az X-nek X szerinti deriváltja 2X, a Z? Z szerinti deriváltjának kiszámítását azonban tel- 
jes egészében az ágensre hagyná. Célszerű lenne, ha egy olyan általános szabály? tud- 
nánk megfogalmazni, amely minden lehetséges t aritmetikai ismeretlen esetén megadná, 
hogy az w2-nek w szerint deriváltja 2. A logikában ezt az alábbi szabállyal fejezhetjük ki: 


Aritmetikailsmeretlentu) — Deriváltíu?, u) — 24 


Ha a tudásbázis rendelkezik egy ilyen szabállyal, akkor minden új eset, ami a szabály 
egy példánya, azonnal megoldható. 

Természetesen ez csupán egy triviális példa egy igen általános jelenségre. Ha egy- 
szer megértettünk valamit, azt általánosítva más körülmények között ís felhasználhat- 
juk. Egy , nyilvánvaló" megoldási lépést kapunk, amely építőkockaként felhasználható 
bonyolultabb problémák megoldásában. Alfred North Whitehead, aki Bertrand Russell- 
lel együtt a Principia Mathematica társszerzője — talán a Zog felfedezése jellegű esermé- 
nyek megértéséhez saját magára alkalmazva a MAT elvét — azt írta, hogy ,,A civilizá- 
ció azáltal halad előre, hogy szaporítja azoknak a fontos cselekvéseknek a számát, 
amelyeket gondolkodás nélkül véghezvihetünk" (Whitehead, 1911). Ha ön, kedves olvasó, 
a deriválási példa lényegét megértette, akkor az agya már buzgón azon dolgozik, hogy 
megkísérelje a magyarázatalapú tanulás általános elvét kinyerni ebből a példából. Figyel- 
je meg, hogy hacsak nem lényegesen okosabb a szerzőknél, a magyarázatalapú példa 
bemutatása előtt még nem ismerte fel a MAT-ot. A Zogot figyelő ősemberekhez hason- 
lóan önnek (és nekünk is) egy példát kellett látnunk, mielőtt az alapelvet meg tudtuk 
fogalmazni. Ez azért van így. mert megmagyarázni, hogy miért jó egy ötlet, sokkal 
könnyebb, mint magát az ötletet megfogalmazni. 





Általános szabályok kinyerése példákból 


A MAT alapötlete az, hogy először az előzetes tudásra alapozva megkonstruáljuk a meg- 
figyelés magyarázatát. majd meghatározzuk annak az esetosztálynak a definícióját, 
amelyre a megkonstruált magyarázat alkalmazható. A definíció alapul szolgál az osz- 


2 Természetesen az 1? általános szabályát is meg tudnánk valósítani, a mondanivalót azonban a közölt példa 
is jól illusztrálja. 
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tály eseteit lefedő szabály számára. A , magyarázat" lehet egy logikai bizonyítás, de 
általánosságban lehet akármilyen következtetési vagy problémamegoldó folyamat, fel- 
téve, hogy a lépései jól definiáltak. Kulcsfontosságú azoknak a szükséges feltételeknek 
az azonosítása, amelyek révén az egyes lépések más esetre is alkalmazhatók lesznek. 

Következtető rendszerként a 9. fejezetben leírt egyszerű, hátrahaladó tételbizonyító 
rendszert fogjuk használni. A DeriválX?, X) — 2X bizonyítási fája túlságosan nagy 
ahhoz, hogy példaként szerepeljen, ezért az általánosítás módszertanát egy valamivel 
egyszerűbb példával fogjuk illusztrálni. Tegyük fel, hogy az 1 x (0 4- X) kifejezést 
akarjuk egyszerűsíteni. A tudásbázis az alábbi szabályokat tartalmazza: 


Átírásíu, v) A Egyszerűsítésív, w) — Egyszerűsítésíu. w) 
PrimitíWu) 5 Egyszerűsítésíu, u) 
Aritmetikailsmeretleníu) — Primitív(i) 

Szám(i) — Primitívíu) 

Átírás(1 x u, 4) 

Átírás(0 -k u, 4) 


Annak bizonyítása, hogy a válasz X, a 19.7. ábra felső részében látható. A MAT- 
módszer egyidőben két bizonyítási fát konstruál. A második bizonyítási fa a szabad 
változókkal rendelkező célt használja, ahol az eredeti cél konstansait változókkal he- 
lyettesítettük. Ahogy az eredeti bizonyítás halad előre, úgy halad a szabad változós 
bizonyítás is, pontosan ugyanazokat a szabályokat alkalmazva. Lehetséges, hogy né- 
hány változót közben le kell kötni. Ahhoz, hogy az Átírás(1 x u, u) szabályt használ- 
hassuk, az Átírásí(x x (0 -t 2), v) részcél x változóját 1-re kell lekötni. Hasonlóképpen 
az Átírásíy 4 z, v") részcél y változóját 0-ra keli lekötni, ha az Árírás(0 -- u, u) szabályt 
szeretnénk alkalmazni. Az általánosított bizonyítási fa birtokában a levelekből (a szük- 
séges kötéseket figyelembe véve) a célpredikátum általános szabályát képezzük: 


Átírás(1 x (0 4 2), 0 -- 2) A Átírás(0 -k z, 2) A Aritmetikailsmeretlení2) 
5 Egyszerűsítés(i x (0-4 2), 2) 


Vegyük észre, hogy a bal oldal első két feltétele igaz függetlenül attól, hogy z-nek mi 
az értéke. Így ezeket kihagyhatjuk a szabályból, és eredményül azt kapjuk, hogy: 


Aritmetikailsmeretleníz) 5 Egyszerűsítés(i x (0 -t 2), 2) 


Általánosságban elmondható, hogy a végleges szabályból azok a feltételek hagyhatók 
ki, amelyek nem jelentenek kényszert a szabály jobb oldalán lévő változókra vonat- 
kozólag. Az eredményül kapott szabály továbbra is igaz, sőt még hatékonyabb is lesz. 
Vegyük észre azt is, hogy az Aritmetikailsmeretlen(z) feltétel nem hagyható ki, hiszen 
a z-nek nem minden lehetséges értéke aritmeti ismeretlen. A z más jellegű értékei ese- 
tén feltehetően más egyszerűsítési szabályokat kellene alkalmazni — például ha z netán 
2 x 3 lenne, akkor az b x(0-(2 x3)) helyes egyszerűsítése 6, és nem 2 x 3 lenne. 
Összegezve, az alap MAT-módszer a következőképpen működik: 


1. Ha adott egy példa, a rendelkezésre álló háttértudást felhasználva konstruáljunk egy 
bizonyítást arra, hogy a célpredikátum érvényes a példára. 
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2. Az előbbivel egy időben az eredeti bizonyítás következtetési lépéseivel azonos lépése- 
ket alkalmazva konstruáljuk meg a szabad változós cél általánosított bizonyítási fáját. 

3. Konstruáljuk meg az új szabályt úgy, hogy a szabály bal oldala a fa leveleiből áll. 
a jobb oldala viszont a szabad változós cél (az általánosított bizonyítás változóköté- 
seit figyelembe véve). 

4. Hagyjuk ki azokat a feltételeket, amelyek a célban foglalt változók értékeitől nem 
függnek. 











Egyszerűsítéstl x (03-XOw) 
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Igen, (y/0.v/z) 


Egyszerűsítésízay 
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Aritmetikailsmeretteníz) 


Igen,( ) 


19.7. ábra. Az egyszerűsítési probléma bizonyítási fái. Az első fa az eredeti problémapéldány bizonyí- 
tása, amiből az Aritmetikailsmeretleníz) - Egyszerűsítésti x (0 -k z), 2) vezethető le. A második fa az 
a bizonyítás, amikor az eredeti problémapéldányban szereplő összes konstanst változókkal helyettesítet- 
tük, amiből viszont további szabályok sokaságát vezethetjük le. 













A hatékonyság javítása 


A 19.7. ábrán látható általánosított bizonyítási fából több általánosított szabályt ís ké- 

pesek vagyunk kinyerni. Ha a fa jobb oldali ágának növekedését leállítjuk, vagy az ágat 

lemetsszük (prune), amikor Primitív lépéshez jutottunk, az alábbi szabályt kapjuk: 
Primitívíz) - Egyszerűsítés(i x (0-2), 2) 


Ez a szabály annyira érvényes, mint az Aritmetikailsmeretlen-t felhasználó szabály, bár 
annál általánosabb, mivel olyan esetekre is vonatkozik, amikor z numerikus értékű. 
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Még általánosabb szabályokat is kinyerhetünk, ha az Egyszerűsítésíy -t z, w) után met- 
szünk. Ekkor a szabály: 


Egyszerűsítésíy -t z, w) 2 Egyszerűsítés(i x (y-t 2). w 


Általánosságban elmondható, hogy szabályokat az általánosított bizonyítási fa bármely 
részfájából nyerhetünk. Szembe kell néznünk azonban azzal a problémával, hogy ezek 
után melyik szabályt válasszuk. 

Az a döntés, hogy melyik szabályt érdemes létrehozni, végső soron a hatékonyságon 
múlik. A MAT által biztosított hatékonyságnövekedésnek három tényezője van: 


1. A tudásbázishoz nagyszámú szabály hozzáadása a következtetési folyamatot lelas- 
síthatja, mivel a következtetési mechanizmusnak ezeket a szabályokat akkor is meg 
kell vizsgálnia, amikor ezek nem járulnak hozzá a megoldáshoz. Másképpen fogal- 
mazva, a keresési tér elágazási tényezője (branching factor) ilyenkor növekszik. 

2. Ahhoz, hogy ezt a jelenséget kompenzáljuk, a létrehozott szabályoknak lényeges 
sebességnövekedést kell garantálniuk az általuk lefedett problémapéldányok eseté- 
ben. Az ilyen sebességnövekedés főleg abból származik, hogy a származtatott sza- 
bályok révén elkerülhetjük azokat a holtágakat, amelyekbe különben a bizonyítás 
során belemennénk, illetve abból. hogy a bizonyítások rövidebbek lesznek. 

3. A származtatott szabályoknak a lehető legáltalánosabbaknak kell lenniük, hogy a 
lehető legnagyobb esethalmazt fedjék le. 


A származtatott szabályok hatékonyságát megszokott módon úgy biztosíthatjuk, hogy 
megköveteljük a szabály minden részcéljától. hogy hatásos (operational) legyen. 
Durván fogalmazva, egy cél hatásos, ha , könnyű" megoldani. A Primítóxz) részcélt 
például könnyű megoldani, a megoldásához két lépés elegendő. Ezzel szemben az 
Egyszerűsítésty -- z, w) részcél tetszőleges számú következtetéshez vezethet az y és 
a z értékeinek függvényében. Ha az általánosított bizonyítás megkonstruálásakor a ha- 
tásossági tesztet minden lépésnél elvégezzük, az ágat azonnal lemetszhetjük, amint 
egy hatásos részcélra rátaláltunk. A hatásos részcélt ilyenkor az új szabály egy kon- 
junktív elemeként megtartjuk. 

Sajnos a hatásosság és az általánosság között általában kompromisszumot kell kötni. 
A konkrétabb részcélokat könnyebb megoldani, viszont azok kevesebb esetet fednek le. 
A hatásosság tovább fokozható; egy vagy két lépés nyilvánvalóan hatásos, de mi a hely- 
zet 10-zel vagy 100-zal? Egy adott részcél megoldásának a költsége végül attól függ. 
hogy a tudásbázis milyen egyéb szabályokat tartalmaz. A költség növekedhet vagy 
csökkenthet, ahogy a tudásbázishoz új szabályokat adunk. Az adott kezdeti tudásbázis 
hatékonyságának maximalizálásánál a MAT-rendszerek valóban igen komplex optimi- 
zációs problémával kerülnek szembe. Néha megalkotható annak matematikai modellje, 
hogy egy adott szabály hozzáadása általában milyen hatással van a hatékonyságra, és 
ennek a modellnek a használatával a hozzáadandó legjobb szabály megválasztható. 
Az elemzés azonban igen komplikált lehet, különösképpen ha rekurzív szabályokkal 
van dolgunk. Ígéretes megközelítés a hatékonyság empirikus vizsgálata, amikor néhány 
szabály hozzáadásával meggyőződünk arról, hogy a szabályok közül melyik az, amelyik 
ténylegesen hasznos, és amelyik az eljárásokat felgyorsítja. 

A hatékonyság empirikus elemzésének gondolata a MAT lényegét érinti. Amit eddig 
informálisan , az adott tudásbázis hatékonyságának" neveztünk, az nem más, mint egy 


19.4. TANULÁS RELEVÁNS INFORMÁCIÓ ALAPJÁN 799 


átlagos esetkomplexitás a megoldandó problémák egy eloszlásán mérve. A régi példák 1 
általánosításával a MAT növeli a iudásbázis hatékonyságát a jövőben ésszerűen várha- 

tó problémák szempontjából. Az ötlet addig jó, amíg a régi példák eloszlása durván 
megegyezik a jövőbeli példák eloszlásával. Ez a feltételezés azonos azzal, amit a 18.5. 
alfejezetben a VKH-tanulás kapcsán megtettünk. Ha a MAT-rendszert gondosan kivi- 
telezték, a későbbi problémáknál lényeges javulás érhető el. Egy nagyon nagy méretű, 

svéd és angol nyelv közötti beszédfordításra kifejlesztett, Prolog-alapú, természetes 

nyelvi rendszerben például, a valós idejű fordítási képességet csak az elemző folyamat- 

ra alkalmazott MAT révén sikerült elérni (Samuelsson és Rayner, 1991). 
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Úgy tűnik, hogy a Brazíliába utazónk képes a Brazíliában beszélt nyelvre vonatkozó 
megbízható általánosításra. A következtetésre az a háttértudása jogosítja, miszerint egy 
adott ország lakói (általában) ugyanazt a nyelvet beszélik. Ezt a tudást az elsőrendű 
logikában az alábbi módon fejezhetjük ki? 


Nemzetisége(x. n) A Nemzetiségety, n) A Nyelvetx, 1) 2 Nyelvety, ) (19.6) 
(szó szerint: , Ha x és y azonos n állampolgárságú, és x az ! nyelvet beszéli, akkor y szin- 
tén az / nyelvet beszéli."). Nem nehéz kimutatni, hogy a fenti kijelentésből és a 

Nemzetiségel Fernando, Brazil) NA Nyelve(Fernando, Portugál) 
megfigyelésből logikailag következik (lásd 19.1. feladat), hogy: 

Nemzetiségetx, Brazil) 5 Nyelvetx, Portugál) 


A (19.6) típusú mondatok szigorú relevanciát fejeznek ki: a nemzetiség teljesen meg- 
határozza a nyelvet. Másképpen fogalmazva: a nyelv a nemzetiség függvénye. Az ilyen 
mondatokat funkcionális függőségeknek (functional dependencies) vagy meghatá- 
rozásoknak (determinations) nevezzük. Bizonyosfajta alkalmazásoknál (például az 
adatbázisrendszer-tervek specifikálásánál) ezek annyira általánosan fordulnak elő, hogy 
a felírásukhoz speciális szintaxist használnak. Davies (Davies, 1985) jelölésével élve: 


Nemzetiségetx, n) 7- Nyelvetx, D) 


Ez persze csak egy egyszerű szintaktikai nyalánkság, azonban világosan mutatja, hogy 
egy meghatározás valójában predikátumok közötti reláció: a nemzetiség meghatározza 
a nyelvet. Az anyag vezetőképességét és sűrűségét meghatározó releváns tulajdonságo- 
kat hasonlóképpen kifejezhetjük: 

Anyagatx, m) A Hőmérséklete(x, t) — Vezetőképességetx, p) 

Anyaga(x, m) A Hőmérsékletetx, t) :- Sűrűségetx, d) 


A hozzá tartozó általánosítások a meghatározásokból és a megfigyelésekből szár- 
maznak. 


3 Az egyszerűség kedvéért feltételezzük, hogy egy személy csak egy nyelven beszél. Az olyan országok ese- 
tén, mint Svájc vagy India, a szabályt természetesen bővíteni kell. 
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A hipotézistér meghatározása 


Annak ellenére, hogy meghatározások igazolják az összes brazilra vagy az adott hőmér- 
sékletű réz minden darabjára vonatkozó általános következtetések levonását, ahhoz 
természetesen nem elegendők, hogy egyetlenegy példából következtessünk ki egy 
általános prediktív tulajdonságú elméletet, amely az összes nemzetiségre, az összes 
hőmérsékletre és anyagra vonatkozik. Hatásuk úgy képzelhető el legjobban, hogy leszű- 
kítik a tanuló ágens által figyelembe veendő hipotézisek terét. A vezetőképesség előre- 
jelzésénél például csupán az anyagra és a hőmérsékletre kell koncentrálnunk, figyelmen 
kívül hagyva a tömeget, a tulajdonviszonyokat, a hét napját, a jelenlegi államelnököt 
stb. A hipotézisek természetesen tartalmazhatnak olyan komponenseket, mint például a 
molekuláris struktúra, a termikus energia, a szabad elekronok sűrűsége, amit az anyag 
és a hőmérséklet befolyásol. A meghatározások egy elégséges alapszótárt adnak meg 
ahhoz, hogy a célpredikátumra vonatkozó hipotéziseket megkonstruáljuk. Ezt a kijelen- 
tést úgy láthatjuk be, hogy megmutatjuk: egy adott meghatározás logikailag ekvivalens 
azzal az állítással, miszerint a célpredikátum helyes definíciója a meghatározás bal 
oldalán lévő predikátumok által kifejezhető definíciók egyike. 

Intuitív módon érthető, hogy a hipotézistér méretének számítási redukálásának köny- 
nyebbé kell tennie a célpredikátum megtanulását. A számítási tanulás elmélet alapered- 
ményeit (lásd 18.5. alfejezet) felhasználva, a lehetséges nyereség mennyiségileg is kife- 
jezhető. Emlékezzünk arra, hogy egy Boole-függvény esetén log(IHI) számú példa (ahol 
IHI a hipotézistér mérete) szükséges ahhoz, hogy egy elfogadható hipotézishez konver- 
gáljunk. Ha a tanuló n Boole-tulajdonsággal rendelkezik a hipotézisek megkonstruálásá- 
hoz, akkor egyéb korlátozások hiányában [Hj — 0(?,, így a példák száma O(2"). Ha a 
meghatározás bal oldalán d számú predikátum áll, a tanulónak 009 példára van szük- 
sége, ami O(2""4) méretű redukciót jelent. Elfogult hipotézistér, például konjuktív el- 
fogultságok esetén, a redukció még mindig számottevő lesz, bár kevésbé lesz látványos. 





function MINIMÁLIS-KONZISZTENS-MEGH(E, A) returns az attribútumok egy halmaza 
inputs: E, a példák egy halmaza 
A, az n nagyságú attribútumok egy halmaza 


fori — 0 ....n do 
for each A, az A i nagyságú részhalmaza do 
ÁC KONZISZTENS-MEGHX(A;, E) then return A; 





function KONZISZTENS-MEGH(A, E) returns egy igazságérték 
inpots: A, az attribútumok egy halmaza 
E. a példák egy halmaza 
local variables: H, egy hash-tábla 


for cach e példa in E do 
if valamelyik példa a H-ban az A attribútumokra ugyanolyan értékű, mint e, 
de eltérő besorolással rendelkezik then return hamis 
tároljuk e besorolását H-ban, az e példa A attribútumainak értékeivel indexelve 
return igaz 








19.8. ábra. Algoritmus egy minimális konzisztens meghatározás megkeresésére 
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Tanulás releváns információ felhasználásával 


Ahogy ezt a fejezet bevezetőjében már megemlítettük, az előzetes tudás hasznos a tanu- 
lás szempontjából, azonban valahogy ezt is meg kell tanulni. Hogy a relevanciaalapú ta- 
nulást teljes mértékben megfogalmazhassuk a meghatározások tanulási mechanizmusát 
meg kell még adnunk. A most bemutatásra kerülő algoritmus alapja a megfigyelések- 
kel konzisztens legegyszerűbb meghatározás megtalálása. Egy P : 0 meghatározás azt 
jelenti, hogy ha egy példa illeszkedik P-re, akkor 0-ra is kell illeszkednie. Egy megha- 
tározás konzisztens a példák egy halmazával, ha minden példapár, amely a bal oldali 
predikátumokon illeszkedik egymásra, a célpredikátumon is illeszkedik, magyarán, ha 
a besorolása azonos. Tegyük fel, hogy bizonyos anyagi mintákat megmérve a vezető- 
képesség alábbi méréseivel rendelkezünk: 











Minta Tömeg [ Hőmérséklet Anyag Méret Vezetőképesség 
SI 12 26 réz §$ 0.59 
si 12 100 réz 3 057 
s2 24 26 réz 6 0.59 
s3 12 26 lom 2 0.05 
sz 12 100 ólom 2 0.04 
s4 24 26 ólom 4 0.05 


























A minimális konzisztens meghatározás: Anyaga A Hőmérséklete ?- Vezetőképessége. 
Létezik konzisztens, de nem minimális meghatározás is: Tömege A Nagysága A Hőmér- 
séklete ?- Vezetőképessége. Ez azért konzisztens a példákkal, mert a tömeg és a méret 
meghatározza a sűrűséget, és az adatbázisunkban nincs két különböző anyag, amelynek 
sűrűsége azonos lenne. Mint mindig, most is nagyobb példahalmazra lenne szükségünk, 
hogy a közel helyes hipotézist kiszűrjük. 

A minimális konzisztens meghatározás megkeresésének több lehetséges algoritmu- 
sa létezik. Kézenfekvő megközelítés a meghatározások terében keresni, először az 
egypredikátumos, a kétpredikátumos stb. meghatározásokat ellenőrizve, amíg rá nem 
lelünk egy konzisztens meghatározásra. Egyszerű attribútumalapú ábrázolást téte- 
lezünk fel, hasonlóan ahhoz, mint amit a döntési fák tanulásánál a 18. fejezetben 
használtunk. Tekintettel arra. hogy a célpredikátumot rögzítettnek vesszük, a d meg- 
határozást a bal oldal attribútumhalmaza fogja képviselni. Az algoritmust a 19.8. ábra 
mutatja. 

Ennek az algoritmusnak az időigénye a legkisebb konzisztens meghatározás nagysá- 
gától függ. Tegyük fel, hogy az ilyen meghatározásnak p attribútuma van a lehetséges 
n-ből. Az algoritmus addig nem lesz képes a meghatározást megtalálni, amíg az A-nak 
P nagyságú részhalmazait nem kezdi végigvizsgálni. Miután (9)— O(n?P) ilyen részhal- 
maz létezik, következésképpen az algoritmus a minimális meghatározás méretét tekint- 
ve exponenciális lesz. Az is kiderült, hogy a probléma NP-teljes, így általános esetben 
sem várhatunk jobbat. A legtöbb tárgytartomány azonban elegendő lokális strukturált- 
sággal (a lokálisan strukturált tárgytartomány definíciójára lásd 14. fejezet) rendelkezik, 
így p minden bizonnyal kicsi lesz. 
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Ha a meghatározások tanuló algoritmusa már adott, a tanuló ágensnek módja van egy 
olyan minimális hipotézist megkonstruálni, amelyen belül kell a célpredikátumot meg- 
tanulnia. Összemásolhatjuk a MINIMÁLIS-KONZISZTENS-MEGH és a DÖNTÉSI-FA-TANULÁS 
algoritmusait, és így az RADFT-t. a relevanciaalapú döntési fa tanuló algoritmust kap- 
juk, amely először a releváns attribútumok minimális halmazát azonosítja, majd ezen 
halmazt tanulás céljából döntési fa algoritmusának adja tovább. A DÖNTÉSI-FA-TANLLÁS- 
sal ellentétben az RADFT egyidejűleg tanulja és használja a releváns információt ahhoz, 
hogy a hipotézisteret minimalizálja. Elvárjuk, hogy az RADFT tanulási görbéje a 
DÖNTÉSI-FA-TANULÁS tanulási görbéjénél jobb legyen, és tényleg ez a helyzet. A 19.9. 
ábrán a két algoritmus tanulási görbéje látható, véletlen módon generált adatokon és 
egy olyan tanulandó függvény esetén, amely a lehetséges 16 attribútumból csupán 5-öt 
használ fel. Természetesen azokban az esetekben. amikor az összes attribútum releváns, 
az RADFT nem mutat előnyöket. 
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19.9, ábra. Az RADFT és a DÖNTÉSI-FA-TANULAS hatékonyságának összehasonlítása véletlen módon 
generált adatok és egy olyan célfüggvény esetén, amely a lehetséges 16 attribútumból csak 5-öt használ 


Ez a rész csak érintette a deklaratív elfogultság (declarative bias) területét, melynek 
az a célja, hogy megértsük, hogy az előzetes tudást hogyan kell felhasználni a megfele- 
lő hipotézistér azonosításához, amelyben a korrekt céldefiníciót keressük. Sok kérdés 
megválaszolatlan maradt: 


s Hogyan kell az algoritmust kiterjeszteni a zaj kezelésére is? 

.  Tudunk-e folytonos értékeket felvevő változókat kezelni? 

s Hogyan lehetne felhasználni az előzetes tudás más típusát is, a meghatározásokon kívül? 

s Hogyan lehet az algoritmusokat általánosítani, hogy egy elsőrendű elméletre, és nem 
csupán az attribútumalapú reprezentációra vonatkozzanak ? 


Az egyes kérdésekre a következő alfejezetben keresünk választ. 
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Az induktív logikai programozás (ILP) az induktív módszereket az elsőrendű reprezen- 
tációk erejével kombinálva, az elméletek logikai programok formájában történő kifeje- 
zésére helyezi a hangsúlyt. ! Az ILP három oknál fogva terjedt el. Először is az ILP az 
általános tudásalapú induktív tanulási probléma precíz, szigorú megközelítését adja. 
Másodszor, teljes algoritmusokat szolgáltat az általános elsőrendű elméletek indukciós 
úton, példák alapján történő előállítására. Következésképpen olyan területeken is képes 
sikeresen tanulni, ahol az attribútumalapú algoritmusokat nehéz alkalmazni. Ennek egy 
példája a fehérjemolekulák összehajtogatásának a tanulása (lásd 19.10. ábra). A fehérje- 
molekula háromdimenziós konfigurációját egy attribútumhalmazzal ésszerűen kifejezni 
nem lehet, mert a konfiguráció lényege az objektumok közötti relációkra vonatkozik, és 
nem az egyes objektumok attribútumaira. A relációk leírására megfelelő apparátus az 
elsőrendű logika. Harmadszor, induktív logikai programozás által létrehozott hipotézi- 
sek emberek számára (viszonylag) könnyen olvashatók. A 19.10. ábrabeli természetes 
nyelvű fordítást a gyakorló biológusok végigelemezhetik és kritizálhatják. Ez azt jelen- 
ti, hogy az induktív logikai programrendszerek részt vehetnek a kísérletezés, a hipoté- 
zisgenerálás, a megvitatás és a cáfolat tudományos ciklusában. Az ilyen részvétel a , fe- 
kete doboz" osztályozókat gyártó módszerek számára. mint amilyenek például a neurális 
hálók, lehetetlen lenne. 


Egy példa 


Emlékezzünk a (19.5) egyenlet alapján, hogy az általános tudásalapú indukciós problé- 
ma az alábbi vonzatkényszer: 


Háttértudás N Hipotézis N Leírások t- Besorolások 


,Mmegoldása" az ismeretlen Hipotézis-re nézve, feltéve, hogy adottak a Háttértudás, 
valamint a Leírások és a Besorolások által leírt példák. Hogy ezt megvilágítsuk, tekint- 
sük a rokonsági relációk példák alapján történő tanulását. A megfigyeléseket egy kiter- 
jedt családfa képezi, az Anyja, Apja, Házas relációkkal, valamint a Férfi és Nő tulajdon- 
ságokkal leírva. A 8.11. feladat családfáját fogjuk használni, amit a 19.11. ábra mutat. 
A példához tartozó leírások az alábbiak: 


ApjalFülöp, Károly) Apja(Fülöp, Anna) 
AnyjatMami, Margit) AnyjatMami, Erzsébet) 
Házas(Diana, Károly) HázastErzsébet, Fülöp) 
FérfilFülöp) Férfil Károly) 
Nő(Beatrix) Nő(Margit) 


A Besorolások állításai azon múlnak, hogy milyen célfogalmat szeretnénk megtanulni. 
A célpredikátumok olyan fogalmak lehetnének. mint például a Nagyszülője, a Sógora, 
illetve az őse. A Nagyszülője esetén a Besorolások teljes halmaza 20 x 20 — 400 


4 Azt javasoljuk, hogy ezen a ponton az olvasó ismételten fusson végig a 9. fejezetben bemutatott néhány 
fogalmon. beleértve a Horn-klózokat, a konjunktív normál formát, az egyesítést és a rezolúciót. 
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19.10. ábra. Az (a) és (b) ábra a fehérjemolekula összehajtogatásának tárgyterületén a ,négy-helikális 
fel-és-le köteg" fogalom pozitív és negatív példáját mutatja. Mindkét példa struktúráját egy olyan kb. 100 
konjunktív tagot tartalmazó logikai kifejezésbe kódolták, mint amilyen például a TeljesHossztD2mhr, 
118) A HelikálisSzám(DZmhr, 6) A ... kifejezés. Az ilyen leírásokból és az Összehajtogatás(NÉGY- 
HELIKÁLIS-FEL-ÉS-LE-KöTEG, DZmhr) jellegű besorolásokból a PROGOL induktív logikai programrend- 
szer (Muggleton. 1995) az alábbi szabályt tanulta meg: 


Összehajtogatás(NNÉGY-HELIKÁLIS-FEL-ÉS-LE-KÖTEG, f) — 
Helikálisíf, cs) A Hossztcsy, MAGAS) A Pozíció(f, csy. n) 
A(1 £ n £ 3) A Szomszédosíf, cs, csa) A Helikálisíf. csa) 


Ilyen típusú szabályt az előbbi fejezetekben látott, atrribútumalapú mechanizmusokkal megtanulni, sőt 
kifejezni sem lehet. A szabály a természetes nyelvben kifejezve: 
Az F fehérje a , Négy-helikális fel-és-le köteg" összehajtogatási osztályhoz tartozik, ha egy hosszú 
csj helikálist tartalmaz a másodlagos struktúra 1. és 3. közötti pozícióban, valamint csy a második 
helikálissal szomszédos. 





NagyszülőjetMami, Károly) Nagyszülője(Erzsébet, Beatrix) 
-NagyszülőjelMami, Harry)  —Nagyszülője(Spencer, Péter) feed 
alakú konjunktból áll. Természetesen e teljes halmaz részhalmazából is tudnánk tanulni. 
Az induktív tanuló program tárgya egy olyan állításhalmaz Hipotézis-ként való elő- 
állítása, amely a vonzatkényszert kielégíti. Átmenetileg tegyük fel, hogy az ágens nem 
rendelkezik háttértudással, a Háttértudás üres. Akkor egy lehetséges megoldás a Hipo- 
tézis-re a következő: 
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GyörgyI4 Mami 
Spencerb4Kydd Erzsébet BA Fülöp Margit 


DianabáKároly . AnnabdMárk  AndrásbáSára — Edward 


Vilmos Hany — Péter Zara Beatrix  Eugenie 
19.11. ábra. Egy tipikus családfa 


Nagyszülője(x, v) 62 [3z Anyja(x, 2) A Anyja(z. y] 
V [B3z Anyjatx, 2) A Apjaíz, 9] 
v [3z Apjatx, 2) A Anyjaíz, y)] 
V [3z Apja(x, 2) A Apja(z, y)] 


Vegyük észre, hogy egy attribútumalapú tanuló algoritmus, mint például a DÖNTÉSI-FA- 
TANULÁS sehogy sem fog ezzel a problémával boldogulni. Ahhoz, hogy a Nagyszülője-t 
attribútumként (azaz egy unáris predikátumként) fejezzük ki, az embereket párosával 
objektumként kell tudnunk kezelni: 


Nagyszülője(tMami, Károly)... 


Ezek után ott akadunk el, amikor megkíséreljük egy példa leírását formálisan reprezen- 
tálni. Csupán olyan elrettentő attribútumokat tudnánk használni, mint az: 


ErzsébetAnyjaAzElsőElemt(Mami. Károly)) 


A Nagyszülője-nek az ilyen attribútumokkal kifejezett definíciója nem lesz más, mint 
egy nagy diszjunkció, ami az egyes konkrét esetekből áll, és amit lehetetlen az új ese- 
tekre általánosítani. Az attribútumalapú tanuló algoritmusok képtelenek relációs predi- 
kátumokat megtanulni. Az ILP egyik legfontosabb előnye tehát az, hogy a problémák 
sokkal szélesebb választékában alkalmazhatók, beleértve a relációs problémákat is. 
Az olvasó természetesen észreveszi, hogy egy kis háttértudás segítene a Nagyszülője 
definíciójának reprezentációjánál. Így például, ha a Hártérrudás tartalmazná az alábbi 
állít 
Szülőjex, y) 6 lAnyjatx, y) v Apjatx, y)] 
akkor a Nag: 
Nagyszülőjetx, y) 6 [dz Szülőjetx, z) A Szülőjetz, y)] 


állításra lehetne redukálni. Ez megmutatja, hogy mennyire tud a háttértudás hozzájárulni 
a példák megmagyarázásához szükséges hipotézis méretének drasztikus csökkentéséhez. 

Az ILP-algoritmus új predikátumokat is féresíthet, hogy a magyarázó jellegű hipotézis 
kifejezését egyszerűsítse. Az előbbi példát tekintve, teljesen ésszerű egy pótpredikátumot 
javasolni — amit ,, Szülője"-nek tudnánk nevezni —, hogy a célpredikátum definícióját egy- 
szerűsítsük. Azok az algoritmusok, amelyek új predikátumokat tudnak létesíteni, az ún. 






ülője definícióját az 
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konstruktív indukciós (constructive induction) algoritmusok. Világos, hogy a konstruk- 
tív indukció a bevezetőben vázolt kumulatív tanulás egy szükséges komponense. A kumu- 
latív tanulás a gépi tanulás egyik legnehezebb problémája, azonban egyes ILP-technikák 
kellően hatékony mechanizmusnak bizonyultak a megoldására. 

A fejezet hátralévő részében az ILP két alapvető megközelítését fogjuk tanulmányozni. 
Az első a döntési fák általánosításán, a másik a rezolúciós bizonyítás invertálásán alapul. 


Felülről lefelé tanulási módszerek 


Az ILP első megközelítésében egy igen általános szabállyal kezdünk és azt fokozatosan 
leszűkítjük, hogy az adatokra illeszkedjen. Ez az, ami lényegében a döntési fa tanulásá- 
nál történik, ahol a döntési fa fokozatosan növekszik, amíg a megfigyelésekkel konzisz- 
tens nem lesz. Hogy az ILP-t magvalósítsuk, elsőrendű literálokat használunk attribútu- 
mok helyett, a hipotézis pedig egy klózhalmaz, a döntési fa helyett. Ebben a részben az 
egyik legelső ILP-programmal, a ForL-lal foglalkozunk (Ouinlan, 1990). 

Tegyük fel, hogy továbbra is a Nagyszülőjetx, v) predikátum definícióját szeretnénk 
megtanulni az előbb közölt családi példák alapján. A döntési fa tanulásához hasonlóan 
a példákat pozitív és negatív példákra bontjuk. A pozitív példák: 

(György, Anna) , (Fülöp, Péter), (Spencer, Harry), ... 
míg a negatív példák: 

(György, Erzsébet), (Harry, Zara) , (Károly, Fülöp), ... 

Figyeljük meg, hogy mindegyik példa egy objektumpáros, hiszen a Nagyszülője egy 
bináris predikátum. Egészét tekintve a családfában 12 pozitív és 388 negatív (a szemé- 
lyek minden más párosítása) példa található. 

A FolL program klózok egy halmazát alakítja ki, mindegyik Nagyszülőjetx, y)-nal 
mint fejjel. A klózoknak a 12 pozitív példát a Nagyszülőjetx, y) reláció példányosításá- 
nak kell osztályozniuk, a többi 388-at viszont kizárni. A klózok Horn-klózok, melyeket 
negált literálokkal bővítünk ki, ahol a negálást mint kudarcot használjuk, hasonlóan a 
Prologhoz. Egy üres testű klózzal kezdünk: 


5 Nagyszülőjelx, y) 


Mivel ez a választás minden példát pozitívnak sorol be, leszűkítésre szorul. Ez úgy te- 
hető meg, hogy egy lépésben egy literált adunk a bal oldalhoz. A három lehetséges eset: 





Apjatx,z)  - Nagyszülőjetx, y) 


(Vegyük észre, hogy a Szülője-t definiáló klózzal a háttértudás már rendelkezik.) 
E három eset közül az első az összes 12 pozitív példát helytelenül negatívnak sorolja 
be, így ezt az esetet kizárjuk. A második és a harmadik az összes pozitív példával össz- 
hangban van. A második eset azonban a negatív példák nagyobb halmazán — ponto- 
sabban kétszer annyi példán — helytelen, meri az anyákat és az apákat is megengedi. Így 
a választásunk a harmadik esetre esik. 
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Most az esetet tovább kell szűkíteni, kizárva azokat az eseteket, amikor x valamilyen z 
szülője. de z mégsem y szülője. Egy egyedi Szülője(z, y) literál hozzáadása a következő 
klózt eredményezi: 


Apjatx, z) A Szülőjelz, vy) 5 Nagyszülőjetx, y) 


amely az összes példát helyesen sorolja be. A For képes lesz ezt a literált megtalálni és 
kiválasztani, és ezzel a tanulási feladatot megoldja. Általánosságban, a helyes megoldás 
megtalálása előtt, a FOtL-nak számos sikertelen klóz között kell keresnie. Ez a példa a 
Fort működésének egyszerű illusztrációja. A teljes algoritmus váza a 19.12. ábrán látha- 
tó. Az algoritmus lényegében literálról literálra egy klózt konstruál, amíg az meg nem 
egyezik a pozitív példák valamilyen részhalmazával, és egyik negatív példával sem egye- 
zik. A klóz által lefedett pozitív példákat ekkor a tanító halmazból elhagyjuk, és az eljárást 
folytatjuk, amíg egyetlen pozitív példa sem marad. Az algoritmus két fő komponense 
szorul magyarázatra — az ÚJ-LITERÁLOK, amely a klózhoz hozzáadandó összes új literált 
konstruálja, és a LITERÁL-MEGVÁLASZTÁSA, amely kiválasztja a hozzáadandó literált. 





function FolL(példák. cél) returns a Horn-klózok egy halmaza 
inputs: példák, a példák halmaza 
cél, egy literál a célpredikátum részére 
tocal variables: klózok, a klózok halmaza, kezdetben üres 





while példák tartalmaznak még pozitív példákat do 
klóz — ÚJ-KLöztpéldák, cél) 
a példák-ból hagyjuk el a klóz lefedte példákat 
a klóz-t adjuk hozzá a klózok-hoz 

return kiózok 


function ÚJ-KLÓZ(példák, cél) returns egy Horn-klóz 
local variables: klóz, a cél-ra mutató, üres testű klóz 
1. a klózhoz hozzáadandó literál 
kiterjedt-példák, a példák halmaza, az új változóknak adott értékekkel együtt 


kiterjedt példák — példák 
"while a kiterjedt példák tartalmaznak még negatív példákat do 
T — LITERÁL-MEGVALASZTÁSA(ÚJ-LITERÁLOK(A/óz), kiterjedt. példák) 
hozzáfűzése a klóz testéhez 
kiterjedt. példák — a PÉLDA-KITERJEDÉS-t a kiterjedt. példák minden 
példájára történő alkalmazásával kapott példahalmaz 
return klóz 





function PÉLDA-KITERJEDÉSÍpélda, literál) returns 
if példa kielégíti a titerál-t 
then return a példa kiterjesztésével kapott példahalmaz úgy. hogy a fiterál 
minden új változóját minden lehetséges konstans értékre lekötöttük 
else return üres halmaz 











19.12. ábra. A FolL algoritmus váza, amely példákból elsőrendű Horn-klózokat tanul meg. Az Ú- 
LITERÁLOK és a LITERÁL-MEGVÁLASZTÁSA eljárásokat a szövegben magyarázzuk meg. 
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Az ÚLLITERÁLOK egy klózt kap bementként, és minden lehetséges , hasznos" literált 
konstruál, amit a klózhoz hozzá lehetne adni. Vegyük például az alábbi klózt: 


Apja(x, z) — Nagyszülőjetx, y) 
Háromfajta literált adhatunk hozzá a klózhoz: 


1. Predikátumokat használó literálok: a literál lehet negált vagy ponált, minden létező 
predikátum (a célpredikátumot is beleértve) használható, és minden argumentum 
csakis változó lehet. A predikátumok argumentumai tetszőleges változók lehetnek, 
egy kikötéssel: minden literálnak tartalmaznia kell fegalább egy változót egy koráb- 
bi literálból vagy a klóz fejéből. Olyan literálok. mint: Anyja(z, w, Házasíz, 2), 
-Férfi(y) és Nagyszülője(v, x) megengedettek, ám Házas(u. v) nem. Megjegyzendő, 
hogy a klóz fejéből származó predikátumok használata lehetővé teszi. hogy a FOIL 
a rekurzív definíciót is megtanulja. 

2. Egyenlőségi és egyenlőtlenségi literálok: ezek a klózban már szereplő változókat 
kötik össze. Így például a klózhoz hozzáadhatjuk, hogy: z 7 x. Ezekben a li- 
terálokban a felhasználó által specifikált konstansok is felhasználhatók. Az arit- 
metikát tanulva célszerű kitüntetni a U-t és az I-et, a listafüggvényeknél pedig az 
üres (] listát. 

3. Aritmetikai összehasonlítások: folytonos változójú függvények tanulásánál célszerű 
lehet az olyan literálok hozzáadása, mint az x 5 v és az y Sz. A döntési fa tanulásá- 
hoz hasonlóan egy konstans küszöbértéket is lehet használni, ami a teszt diszkrimi- 
nációs erejét maximalizálja. 


Mindez a keresési térben nagyon nagy elágazási tényezőhöz vezet (lásd 19.6. feladat), 
azonban a FoIL implementációiban a típusinformációt is fel lehet használni a hipotézis- 
tér leszűkítésére. Az embereket és a számokat tartalmazó tárgytartományban például a 
típusleszűkítés nem engedné, hogy az ÚJ-LITERÁLOK olyan literálokat generáljon, mint 
a Szülőjetx, n), ahol x egy ember, n viszont egy szám. 

A LITERÁL-MEGVÁLASZTÁSA az információnyereségre (lásd 761. oldal) valamilyen 
mértékben hasonló heurisztikát használ, hogy eldöntse, melyik líterált adja hozzá a 
klózhoz. A részletek itt nem különösen fontosak. ráadásul számos kipróbált változat 
is létezik. A FolL egyik érdekes járulékos tulajdonsága az Ockham borotvája elvének 
az alkalmazása bizonyos hipotézisek eliminálására. Ha (egy bizonyos mérték szerint) 
egy klóz hosszabbnak mutatkozik, mint az általa megmagyarázott pozitív példák 
összhossza, akkor ezt a klózt a továbbiakban nem tekintjük lehetséges hipotézisnek. 
Ezzel a technikával elkerülhetjük az adatokban található zajra illeszkedő, túlságosan 
bonyolult klózok származtatását. A zaj és a klózhossz kapcsolatának magyarázatát 
lásd a 821. oldalon. 

A FotL-t és társait számos definíció megtanulására vetették be. Az egyik leghatá- 
sosabb demonstráció (Ouinlan és Cameron-Jones, 1993) a listakezelő függvényekre 
vonatkozó feladatok hosszú sorának a megoldása volt Bratko Prolog-tankönyvéből 
(Bratko, 1986). A program mindegyik esetben képes volt a függvény helyes definíció- 
ját kisszámú példa alapján megtanulni, miközben háttértudásként használta a korábban 
megoldott függvényeket. 
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Induktív tanulás inverz rezolúcióval 


Az IL.P-nek másik fő megközelítése a megszokott deduktív bizonyítási folyamat inver- 
tálása. Az inverz rezolúció (inverse resolution) azon az észrevételen alapul, hogy ha 
a példa Besorolások a Háttértudás A Hipotézis A Leírások-ból következnek, akkor ezt 
a tényt rezolúcióval be kell tudnunk bizonyítani (hiszen a rezolúció teljes). Ha képesek 
volnánk a bizonyítást , visszafelé pörgetni", akkor tudnánk egy olyan Hiporézis-t talál- 
ni, amire a bizonyítás sikeres lesz. A kulcsprobléma tehát, hogy hogyan tudnánk a re- 
zolúciós eljárást invertálni, hogy a bizonyítás visszafelé fusson le. 

Az inverz rezolúció visszafelé haladó bizonyítási eljárását mutatjuk be, amely egye- 
di visszafelé mutató lépésekből áll. Egy közönséges rezolúciós lépés a C/ 1 és C; klózból 
indul ki, és azokat rezolválja egy C rezolvenst létrehozva eredményül. Az inverz 
rezoluciós lépés a C rezolvens alapján két klózt, €1-et és €5-t hoz létre úgy, hogy C a 
C) és C; rezolválásának az eredménye, vagy pedig C és C) alapján állít elő egy lehet- 
séges C2-t. 





SzülőjetGyörgy, Erzsébei) 







(i/György, JErzsébet) 





Szülője( Erzsébet, Anna) 


-Nagyszülőjel György, Anna) 







19.13. ábra. Az inverz rezolúciós eljárás kezdő lépései. Az árnyékolt klózokat az inverz rezolúciós eljá- 
tás generálja a jobb oldalon és az alatta lévő klózokból. A nem árnyékolt klózok a Leírások-ból és a 
Besorolások-ból származnak. 


A 19.13. ábra inverz rezolúciós eljárás kezdő lépéseit mutatja, ahol a figyelem kö- 
zéppontjában a Nagyszülője( György, Anna) pozitív példa áll. Az eljárás a bizonyítás 
végén kezd (amit az ábra alján ábrázolunk). A C rezolvensnek üres klózt (azaz egy 
ellentmondást) választunk, C2-nek pedig a -Nagyszülőjel György, Anna)-t, amely a cél- 
példa negálása. Az első inverz lépés C-ből és C2-ből C-nek a Nagyszülőjel György, 
Anna)-t generálja. A következő lépés e klózt C-nek veszi, a Szülője(Erzsébet, Anna) 
klózt pedig C2-nek, és az alábbi C, klózt generálja: 


—sSzülőjel Erzsébet, y) v NagyszülőjelGyörgy, y) 


Az utolsó lépés ezt a klózt rezolvensként kezeli. A SzülőjelGyörgy, Erzsébet) klózt 
€2-nek véve, egy lehetséges C) klóz az alábbi hipotézis lehet: 


Szülőjetx, z) A Szülője(z, y) 2 Nagyszülőjetx, y) 
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Egy rezolúciós bizonyításunk van tehát arra, hogy a hipotézis, a leírások és a háttér- 
tudás maga után vonzza a Nagyszülőjel György, Anna) osztályozást. 

Világos, hogy az inverz rezolúció keresést tartalmaz. Minden egyes inverz rezolú- 
ciós lépés nemdeterminisztikus, hiszen az adott C és C,-hez több, sőt végtelen sok 
olyan C5 klóz lehet, amely kielégíti azt a feltételt, miszerint C)-gyel rezolválva C-t ad 
eredményül. Így a 19.13. ábra utolsó lépésében a -Szülője(Erzsébet, y) V Nagyszülő- 
je(György, y) megválasztása helyett az inverz rezolúciós lépés a következő állításokat 
is tudná generálni: 

—Szülője(Erzsébet, Anna) V Nagyszütlőjel György, Anna) 


(z, Anna) V Nagyszütlőjel György, Anna) 
—Szülőjelz, y) V Nagyszülőjel György, y) 





(Lásd a 19.4. és a 19.5. feladatot.) Az egyes lépésekben részt vevő klózokat meg lehet 
választani a Háttértudás-ból, a példa Leírások-ból, a negált Besorolások-ból vagy az in- 
verz rezolúciós fában eddig már legenerált hipotézisklózokból. A nagyszámú lehetőség. 
egyéb kontroll nélkül, nagy elágazási tényezőt (és így kevéssé hatékony keresést) je- 
lent. A keresés kézben tartására több megközelítést probáltak ki az implementált ILP- 
rendszerekben: 


1. A redundáns választások eliminálhatók — például a legspecifikusabb lehetséges 
hipotézisek generálásával, valamint megkövetelve, hogy a hipotézisklózok mind 
konzisztensek legyenek egymással és a megfigyelésekkel. Az utolsó kritérium kizár- 
ná az előbbiekben megadott -Szülőjetz, y) v NagyszülőjelGyörgy, y) klózt. 

2. A bizonyítási stratégia szintén megszorítható. A 9. fejezetben láttuk például, hogy 
a lineáris rezolúció (linear resolution) egy teljes, megszorított stratégia, amely 
lehetővé teszi, hogy a bizonyítási fáknak csak lineáris elágazási struktúrája lehes- 
sen (mint a 19.13. ábrán). 

3. A reprezentációs nyelv is megszorítható, a függvényszímbólumok eliminálásával és 
csak Horn-klózokat megengedve. A PROGOL például Horn-klózokkal dolgozik, inverz 
vonzatrelációt (inverse entailment) alkalmazva. Az ötlet a 


Háttértudás N Hipotézis A Leírások HF Besorolások 
vonzatkényszer megváltoztatása a 

Háttértudás N Leírások A -Besorolások - —Hipotézisek 
logikailag ekvivalens formára. 


Ebből a Hipotézisek származtatására már a Prolog-beli normál Horn-klóz dedukcióra 
hasonlító módszert használhatjuk, negálással mint kudarccal. Mivel ez Horn-klózokra 
korlátozott, így nem teljes módszer, azonban a teljes rezolúciónál hatékonyabb lehet. 
Inverz vonzatrelációval lehetséges a teljes következtetés alkalmazása is (Inoue, 2001). 

4. A következtetést modellellenőrzéssel is megvalósíthatjuk a tételbizonyítás helyett. 
A PROGOL rendszer (Muggleton, 1995) a modellellenőrzés egy formáját használja 
kereséskorlátozás céljára. Azaz, hasonlóan a válaszhalmaz-programozáshoz, a logi- 
kai változók lehetséges értékeit generálja, és a konzisztenciát ellenőrzi. 

5. A következtetést az alap ítéletklózokkal is megtehetjük az elsőrendű logika helyett. 
A LINus-rendszerben (Lavraő és Dferoski, 1994) az elsőrendű elméleteket ítéletlogi- 
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kára fordítják le, ítéletlogikai tanuló rendszerrel oldják meg azokat, majd visszafor- 
dítják. Egyes problémák esetén ítéletlogikai állításokkal sokkal hatékonyabban lehet 
dolgozni, ahogy ezt a 11. fejezetben a SATPLAN esetében már láttuk. 


Felfedezés induktív logikai programozással 


Egy teljes rezolúciós stratégiát invertáló inverz rezolúciós eljárás elvben az elsőren- 
dű elméletek tanulásának egy teljes algoritmusa. Ez azt jelenti, hogy ha valamely 
ismeretlen Hipotézis egy sor példát generál, akkor az inverz rezolúciós eljárás a pél- 
dákból tudja generálni a Hipotézis-t. Ez a megfigyelés egy érdekes lehetőséget is 
sugall. Tegyük fel, hogy a rendelkezésre álló példák szabadon eső testek által leírt 
trajektóriák egy halmazát tartalmazzák. Lehetséges, hogy egy inverz rezolúciós prog- 
ram elvben képes a gravitáció törvényét megtanulni? A válasz természetesen igen, 
mert a gravitáció törvénye, megfelelő matematikai háttér mellett, lehetővé teszi a pél- 
dák magyarázatát. Hasonlóképpen el lehet képzelni, hogy az elektromágneses hullá- 
mok elmélete, a kvantummechanika és a relativitáselmélet, mind beletartoznak az 
ILP-programok hatáskörébe. Persze a gépíró majom hatáskörébe is beletartoznak; 
jobb heurisztikákra és a keresési teret jobban strukturáló technikákra még mindig 
szükség van. 

Egy dolgot azért az inverz rezolúciós rendszer meg fog tenni a részünkre: új prediká- 
tumokat fog kitalálni. Ez a képessége kissé mágikusnak tűnik, hiszen a számítógépre 
szokás úgy tekinteni, mint ami , csak azzal dolgozik, amit bemenetként kapott". Tény, 
hogy az új predikátumok egyenesen az inverz rezolúciós lépésből pottyannak ki. A leg- 
egyszerűbb az az eset, amikor egy adott C klóz esetén két új klóz, C, és C, létezését 
kellene felvetni. A C, és C; rezolúciója a két klóz által közösen tartalmazott literált eli- 
minálta, lehetséges hát, hogy az eliminált literálban olyan predikátum is szerepelt, 
amely C-ben már nem lép fel. Visszafelé haladva tehát lehetőségként adódik egy új pre- 
dikátum létrehozása, amiből viszont a hiányzó líterál már rekonstruálható. 

A 19.14. ábra arra mutat példát, ahogy az Őse definíciójának tanulása közben egy új 
P predikátumot generálunk. Ha már előállítottuk a P-t, akkor ez használható az inverz 
rezolúció későbbi lépéseiben is. Egy későbbi lépés például feltételezheti, hogy az 
Anyja(x, v) 5 P(x, y). Az új predikátum jelentését így a predikátumot felhasználó hi- 
Ppotézis generálása korlátozza. Egy másik példa elvezethet az Apjatx, y) 5 P(x, y)-ig. 
Más szóval a P predikátum olyan valami, ami minket általában a Szülője relációra em- 
lékeztet. Korábban említettük, hogy új predikátumok bevezetése a célpredikátum defi- 
níciójának a méretét lényegesen csökkentheti. Az új predikátumok kialakításának 
beépített képességével, az inverz rezolúciós rendszer sokszor olyan tanulási problémák- 
kal is megbirkózik, amelyekre más módszerek alkalmatlanok. 

A tudomány legmélyebbre ható forradalmai új predikátumok és függvények beveze- 
tésével függnek össze, ilyen például a Galilei felfedezte gyorsulás vagy Joule termikus 
energiája. Ha ezek a fogalmak már adottak, az új törvények felfedezése (viszonylag) 
egyszerű. A fő nehézség arra rájönni, hogy egy új entitás bevezetése, amely a létező 
entitásokkal meghatározott konkrét kapcsolatban van, lehetővé teszi a megfigyelések 
egész halmazának a korábban lehetségesnél sokkal egyszerűbb és elegánsabb elmélet 
keretein belül történő magyarázatát. 
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ES sás sztttli 


[///piatgyörgyad v ősetGyörgyyy  ] 


19.14. ábra. Egy új P predikátumot generáló inverz rezolúciós lépés 








Az ILP-rendszerek egyelőre Galilei- vagy Joule-szintű felfedezéseket nem tettek, a 
felfedezéseit azonban tudományos irodalomban való publikálásra érdemesnek találták. 
Így például Journal of Molecular Biology-ban Turcotte írja le a fehérje összehajtogatási 
szabályok automatikus felfedezését a PROGOL ILP programmal (Turcotte és társai, 2001). 
A PROGOL által felfedezett szabályok közül sokat az ismert elvekből ugyan le lehetett 
volna következtetni, a többségét azonban a standard biológiai adatbázisok részeként 
korábban mégsem publikálták (lásd 19.10. ábra példája). Egy ehhez kapcsolódó kutatás 
részeként Srinivasan (Srinivasan és társai, 1994) molekula-struktúraalapú szabályok fel- 
fedezésével foglalkozott nitroaromatikus komponensek mutagenicitására. Ilyen kompo- 
nensek a gépkocsik által kibocsátott kipufogógázban találhatók. A standard adatbázisok- 
ban lévő komponensek 8096-ában lehetséges a négy fontos jellemzőt azonosítani, és az 
erre épülő lineáris regresszió jobb az ILP-nél. A maradék 2096 esetén a jellemzők ön- 
magukban nem elegendők az előrejelzéshez, az ILP relációkat azonosít, amelyekkel a 
lineáris regresszió, a neurális hálók és a döntési fák képességein túltesz. King (King és 
társai, 1992) azt mutatta meg, hogy a különböző gyógyszerek gyógykezelési hatását 
hogyan lehetne előre jelezni. Ezen esetek mindegyikében úgy tűnik, hogy az ILP nagy 
hatékonyságához a relációk reprezentálási képessége és a háttértudás használata járul- 
nak hozzá. Az a tény, hogy az ILP által megtalált szabályokat az emberek is képesek 
interpretálni, inkább segíti ezeknek a technológiáknak az elfogadását a biológiai folyó- 
iratokban, mint a számítógépes tudománnyal foglalkozó folyóiratokban. 

Az ILP a biológián túl más tudományokhoz is hozzájárult. A legfontosabbak egyike 
a természetes nyelvfeldolgozás, ahol az ILP-t komplex relációs információ szövegek- 
ből való kinyerésére alkalmazták. Ezeket az eredményeket a 23. fejezet foglalja össze. 


19.6. ÖSSZEFOGLALÁS 


Ebben a fejezetben különböző módszereket vizsgáltunk meg arra vonatkozóan, hogy az 
előzetes tudás hogyan segítheti az ágenst abban, hogy új tapasztalatokból tanuljon. 
Mivel az előzetes tudás zöme inkább a relációs modellekkel, és nem atiribútumalapú 
modellekkel van megadva, a relációs modellekből tanuló rendszerekkel is foglalkoz- 
tunk. Az alábbiakban összefoglaljuk a fontos tudnivalókat. 


s Az előzetes tudás felhasználása a tanulásnál a kumulatív tanuláshoz (cumulative 
learning) vezet, ahol az ágens az új tudás beszerzésével javítja a tanulási képességét. 

" Az előzetes tudás segít a tanulásban, mert a különben konzisztens hipotéziseket eli- 
minálja, és a példák magyarázatának , kitöltésével" rövidebb hipotézisekhez vezet. 
Ezek a tulajdonságok javítják a tanulás minta- és számítási komplexitását. 
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" Az előzetes tudás által betöltött különböző — vonzatkényszerek (entailment con- 
straints) formájában kifejezett — logikai szerepeknek a megértése segít a különféle 
tanulási módszerek definiálásában. 

s A magyarázatalapú tanulás (MAT) (explanation-based learning, EBL) az egyedi 
példákból úgy emeli ki az általános szabályokat, hogy a példákat először megmagya- 
rázza, majd a magyarázatot általánosítja. Ezzel a deduktív módszerrel az elsődleges 
tudást hasznos, hatékony, speciális rendeltetésű szaktudássá változtatjuk. 

" A relevanciaalapú tanulás (RAT) (relevance-based learning, RBL) az előzetes 
tudást meghatározások formájában használja a releváns attribútumok azonosítására. 
Ily módon egy redukált hipotézisteret generál, és a tanulási folyamatot meggyorsítja. 
ARAT khetővé teszi az egyedi példák deduktív általánosítását is. 

" A tudásalapú induktív tanulás (TIT) (knowledge-based inductive learning, KBIL) 
induktív hipotéziseket keres, amelyek a háttértudás segítségével megmagyarázzák a 
megfigyelések halmazát. 

" Az induktív logikai programozási (ILP) (inductive logic programming) techni- 
kák a TIT-hez folyamodnak, az elsőrendű logikában kifejezett háttértudást felhasz- 
nálva. Az ILP-módszerek olyan relációs tudás megtanulására is alkalmasak, amelyet 
az attribútumalapú rendszerekben nem lehet kifejezni. 

s AzILP felülről lefelé megközelítéssel, a nagyon általános szabályok finomításával, 
vagy pedig lentről felfelé megközelítéssel, a deduktív folyamat invertálásával való- 
sítható meg. 

s: Az ILP-módszerek természetes módon generálnak új predikátumokat is, amelyekkel 
új elméletek tömören kifejezhetők, és általános célú tudományos elméletformáló 
rendszerekként is ígéretesnek mutatkoznak. 


Irodalmi és történeti megjegyzések 


Bár az előzetes tudás felhasználása a tanulásban természetes témának tűnhet a tudo- 
mányfilozófusok számára, mostanáig meglepően kevés formális eredmény született. 
Nelson Goodman filozófus a Fact, Fiction, and Forecast c. művében megcáfolta azt a 
korábbi feltételezést, miszerint az indukció nem más, mint egy univerzálisan kvantifikált 
kijelentés megfelelően sok példájának a megszemlélése és hipotézisként való elfogadá- 
sa (Goodman, 1954). 

Vegyük például azt a hipotézist, hogy , Minden smaragd zölék", ahol a zölék azt 
jelenti, hogy , zöld, ha r idő előtt figyeljük meg, utána azonban kék". A f idő előtt bármi- 
kor példák millióit láthatnánk, amelyek mind alátámasztják, hogy a smaragdok zölékek, 
negatív példák nélkül, mégis hezitálnánk a szabályt elfogadni. A jelenség csakis az 
indukciós folyamat szempontjából releváns a priori tudás szerepével magyarázható. 
Goodman a hasznosítható a priori tudás teljes választékát javasolja, a meghatározások 
túlzott hipotézisnek (overhypothesis) nevezett változatát is beleértve. Sajnos a gépi 
tanulással foglalkozó korai kutatásnál Goodman munkájára nem figyeltek fel. 

A MAT gyökerei a tervkészítésnél használt STRIPS módszereihez nyúlnak vissza 
(Fikes és társai, 1972). Egy terv elkészítésével a terv egy általánosított változatát a ter- 
vek könyvtárában tárolták, és később makróoperátorként (macro-operator) a tervkészí- 
tésnél felhasználták. Hasonló ötletek Anderson ACT? architektúrájában is megjelentek, 
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tudáskompilálás (knowledge compilation) címen (Anderson, 1983) és SOAR architek- 
túrájában tudásdarabolás (chunking) címen (Laird és társai, 1986). A sémabeszerzés 
(schema acguisitijon) (DeJong, 1981), az analitikus általánosítás (analytical generali- 
zation) (Mitchell, 1982) és a kényszeralapú általánosítás (constraint-based genera- 
lization) (Minton, 1984) a MAT tanulás irányában jelentkező és a (Mitchell és társai, 
1986; DeJong és Mooney, 1986) publikációk stimulálta gyorsan növekvő érdeklődés- 
nek közvetlen előfutárai voltak. A szövegben bemutatott MAT algoritmust Hirsh (Hirsh, 
1987) vezette be, aki azt is megmutatta, hogy az algoritmust hogyan kell egy logikai 
programozási rendszerbe ágyazni. Van Harmelen és Bundy a MAT-ot a programelemző 
rendszerekben (Jones és társai, 1993) használt részleges kiértékelő (partial evaluation) 
módszer variánsaként magyarázzák (Van Harmelen és Bundy, 1988). 

Az utóbbi időben a szigorú elemzés és a kísérleti kutatás a MAT jobb megértéséhez 
vezetett a problémamegoldás sebességében mért lehetséges költségeinek és előnyeinek 
terén. Minton azt mutatta meg. hogy hacsak tekintélyes munkát nem fektetünk bele, 
a MAT a programot lényegesen lelassíthatja (Minton. 1988). Tambe hasonló problé- 
mákkal küszködött a tudásdarabolásnál, és a szabálynyelv kifejezőerejének a mérsék- 
lését javasolta, hogy a szabályok munkamemóriához való illesztésének jelentős költségét 
minimálizáljuk (Tambe és társai, 1990). Erős a párhuzam ezen kutatás és az elsőrendű 
logika leszűkített változatának következtetési komplexitására vonatkozó jelenlegi ered- 
ményei között (lásd 9. fejezet). A MAT várható nyereségének formális valószínűségi 
elemzése a (Greiner, 1989; Subramanian és Feldman, 1990) munkákban található. Egy 
kiváló áttekintés Dietterichtől származik (Dietterich, 1990). 

Ahelyett hogy a példákat mint az általánosítás fókuszpontjait tekintenénk, új problé- 
mák megoldására közvetlenül felhasználhatók az analógiás következtetés (analogical 
reasoning) elnevezésű megközelítésben. Az ilyen következtetésnek több változata is 
létezik. [Idetartozik a hasonlóság mértékén alapuló plauzíbilis következtetés (Gentner, 
1983) és a meghatározásokon alapuló deduktív következtetés (Davies és Russell, 
1987), amely azonban megkívánja a példa jelenlétét ahhoz, hogy a belőle kialakított 
alusta" MAT a régi példa általánosítását az új probléma szükségletei szerint irányítsa. 
Az analógiás következtetésnek ezt az utóbbi formáját általában meg lehet találni az eset- 
alapú következtetésnél (case-based reasoning) (Kolodner. 1993) és a származtatási 
analógiánál (derivationai analogy) (Veloso és Carbonell, 1993). 

A releváns információval funkcionális függőségek formájában először az adatbázis- 
kutatásnál foglalkoztak, ahol ez a nagy attribútumhalmazok kezelhető részhalmazok- 
ra való strukturálásának eszköze volt. Funkcionális függőségeket analógiás következ- 
tetésre Carbonell és Collins, majd logikai színezettel Bobrow és Raphael használtak 
(Carboneli és Collins, 1973; Bobrow és Raphael, 1974). Davies és Russell (Davies, 
1985; Davies és Russell. 1987) a függőségeket másoktól függetlenül újra felfedezték, 
és az analógiás következtetés szempontjából teljes körű logikai elemzésnek vetették alá. 
A függőségeket deklaratív elfogultság céljából Russell és Grosof használták (Russell és 
Grosof, 1987). A meghatározások és a leszűkített szótárral rendelkező hipotézistér kö- 
zötti ekvivalenciát Russell (Russell, 1988) bizonyította be. A meghatározásokat tanu- 
ló algoritmust és az RADFT megnövelt hatékonyságát először a Focus algoritmusban 
mutatták be (Almuallim és Dietterich, 1991). Tadepalli a meghatározások tanulására 
egy ügyes algoritmust közölt, amely a tanulási sebességben igen lényeges javulást mu- 
tat (Tadepalli, 1993). 
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Az a gondolat, hogy az induktív tanulás kivitelezhető inverz dedukcióval W. S. 
Jevonsíg vezethető vissza (Jevons, 1874), aki azt írta, hogy: , Mind a formális logika, 
mind a valószínűség-elmélet tanulmányozása arra az álláspontra juttatott engem, hogy 
egy olyan dolog, mint egy külön indukciós módszer, a dedukcióval szembeállítva nincs, 
és az indukció egyszerűen a dedukció egy fordított alkalmazása." A számítástudomá- 
nyi elemzések Gordon Plotkin figyelemre méltó PhD-disszertációjával kezdődtek 
Edinburghban (Plotkin, 1971). Bár Plotkin számos, a mai ILP területén használt tételt 
és módszert dolgozott ki, az indukció egyes részproblémáira vonatkozó bizonyos el- 
dönthetetlenségi eredmények elvették a kedvét. A MIS (Shapiro, 1981) újból bevezette 
a logikai programok tanulási problémáját, azonban ezt főleg az automatikus hibakeresés 
elméletéhez való hozzájárulásának tekintették. A szabályindukció kutatása, vagyis az 
olyan rendszerek, mint az ID3 (Ouinlan, 1986) és CN2 (Clark és Niblett, 1989) a FOIL- 
hoz vezettek (Ouinlan, 1990), amely első ízben tette lehetővé relációs szabályok 
gyakorlati indukcióját. A területet Muggleton és Buntine pezsdítették fel (Muggleton és 
Buntine, 1988). CIGOL programjuk az inverz rezolúció nem egészen teljes változatát tar- 
talmazta, és új predikátumok generálására is alkalmas volt.5 A predikátum felfedezésé- 
vel Wirth és O"Rorke is foglalkoztak (Wirth és O"Rorke, 1991). A következő nagyobb 
rendszer a GOLEM volt (Muggleton és Feng. 1990), amely a Plotkin-féle relatíve leg- 
kevésbé általános általánosítás ötletén alapuló lefedő algorítmust használja. A For 
fentről lefelé módon, míg a CIGOL és a GOLEM lentről felfelé módon dolgoztak. E kor- 
szak más rendszerei az ITou (Rouveirol és Puget, 1989) és a CUNT (De Raedt, 1992) 
rendszerek voltak. Újabban a PROGOL (Muggleton, 1995) az inverz vonzatreláció egy 
hibrid (fentről lefelé és lentről felfelé) megközelítését valósította meg, és a rendszert szá- 
mos gyakorlati problémára alkalmazták, különösképpen a biológiában és a természetes 
nyelvfeldolgozásban. Muggleton a PROGOL egy kiterjesztését írja le (Muggleton, 2000), 
sztochasztikus logikai programok alakjában reprezentált bizonytalanság kezelésére. 

Az ILP-módszerek formális elemzését (Muggleton, 1991) tartalmazza, míg a (Muggle- 
ton, 1992) egy nagy cikkgyűjtemény. A módszerek és az alkalmazások nagy gyűjtemé- 
nye a (Lavrac és Dzeroski, 1994) könyv. A terület történetéről és a jövő kihívásairól 
újabb áttekintést ad (Page és Srinivasan, 2002). Haussler korai komplexitási eredményei 
azt sugallták, hogy az elsőrendű állítások tanulása reménytelenül bonyolult (Haussler, 
1989). A klózokra vonatkozó különböző szintaktikai korlátozások jobb megértésével 
azonban pozitív eredmények ís megjelentek, még a rekurziót tartalmazó klózokra is 
(Dzeroski és társai, 1992). Az ILP komplexitási eredményeiről Kietz és Dzeroski, vala- 
mint Cohen és Page írtak átfogó cikkeket (Kietz és Dzeroski, 1994; Cohen és Page, 1995). 

Bár az ILP jelenleg a konstruktív indukció problémájának domináló megközelítése, 
nem csak ezzel próbálkoztak. Az ún. felfedező rendszerek (discovery systems) célja 
az új koncepciók tudományos felfedezésének általában a koncepció definícióterében 
történő közvetlen keresés útján történő modellezése. Doug Lenat AM (Automated 
Mathematician) programja (Davis és Lenat, 1982) szakértő szabályok formájában meg- 
fogalmazott felfedező heurisztikákat használt arra, hogy elemi számelméleti koncep- 
ciók és sejtések keresését irányítsa. Éles ellentétben a matematikai következtetésre 
kifejlesztett rendszerekkel, az AM nélkülözte a bizonyítás fogalmát. és csak sejtés szin- 


5 Az inverz rezolúciós módszer (Russell, 1986)-ben is megjetenik, a teljes algoritmust egy lábjegyzetben 
közlik. 
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ten tudott működni. A program újra felfedezte a Goldbach-sejtést és az egyértelmű 
prímtényezőkre bontást. Az AM architektúráját később az EURISKO rendszerben (Lenat, 
1983) általánosították, a rendszert a saját felfedező heurisztikákat átírni képes szabá- 
lyokkal bővítve. Az EURISKO-t más, a matematikai felfedezéstől eltérő tartományokban 
is alkalmazták, de az AM-nél kisebb sikerrel. Az AM és az EURISKO módszertana vita- 
tott, lásd (Ritchie és Hanna, 1984; Lenat és Brown, 1984). 

A felfedező rendszerek egy másik csoportja a valós fizikai adatokkal való munkát 
célozza és új törvények felfedezését kísérli meg. A DALTON, a GLAUBER És a STAHL 
(Langley és társai, 1987) olyan szabályalapú rendszerek, amelyek fizikai rendszerekből 
származó adatokban kvantitatív összefüggéseket keresnek. Mindegyik rendszer képes 
volt egy tudomány történetéből jól ismert felfedezés újbóli meghozatalára. A proba- 
bilisztikus technikákon — különösképpen az új kategóriákat felfedező klaszterező algorit- 
musokon - alapuló felfedező rendszerekkel a 20. fejezetben foglalkozunk. 


Feladatok 


19.1. Mutassa ki a konjunktív normá! formába való átalakításával és a rezolúció alkal- 
mazásával, hogy a 799. oldalon található és a brazilokra vonatkozó konklúzió 
helyes. 


19.2. Az alábbi meghatározás mindegyikére írja fel a meghatározás logikai reprezentá- 

cióját, és magyarázza meg, hogy a meghatározás miért igaz (ha igaz egyáltalán). 

(a) A postai kód meghatározza a megyét. 

(b) A külső kialakítás és a névleges érték meghatározzák az érme tömegét. 

(c) Adott program esetén a bemenetek meghatározzák a kimeneteket. 

(d) A klíma, a táplálkozás, a fizikai gyakorlat és a metabolizmus meghatároz- 
zák, hogy valaki fogyni vagy súlyban gyarapodni fog. 

(e) A kopaszságot (vagy annak hiányát) az anyai ágon az egyik nagyszülőnek a 
kopaszsága határozza meg. 


19.3. Hasznos lenne a meghatározásoknak egy valószínűségi verziója? Javasoljon egy 
definíciót. 


19.4. Pótolja a C, és/vagy C, klózok értékét az alábbi klózhalmazban, figyelembe 
véve, hogy C a C) és a C) rezolvense: 
(a) C— Igaz 5 P(A, B), Ch — PGy) 
(b) C- Igaz 5 PRXA, B), C 
(c) C— P(x,y) 5 P(x, fly), Ci — 


Ha több megoldás is lehetséges, a különböző eseteket külön példákkal illusztrálja. 


19.5. Tegyük fel, hogy egy rezolúciós lépést végrehajtó logikai programot írunk. 
INHFIÉ Legyen tehát a Rezolválásíci, ca, c) sikeres, ha a c a cy és a cz rezolválásának az 
eredménye. Rendes körülmények között a Rezofválás-t a tételbizonyítás része- 
ként fogjuk használni úgy, hogy meghívjuk a c rezolvens generálására, miköz- 
ben a ci és a ca változóba konkrét klózértékeket helyettesítünk be. Tegyük most 
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19.6. 


19.7. 


fel, hogy az eljárást a behelyettesített c-vel és a szabad cj-gyel, valamint c2-vel 
hívjuk meg. Megszületik-e az inverz rezolúciós lépés helyes eredménye? Szük- 
séges-e a logikai program valamilyen speciális átalakítása, hogy az inverz lépés 





Tegyük fel, hogy a For. program egy klózhoz egy literált úgy add hozzá, hogy 
egy bináris P predikátumot használ, és hogy az előbbi literálok (a klóz fejrészét 
beleértve) öt különböző változót tartalmaznak. 

(a) Hány funkcionálisan különböző literált lehet generálni? A két literál funkci- 
onálisan egybeesik, ha csupán az általuk tartalmazott új változók neveiben 
különböznek. 

(b) Meg tudna adni általános képletet a különböző, r argumentummal rendelke- 
ző predikátumot használó literálok számának meghatározására, ha előzőleg 
n változót használtunk? 

(c) A For miért nem enged olyan literálokat használni, amelyek az előzőleg 
használt változókat nem tartalmazzák? 





A 19.IL. ábrán látható családfa adatainak vagy annak részhalmazának felhasz- 
nálásával alkalmazza az Őse predikátum megtanulására a FOIL algoritmust. 


20. STATISZTIKAI TANULÁSI 
MÓDSZEREK 


Ebben a fejezetben megfigyelések alapján történő bizonytalan következtetésnek tekint- 
jük a tanulást. 


Az V. részben rámutattunk, hogy a valós életre jellemző környezetben gyakran előfor- 
dul, hogy a tudás bizonytalan. Az ágensek a bizonytalanságot valószínűség- és döntés- 
elméleti módszerekkel tudják kezelni. de ehhez először tapasztalataik alapján fel kell 
állítaniuk a világra vonatkozó valószínűségi modelljüket. Ez a fejezet bemutatja, hogy 
milyen módon tudják ezt megtenni. Látni fogjuk, hogyan kell úgy formalizálni a tanulá- 
si feladatot, mint egy valószínűségi következtetési folyamatot (lásd 20.1. alfejezet). Be- 
mutatjuk, hogy a tanulás bayesi megközelítése rendkívül hatékony: általános megoldást 
ad a zaj, a túlilleszkedés és az optimális predikció problémáira. Továbbá figyelembe 
veszi azt a tényt, hogy a nem-egészen-mindentudó ágens soha nem tudhatja biztosan, 
hogy a világról alkotott melyik elmélet helyes, mégis döntéseket kell hoznia. 

A 20.2. és 20.3. alfejezetben valószínűségi modellek — elsősorban a Bayes-hálók — ta- 
nulási módszereit ismertetjük. A 20.4. alfejezet olyan módszereket tárgyal, amelyek spe- 
ciális minták tárolását és előhívását végzik. A 20.5. alfejezet a neurális háló (neural net- 
work) tanítással foglalkozik, míg a 20.6. alfejezet a kernelgépekkel (kernel machine). 
Emnek a fejezetnek egy része erősebben matematikai megközelítésű (feltételezi a több- 
változós analízis alapjainak ismeretét), bár az általános tanulságok megérthetők anélkül 
is, hogy elmerülnénk a matematikai részletekben. Hasznos lehet, ha az olvasó ezen a 
ponton először átnézi a 13. és a 14. fejezeteket, valamint az A) függeléket. 


20.1. STATISZTIKAI TANULÁS 


Az ebben a fejezetben használt alapvető koncepciók ismét az adat (data) és a hipoté- 
zis (hypothesis), éppúgy, mint ahogy a 18. fejezetben volt. Itt az adatok a tények 
(evidence) — ezek a területet leíró valószínűségi változók egy részének vagy mindegyi- 
kének egy konkrét megvalósulását jelentik. A hipotézis valamilyen valószínűségi elmé- 
let arról, hogy a világ adott területe hogyan is működik, ennek speciális esetei a logikai 
elmélettel leírt területek. 

Vegyünk egy nagyon egyszerű példát. Kedvenc , meglepetés" cukorkánk kétféle, 
meggy- (nyam-nyam) és citrom- (brrrr) ízben kapható. A cukorkagyártónak sajátos 
humora van, és mindegyik cukorkát - ízétől függetlenül — ugyanolyan átlátszatlan pa- 
Pírba csomagolja. Az édességet nagyon nagy zsákokban árulják, amelyekből ötféle van 
— kívülről megint csak megkülönböztethetetlenek egymástól: 
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hay: 19090 meggy 





2599 meggy - 759 citrom 
hs: 10099 citrom 


Egy adott új zsák cukorka esetén a H (hipotézist jelölő) véletlen változó a zsák típusát 
jelenti, lehetséges értékei A4-től Ais-ig terjednek. Természetesen H közvetlenül nem 
figyelhető meg. Ahogy a cukorkákat felbontjuk és megvizsgáljuk, adatokat gyűjtünk — 
amelyeket D,, Do, ..., Du jelöl. Mindegyik D; egy olyan véletlen változó, amelynek 
lehetséges értékei a meggy, illetve a citrom. Az ágens feladata, hogy jóslást adjon a 
következő cukorka ízére." Ez a nyilvánvalóan triviális feladat érdekes módon mégis jó 
betekintést nyújt a legfontosabb problémák közül többre is. Az ágensnek valóban elmé- 
letet kell alkotnia a világról, bár csak nagyon egyszerűt. 

A Bayes-tanulás (Bayesian learning) során egyszerűen kiszámítjuk minden egyes 
hipotézis valószínűségét az adatokra támaszkodva, majd ennek alapján adunk predik- 
ciót. Azaz nem egyetlen , legjobb" hipotézist használunk a predikcióhoz, hanem az ösz- 
szes hipotézist használjuk, valószínűségükkel súlyozva őket. Reprezentálja D az összes 
adatot, legyen d a megfigyelt értékek vektora, ekkor az egyes hipotézisek valószínűsé- 
gét a Bayes-szabállyal adhatjuk meg: 


P(kyld) — aP(djh,)P(h;) (20.D) 


Tegyük fel, hogy egy ismeretlen X mennyiségre vonatkozó predikció a célunk. Ebben 
az esetben: 


PCXId) — DPGK, hp)P(hk1) — TPCMJPCHA) (20.2) 


ahol azt feltételeztük, hogy az bázis hipotézis meghatároz X-re valamilyen eloszlást. 
Ez az összefüggés azt mutatja, hogy a predikció az egyes hipotézisekből adódó 
predikciók súlyozott összege. Maguk a hipotézisek tulajdonképpen a nyers adatok és a 
predikciók közti , közvetítők". A Bayes-megközelítésben a P(Aj) prior hipotézisek 
(hypothesis prior), illetve a hipotézisek mellett fellépő P(dlA,) adatvalószínűségek 
(likelihood) a kulcsmennyiségek. 

A cukorka példánkban azt feltételezzük, hogy a hi,..., hs a priori valószínűségei 
megfelelnek a gyártó reklámjában közölt (0,1, 0,2, 0.4, 0,2, 0,1) értékeknek. Az adatok 
valószínűségét e.f.e (angol rövidítése: i.i.d.) feltételezéssel számítjuk — azaz egyforma 
és független eloszlást (independently and identically distributed) teszünk fel, így: 


Ptdlh;) — [eh 20.3) 


Tegyük fel sétál hogy a cukorkás zsák valójában csupa raitromtípusú (hi5), és az első 
10 kibontott cukorka mind citromízű, ekkor P(d]hz) — 0. 510 mivel a Az típusú zsákok- 


1 A statisztikában jártasabb olvasó felismeri, hogy ez a példa valójában az urna és golyó (urn and ball) fel- 
adat változata. Úgy találtuk, hogy az urna és a golyó kevesebb kihívást jelent, mint a cukorka, továbbá a cukor- 
ka példa elvezet egy másik feladathoz — elcseréljük-e a zacskót egy barátunkkal, vagy sem (lásd 20.3. feladat). 
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ban a cukorkák fele citrom.? A 20.1. (a) ábra mutatja, hogyan változik az öt hipotézis 
a posteriori valószínűsége, ahogy sorban észleljük a 10 citromízű cukorkát. Vegyük 
észre, hogy a valószínűségek az a priori értékekről indulnak, ennek megfelelően kez- 
detben A; a legvalószínűbb lehetőség, és ez így is marad még az első cukor felbontása 
után is. A második citromízű cukorka felbontása után Ay a legvalószínűbb, 3 és több 
esetén As (a rettegett csupa citrom zsák). 10 citromízű cukorka után már meglehetősen 
biztosak vagyunk végzetünket illetően. A 20.1. (b) ábra mutatja annak a (20.2) egyen- 
let alapján jósolt valószínűségét, hogy a következő cukorka citromízű. Várakozásunk- 
nak megfelelően monoton növekszik az 1 felé. 
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20.1. ábra. (a) A (20.1) egyenletből számított P(hild4,....djy) a posteriori valószínűségek. A megfigyelé- 
sek száma 1-től 10-ig terjed, és mindegyik megfigyelés cítromízű cukorka. (b) A (20.2) egyenlet alapján 
számított Pld — citrontdj,...d) Bayes-predikció. 


Példánk azt mutatja, hogy a Bayes-predikcióban az igaz hipotézis végülis dominánssá 
válik. Ez jellemző a Bayes-tanulásra. Bármilyen rögzített priorra, amely nem zárja ki a he- 
lyes megoldást, a hamis hipotézisek a posteriori valószínűsége végülis nullához tart. En- 
nek egyszerűen az az oka, hogy elhanyagolhatóan kicsi annak valószínűsége, hogy vég- 
telen ideig , nem jellemző" adatokat generáljunk. (Ezen a ponton érvelésünk hasonló a 18. 
fejezetben, a VKH-tanulásnál alkalmazottal.) Ennél is fontosabb, hogy a Bayes-predikció 
optimális, akár kicsi, akár nagy adathalmazunk van. Adott a priori hipotéziseloszlás mel- 
lett bármely más predikció ritkábban lesz helyes, mint a Bayes-predikció. 

A Bayes-tanulás optimalitásának természetesen ára van. Mint a 18. fejezetben láttuk, 
a valós tanulási problémáknál a hipotézistér rendszerint nagyon nagy vagy végtelen. 
Néha a (20.2) egyenletben az összegzés (vagy folytonos esetben az integrálás) pontos 
elvégzése kezelhető problémára vezet, de a legtöbb esetben közelítő vagy egyszerűsí- 
tett megoldásokra kell szorítkoznunk. 

Nagyon elterjedt approximációs módszer — a tudományos feladatokban rendszerint ezt 
alkalmazzuk —, hogy egyetlen, a legvalószínűbb hipotézis alapján végezzük a predikciót, 


2 Korábbiakban leszögeztük, hogy a cukorkás zsákok nagyon nagyok, másképp az e.fe. feltétet nem áll 
fenn. Korrektebb lenne (de kevésbé higiénikus) feltételezni, hogy minden vizsgálat, kóstolás után visszacsoma- 
goljuk a cukorkát, és visszatesszük a zsákba. 
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azaz olyan h; alapján, amely maximálja a P(h]ld)-t. Ezt maximum a posteriori vagy 
MAP hipotézisnek nevezzük. A MAP hipotézis alapján végzett predikciók közelítőleg 
Bayes-predikciók. Ez a közelítés annyira jó, amennyire jó a P(XId) sz PCOXIhmap köze- 
lítés. A cukorka példánkban három egymás utáni citromízű cukor észlelése után Huap 
— hs, így a MAP-tanulás alapján a negyedik cukorra 1,0 valószínűséggel citromízűt jó- 
solunk. Ez nyilván sokkal veszélyesebb jóslat, mint a Bayes-predikció, amely 0.8 
valószínűségű, ahogy a 20.1. ábrán is láthatjuk. Ahogy egyre több adatunk van, a MAP 
és Bayes-predikciók egyre inkább konvergálnak egymáshoz. mivel a MAP hipotézis 
alternatívái egyre kevésbé valószínűvé válnak. Bár példánk ezt nem mutatja, de a MAP 
hipotézis előállítása sokszor lényegesen egyszerűbb, mint a Bayes-tanulásé. Ennek oka, 
hogy csupán egy optimalizálási probléma megoldását igényli, szemben egy nagyon 
nagy összegzési (vagy integrálási) problémával. A fejezet későbbi részében majd látunk 
példákat erre. 

Mind a Bayes-tanulásban, mind a MAP-tanulásban a P(h;) a priori hipotézis való- 
színűségek nagy szerepet játszanak. Láttuk a 18. fejezetben, hogy túlilleszkedés 
(overfitting) léphet fel, ha túlzottan nagy a hipotézistér kifejezőképessége, vagyis túl 
sok olyan hipotézist tartalmaz, amely jól illeszkedik az adatokra. A Bayes- és a MAP- 
tanulás nem alkalmaz valamilyen önkényes korlátot a figyelembe vett hipotézisekre, 
inkább az a priori valószínűségeket használják fel arra, hogy büntessék a hipotézisek 
komplexitását. A komplex hipotéziseknek tipikusan kisebb az a priori valószínűsége — 
részben azért, mert sokkal több komplex hipotézis van, mint egyszerű. Másrészről a 
komplex hipotéziseknek nagyobb kapacitása van az adatokra való illeszkedéshez. 
(Extrém esetet véve egy táblázat 1,0 valószínűséggel és tökéletes pontossággal repro- 
dukálni tudja az adatokat.) Ennek megfelelően az a priori valószínűségben testesül 
meg a hipotéziskomplexitás és az adatokra való illeszkedési képesség közötti kompro- 
misszum. 

Ezt a kompromisszumot a logikai esetben figyelhetjük meg legjobban, amikor is H 
csak dererminisztikus hipotéziseket tartalmaz. Ebben az esetben P(dJAt;) értéke akkor I, 
ha h; konzisztens az adatokkal, különben 0. A (20.1) egyenlet alapján azt látjuk, hogy 
hmar a legegyszerűbb logikai hipotézis tesz, amely konzisztens az adatokkal. Tehát a 
maximum a posteriori tanulás Ockham borotvájának egy természetes megvalósulása. 

A hipotéziskomplexitás és az adatokra való illeszkedési képesség közötti kompro- 
misszumot új módon világítja meg, ha a (20.1) egyenlet logaritmusát képezzük. A huAp 
hipotézis olyan kiválasztása, amely maximálja a P(djA)P(h;)-t ugyanaz, mint amikor 
minimalizáljuk a következő kifejezést: 

—Iog; P(dlh,)—log; P(h;) 


Használjuk fel az információkódolás és a valószínűség között a 18. fejezetben beve- 
zetett kapcsolatot. Azt látjuk, hogy a -og2P(h;) tag nem más, mint a h; hipotézis spe- 
cifikátásához szükséges bitek száma. A -log; P(d]A)-tag viszont azoknak a további 
biteknek a száma, amelyek ahhoz szükségesek, hogy az adott hipotézis feltételezésével 
specifikáljuk az adatokat. (Ennek demonstrálására mutatjuk be azt az esetet, amikor a 
hipotézis pontosan megjósolja az adatokat, ilyenkor nincs szükség egyetlen bitre sem 
az adatok specifikálásához. Ilyen például a As hipotézis esete, amikor sorban érkeznek 
a citromízű cukorkák — és valóban log; 1 — 0.) Ebben az értelemben a MAP-tanulás jel- 
lemzője, hogy maximálisan tömöríti az adatokat. Ezt a feladatot sokkal közvetlenebbül 


1 
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célozza a minimális hosszúságú leírás (MHL ) (minimum description length, MDL) 
tanulási módszer, amely a valószínűségekkel való foglalkozás helyett a hipotézis mére- 
tének és az adat kódolásának minimalizálására törekszik. 

Az utolsó egyszerűsítést az adja. ha a hipotézistérben egyenletes (uniform) priort 
feltételezünk. Ebben az esetben a MAP-tanulás egy olyan A; választására redukálódik, 
amely maximálja P(dlA;) -t. Ezt maximum-likelihood (ML) hipotézisnek nevezzük, és 
huu-lel jelöljük. A maximum-likelihood tanulás nagyon elterjedt a statisztikában. Ez 
egy olyan tudomány, amelynek sok kutatója nem bízik az a priori hipotézisek szubjek- 
tív természetében. Ez józan megközelítés akkor, amikor nincs semmi okunk, hogy 
a priori kitüntessük az egyik hipotézist egy másikkal szemben, például amikor az ösz- 
szes hipotézis egyformán komplex. Az ML-tanulás jó közelítését adja a Bayes- és 
MAP-tanulásnak olyankor, amikor az adathalmaz nagy. hiszen az adatok végül is felül- 
írják a hipotézisek a priori eloszlását, de kis adathalmazok esetén problémák merülnek 
fel az alkalmazásánál (mint látni fogjuk). 
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A statisztikai tanulási módszerek tárgyalását a legegyszerűbb feladattal kezdjük: para- 
métertanulás (parameter learning) teljes adat (complete data) alapján. A paramé- 
tertanulás egy rögzített struktúrájú valószínűségi modell paramétereinek megtalálását 
foglalja magában. Például meg akarjuk tanulni egy adott struktúrájú Bayes-háló felté- 
teles valószínűségeit. Az adatokat akkor nevezzük teljesnek, ha mindegyik adatpont 
értékeket hordoz a megtanulandó valószínűségi modell mindegyik paraméterére. A tel- 
jes adatok nagyban egyszerűsítik a komplex modellek paramétereinek tanulását. Nagy 
vonalakban áttekintjük majd a struktúratanulás problematikáját is. 


Maximum-likelihood paramétertanulás: diszkrét modellek 


Tegyük fel, hogy új gyártótól vásárolunk egy zsák cítrom- és meggycukorkát, a meggy- 
arány teljesen ismeretlen, bárhol lehet 0 és 1 között. Ez esetben kontinuum számosságú 
hipotézisünk van. A paraméter (parameter), amelyet 6-val jelölünk, most a meggy- 
cukorkák aránya, a hipotézis pedig hp. (A citromízűek aránya egyszerűen 1 — 8.) Ha fel- 
tételezzük, hogy a priori minden arány egyformán valószínű, akkor a maximum- 
likelihood megközelítés az ésszerű. Ha Bayes-hálóval modellezzük a helyzetet, akkor 
csupán egyetlen véletlen változóra van szükségünk. Legyen ez az Íz nevű változó 
(a zacskóból véletlenszerűen választott cukorka íze). Lehetséges értékei a meggy és a 
citrom, ahol a meggy valószínűsége € (lásd 20.2. (a) ábra). Tegyük fel, hogy kibontunk 
N cukorkát, amelyek közül c meggyízű és (— N — c citromízű. A (20.3) egyenlet alap- 
ján ennek a speciális adathalmaznak a valószínűsége: 





N 
P(djho) — TI P(d lo) — 07-1— 0)" 
szi 
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20.2. ábra. (a) Bayes-háló modell az ismeretlen arányban citrom-. illetve meggyízű cukorkák esetére. 
(b) Annak a modellje, amikor a csomagolópapír színe függ (valószínűségi alapon) a cukorka ízétől. 


A maximum-likelihood hipotézist az a 0 érték adja, amely maximálja ezt a kifejezést. 
Ugyanezt az értéket kapjuk, ha a log likelihood függvényt maximáljuk. 


N 
L(dlha) — log P(dho) — 3 "log P(d lg) — clog 0-4 Clog(1— 8) 
j-I 
(A kifejezés logaritmusát képezve a szorzatot szummává redukáltuk, amit rendszerint 
egyszerűbb maximálni.) A maximum-likelihood 8 érték megtalálása érdekében diffe- 
renciáljuk L-et ? szerint, a kapott kifejezést pedig tegyük egyenlővé nullával: 


dc e eg eg ötlezés 
d8 0 1-0 ec46e ON 


Magyarán a hw maximum-likelihood hipotézis azt állítja, hogy a zacskóban a meggy- 
ízű cukorkák valós aránya megegyezik az eddig kibontott cukorkáknál megfigyelt 
aránnyal! 

Úgy tűnik, rengeteget dolgoztunk, hogy felfedezzünk egy nyilvánvaló eredményt. Va- 
lójában lefektettünk egy standard módszert a maximum-likelihood paramétertanulásra: 


1. Írjunk fel egy - a paraméterfek)től függő — kifejezést az adatok együttes valószínű- 
ségére (írjuk fel a likelihood függvényt). 

FA Írjuk fel minden egyes paraméter szerint a log likelihood függvény deriváltját. 

3. Keressük meg azokat a paraméterértékeket, amelyek mellett a deriváltak nulla érté- 
ket vesznek fel. 


A legtrükkösebb lépés általában az utolsó. Az előző példánkban triviálisan megold- 
ható volt, de látni fogjuk, hogy sokszor iteratív megoldásokhoz vagy más numerikus 
optimalizálási technikákhoz kell folyamodnunk, mint ahogy a 4. fejezetben tárgyaltuk. 
A példa a maximum-likelihood tanulás egy általános problémáját is illusztrálja: ha az 
adathalmaz elég kicsi ahhoz, hogy néhány eseményt még nem figyeltünk meg — például 
nem találtunk még meggyízű cukorkát —, akkor a maximum-tiketihood hipotézis nulla 
valószínűséget rendel ezekhez az eseményekhez. Számos trükköt használnak, hogy 
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elkerüljék ezt a problémát, mint például minden esemény kezdeti valószínűségét 1-re 
állítják nulla helyett. 

Nézzünk egy másik példát. Tegyük fel, hogy a cukorka gyártója némi információt 
akar adni a fogyasztónak, ezért piros és zöld csomagolópapírt használ. A Csomagoló 
mindegyik cukorkához véletlenszerűen kerül kiválasztásra, valamilyen ismeretlen — az 
íztől függő — feltételes valószínűség-eloszlás szerint. Az ehhez tartozó valószínűségi 
modellt a 20.2. (b) ábra mutatja. Vegyük észre, hogy három paramétere van: 8, 0) és 92. 
Ezekkel a parméterekkel a Bayes-hálók standard szemantikáját használva megadható 
annak a valószínűsége, hogy — mondjuk — egy meggyízű cukorkát találunk egy zöld 
csomagolóban (581-582. oldal): 


P(Íz — meggy, Csomagoló — zöldihe. ee) 
— P(Íz — meggyiho, a e)P(Csomagoló — zöldlíz — meggy, hoo) 
-81-0p 
Most kibontunk W cukorkát, amelyek közül c meggyízű és ( citromízű. A csomago- 
lásfajták számai a következők: r, meggyízű volt pirosba csomagolva és ge zöldbe, 
míg r,citromízű volt pirosba csomagolva, míg g/ zöldbe. Ezen adatok együttes való- 
színűsége: 
P(dlho, apo) — 9" — 0ÉBfe (1 — BYE-OZ (1 — 8798 
Ez meglehetősen ijesztőnek tűnik, de segít, ha a logaritmusát vesszük: 
L — [clog8 4 (og(1 —0)) - [re fogd1 4 ge l0g(1— 00) - [r10g92 4- gy log(1 — 820] 


A logaritmusképzés előnye nyilvánvaló: a log likelihood függvény három tag összege, 
ahol mindegyik tag csupán egyetlen paramétert tartalmaz. Amikor sorban mindegyik 
paraméter szerint vesszük az összefüggés deriváltját. majd nullává tesszük a derivál- 
takat, három független egyenlethez jutunk, és mindegyik csupán egyetlen paramétert 
tartalmaz: 











eze E ző - 0-— 
09 0 1-8 feni 
ÖL te Be 3 
ze HE!) - 9 — 

08) 8) 1-8 ! o tt8e 
ÖL 0 nr 81 lő 
EZ ves 0 et És 

00, 82 1-8, 2 rErn 


A 6-ra kapott megoldás ugyanaz, mint az előbb. A €/-re kapott megoldás, tehát an- 
nak valószínűsége, hogy egy meggyízű cukorka piros papírba csomagolt, nem más, 
mint a megfigyelt meggyízű cukorka — piros papír arány, hasonló a helyzet 
02-vel. 

Ezek az eredmények nagyon kényelmesek, és könnyen belátható, hogy kiterjeszthe- 
tők bármely Bayes-hálóra, amelynek feltételes valószínűségeit táblázatokkal adjuk 
meg. A legfontosabb eredmény a következő: teljes adatok esetén a Bayes-háló paramé- 
tertanulási problémája elkülönülő tanulási problémákra dekomponálható, egy-egy 
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probléma egy-egy paraméterre. A második eredmény, hogy az egyes paraméterek 
adott szülő melletti értékei éppen a szülőértékek mellett megfigyelt gyakoriságokkal 
egyeznek meg. Éppúgy, mint az előző helyzetben, itt is óvatosnak kell lennünk, hogy 
kis adathalmazok esetén el tudjuk kerülni a nulla értékeket. 


Naiv Bayes-modellek 


Valószínűleg a gépi tanulás területén használt legelterjedtebb Bayes-háló modell a 
naiv Bayes-modell (naive Bayes). Ebben a modellben a C , osztályváltozó" (amelyet 
meg akarunk jósolni) a gyökér, míg az X; attribútumváltozók a levelek. A modell azért 
Naiv", mert feltételezi, hogy adott osztály mellett az attribútumok feltételesen függetle- 
nek egymástól. (A 20.2. (b) ábra modellje egy egyváltozós naiv Bayes-modell.) Logikai 
változókat feltételezve a paraméterek: 


07 P(C — igaz), B — P(X; — igazlC — igaz), 4, — P(X; —igazIC — hamis) 


A maximum-likelihood paramétereket pontosan úgy kapjuk meg, mint a 20.2. (b) ábra ese- 
tén. Ha a modellt ezen az úton megtanítottuk, akkor felhasználható arra, hogy olyan új pél- 
dákat osztályozzon, amelyekre a C osztályváltozó nem ismert. A megfigyelt Xi, ..., xy, 
attribútumértékek mellett az egyes osztályok valószínűségét a következő összefüggés adja: 


P(Clx1,..s Xn) — APR(OTTPC1O) 


i 
Ha a legvalószínűbb osztályt választjuk, determinisztikus predikció adható. A 20.3. ábra 
mutatja a módszer tanulási görbéjét, ha a 18. fejezet étterem problémájára alkalmazzuk. 
A módszer elég jól tanul, de nem olyan jól, mint egy döntési fa tanulás. Ennek oka való- 
színűleg az, hogy a helyes hipotézis — ami egy döntési fa — nem reprezentálható ponto- 
san naiv Bayes-modellel. A naiv Bayes-tanulás sok alkalmazási területen meglepően jól 
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20.3. ábra. A 18. fejezet étterem problémájára alkalmazott naiv Bayes-tanulás tanulási görbéje A dön- 
tési fa tanulás tanulási görbéjét összehasonlítás céljából ábrázoltuk. 


3 Nem táblázatos formára lásd a 20.7. feladatot, amelyben mindegyik paraméter hatással van számos felté- 
teles valószínűségre. 
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teljesít, a fokozott teljesítményű, turbó változata (boosted version) egyike a leghatéko- 
nyabb általános célú tanuló algoritmusoknak (lásd 20.5. feladat). A módszer nagyon 
nagy méretű problémákhoz is jól alkalmazható, n logikai változó esetén is csak 2n -k 1 
paramétere lesz, és ahhoz, hogy a naiv Bayes-tanutás meghatározza hwy-t, nincs szük- 
ség keresésre. Végül a naiv Bayes-tanulásnak nem jelentenek gondot a zajos adatok, to- 
vábbá ha szükséges, akkor képes valószínűségi predikciókat is adni. 


Maximum-likelihood paramétertanulás: folytonos eset 


A 14.3. alfejezetben vezettük be a folytonos valószínűségi modelleket, mint például a 
lineáris Gauss- (linear-Gaussian) modelleket. Mivel a valós alkalmazásokban minde- 
nütt folytonos változókkal találkozunk, fontos ismernünk a folytonos modellek adatok- 
ból történő megtanulásának módszereit. A maximum-likelihood tanulás elvei azonosak 
a diszkrét esetre vonatkozó tanulás elveivel. 

Kezdjük egy rendkívül egyszerű esettel: egyetlen skalár változó Gauss-sűrűségfüggvé- 
nyének a paramétereit tanuljuk. Azaz az adatokat a következő összefüggéssel generáljuk: 


. 6-3 
e 27 
V2ra 


A modell paraméterei a ,: átlag és a c szórás. (Vegyük észre, hogy a normalizáló kons- 
tans is függ 9-tól, ezért nem hanyagolhatjuk el.) Legyenek a megfigyelt értékek 
XI. XN. Ekkor a log likelihood: 


P(x) — 
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A deriváltakat szokásos módon nullává téve a következőket kapjuk: 


mezo 


N 
(ax. 
—t 23 (20.4) 
N 


Tehát az átlag maximum-likelihood becslése a mintaátlag, a szórás maximum-likeli- 
hood becslése pedig a minta átlagos szórásnégyzetének négyzetgyöke. Ezek ismét ked- 
vező eredmények, mivel megerősítik a , józan ésszel" követett gyakorlatot. 

Vizsgáljunk most egy lineáris Gauss-modellt, amelyben egy X folytonos szülő és Y 
folytonos gyermek van. Mint az 589. oldalon megmutattuk, Y Gauss-eloszlású, átlaga 
lineárisan függ X-től, míg varianciája rögzített. A P(XIF) feltételes eloszlás tanulásához 
maximalizálhatjuk a feltételes likelihood függvényt: 
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204. ábra. (a) Egy y — (8) 4 [/i 482) egyenlettel leírható lineáris Gauss-modell additív, rögzített varian- 
ciájú Gauss-zajjal. (b) E modell alapján generált 50 adatpontból álló halmaz. 


Itt a paraméterek 81, 02 és a. Mint a 20.4. ábrán szemléltettük, az (xj, yj) párok 
gyűjteménye adja az adatokat. A szokásos módszereket használva (lásd 20.6. feladat) 
megkaphatjuk a paraméterek maximum-likelihood értékeit. Itt most egy másik dolgot 
akarunk megmutatni. Vegyük csupán a 9) és 0, paramétereket. amelyek az x és y köz- 
ti lineáris összefüggést definiálják! Nyilvánvaló, hogy a log likelihood ezen paramé- 
terekkel történő maximalizálása azonos azzal, mintha a (20.5) kifejezésben a kitevő 
számlálóját minimalizálnánk: 


N 
E-Y0j-tön raj 
Jj-I 


Az (yj — (Bixj -- 02) mennyiség valójában az (x, y;) hibája (error) — azaz a tényleges yj 
érték és a becsült érték különbsége. Így E nem más, mint a jól ismert hibanégyzetek 
összege (sum of sguared errors). Ezt a standard lineáris regresszió (linear regression) 
minimalizálja. Most megérthetjük, hogy miért: a hibanégyzetek összegének minimalizá- 
lása nem más, mint a maximum-likelihood lineáris (egyenessel ábrázolható) modell 
megadása, feltéve, hogy az adatokat rögzített varianciájú Gauss-zaj mellett generáltuk. 


Bayes-paramétertanulás 


A maximum-likelihood tanulás alkalmat ad néhány nagyon egyszerű eljárás létrehozá- 
sára, de kis adathaimazok esetén súlyos hiányosságokat mutat. Például egyetlen 
meggyízű cukorka észlelése után az a maximum-likelihood hipotézis, hogy a csomag 
10099-a meggytípusú (azaz 9 — 1,0). Ha nincs olyan hipotézis prior, hogy a csomagok 
mind vagy csupa meggy-, vagy csupa citromtípusúak, akkor ez nem józan következte- 
tés. A Bayes-megközelítésű paramétertanulás egy hipotézis priort állít fel a lehetséges 
paraméterértékekre, és ahogy az adatok érkeznek, úgy frissíti az eloszlást. 

A 20.2. (a) cukorka példának egyetlen 8 paramétere van; annak valószínűsége, hogy 
egy véletlenszerűen kiválasztott cukorka meggyízű. Bayes-megközelítésben 9 a 8 
valószínűségi változó (ismeretlen) értéke, a hipotézis prior pedig nem más, mint a P(8) 
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(a) (b) 
20.5. ábra. Példák a béta[a,b] eloszlásra különböző [a,b] értékek esetén 


a priori eloszlás. Így P(O — 0) annak a priori valószínűsége, hogy a csomag 8 arányban 
tartalmaz meggyízű cukrokat. 

Ha a 8 tetszőleges értéket felvehet 0 és 1 között, akkor a P(O)-nek egy folytonos el- 
oszlásnak kell lennie, amely csak 0 és 1 között nem nulla értékű, és integrálja 1. Egy 
lehetséges jelölt az egyenletes eloszlás P(g)—U10, 1] (4). (Lásd 13. fejezet.) Az egyen- 
letes eloszlás a béta-eloszlások (beta distributions) családjának tagja. Minden egyes 
béta-eloszlás két hiperparaméterrel? (hyperparameter) — a-val és b-vel — definiál- 
ható a következő egyenlet szerint: 


bétala,b] (0) — a0 7-1 (1-gb-! (20.6) 


A (20.6) megadja 6-ra a (0, I] tartományban a sűrűségfüggvény értékét. Az a. normáló 
konstans a-tól és b-től függ. (Lásd 20.8. feladat.) A 20.5. ábrán bemutatjuk, hogy hogyan 
néz ki az eloszlás különböző a-k és b-k esetén. Az eloszlás átlaga a/(a -- b), tehát nagyobb 
a értékek arra utalnak, hogy €-t 1-hez közelebb hisszük, mint 0-hoz. Az a 4 b nagyobb 
értékei az eloszlást csúcsosabbá teszik, ami a 8 értéke felőli nagyobb bizonyosságunkat je- 
lenti. Látható, hogy a béta-család a hipotézis prior lehetőségek hasznos választékát nyújtja. 

Rugalmasságán túl a béta-családnak van még egy csodálatos tulajdonsága: ha a 8 
priorja béta[a, b], akkor egy adatpont megfigyelése után € a posteriori eloszlása is béta- 
eloszlás. A béta-családot a logikai változók eloszlása konjugált priorjának (conjugate 
prior) nevezzük." Lássuk, hogyan is működik ez. Tegyük fel, hogy megfigyeltünk egy 
meggyízű cukrot. ekkor: 


P(OID , — meggy) — aP(D , — meggyi9)P(0) 
— a/0 - betafa.b](0) — a/9 -0711-g! 
7 a102(1-9)! — betala -- 1,bJ(0) 


4 Azért hívjuk hiperparamétereknek, mert 8 eloszlásának paramétereiről van szó, ahol 6 maga 15 egy para- 
méter. 

5 További konjugált priorok: a diszkrét többváltozós eloszlások paramétereire a Dirichlet család, a Gauss- 

eloszlások paramétereire a Normal-Wishart család. Lásd Bernardo és Smith (1994). 
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Tehát egy meggyízű cukrot észlelve egyszerűen inkrementáljuk az a paramétert, hason- 
lóképpen, ha egy citromízűt észlelünk, akkor inkrementáljuk a b paramétert — ezzel 
megkapjuk az a posteriori eloszlást. Ezek szerint úgy tekinthetünk a-ra és b-re, mint 
virtuális számlálókra (virtual counts), abban az értelemben, hogy a bétala, b) prior 
pontosan úgy viselkedik, mintha egyenletes eloszlású priorral indultunk volna, és a— 1 
meggycukorkát és b - I citromízű cukorkát láttunk volna. 

Tanulmányozva a béta-eloszlások sorozatát növekvő — de állandó arányú - a és b 
mentén, jól láthatjuk, hogyan változik a € paraméter a posteriori eloszlása az adatok 
beérkezése során. Tegyük fel például, hogy a vizsgált zacskó 7599-a meggytípusú. 
A 20.5. (b) ábra mutatja a béta[3, 1], bétal6, 2], béta[30, 10] eloszlássorozatot. Nyilván- 
való, hogy az eloszlás egy — a valós 8 körül elhelyezkedő — keskeny csúcs felé tart. 
Nagy adathalmazok esetén a Bayes-tanulás (legalábbis ebben az esetben) ugyanahhoz 
az eredményhez konvergál, mint amit a maximum-likelihood tanulás adott. 

A 20.2. (b) ábrán a hálónak három paramétere volt: 8, 0, és 02, ahol 0) volt annak 
valószínűsége, hogy piros csomagolás van egy meggycukorkán, míg 95 az, hogy egy 
citromízű cukron van piros csomagolás. A Bayes hipotézis priornak mindhárom para- 
métert le kell fednie — azaz P(OB,9,82)-t kell specifikálnunk. Rendszerint paraméter- 
függetlenséget (parameter independence) tételezünk fel: 

P(E,0e, 02) — P(EJP(Ap)P(O2) 

Ezen feltételezés esetén minden egyes paraméternek saját béta-eloszlása lehet, amelyet 
külön-külön frissíthetünk az adatok érkeztekor. 

Ha már az volt az ötletünk, hogy az ismeretlen paramétereket valószínűségi válto- 
zókkal reprezentáljuk — amilyen például 8 -, akkor természetes módon adódik, hogy 
azokat beépítsük magába a Bayes-hálóba. Ahhoz, hogy ezt megtehessük, minden egyes 





20.6. ábra. Egy Bayes-tanulásnak megfelelő Bayes-háló. A , €. 02 változók a posteriori eloszlásai 
kikövetkeztethetők az a priori eloszlásokból és az Íz;, Csomagoló; változókra vonatkozó tényekből. 
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példa leírásához másolatot kell készítenünk a változókról. Ha például három cukor- 
kát figyeltünk meg, akkor szükségünk van a következő változókra: Íza, Ízo, Ízz és 
Csomagoló, Csomagolóa, Csomagolóz. A 8 paraméterváltozó határozza meg minden 
egyes Íz; változó valószínűségét: 


P(Íz; — meggylb — 9) — 0 
Hasonlóképpen a csomagoló valószínűsége 81-től és 92-től függ. Például: 


P(Csomagoló; — piroslÍz; —meggy.8y — 8) — 9) 

Ezek után az egész Bayes-tanulási folyamat formalizálható egy megfelelően konstruált 
Bayes-háló következtetési problémájaként, amint a 20.6. ábrán látható. Egy új példány 
predikciója egyszerűen azt jelenti, hogy új példányváltozókat adunk a hálóhoz, amely- 
ből egyesekre rákérdezünk. A tanulás és a predikció ezen formalizmusa nyilvánvalóvá 
teszi, hogy a Bayes-tanuláshoz nem kell semmilyen extra , tanulási elv". Megállapíthat- 
juk továbbá, hogy lényegében csak egyetlen tanulási algoritmus van, ami a Bayes-háló 
következtetési algoritmusa. 


Bayes-hálóstruktúrák tanulása 


Az eddigiekben azt feltételeztük, hogy a Bayes-háló struktúrája ismert, és csak a paramé- 
tereket próbáljuk megtanulni. A háló struktúrája a terület alapvető oksági viszonyaira vo- 
natkozó tudást reprezentálja, amit sok esetben egy szakember, de még egy naiv felhasz- 
náló is, nagyon egyszerűen meg tud adni. Néhány esetben azonban az oksági összefüggé- 
sek nem állnak rendelkezésre vagy vitatottak — például bizonyos nagyvállalatok régóta ál- 
lítják, hogy a dohányzás nem okoz rákot. Ilyenkor fontos megérteni. hogy a Bayes-háló 
struktúrája mi módon tanulható meg az adatokból. Jelenleg a struktúratanulási algoritmu- 
sok gyerekcipőben jámak, ezért csak egy elnagyolt vázlatot adunk a legfontosabb elvekről. 

A legkézenfekvőbb megközelítés, ha egy jó modell érdekében keresést folytatunk. 
Elindulhatunk egy kapcsolatokat nem tartalmazó modellel, majd elkezdünk szülőcso- 
mópontot adni minden csomóponthoz, az előbbiekben bemutatott módszerekkel illeszt- 
ve a paramétereket, és mérjük a modell pontosságát. Másik lehetőség, hogy egy becsült 
struktúrával indulunk, és hegymászó vagy szimulált lehűtést alkalmazó algoritmusokat 
használunk a módosításokhoz, minden egyes struktúraváltoztatás után újrahangolva 
a paramétereket. A módosítások közé tartozik az élek megfordítása, hozzáadása, törlé- 
se. Nem szabad ciklusokat létrehoznunk a folyamat során, ezért sok algoritmus azt fel- 
tételezi, hogy adott a változók egy rendezése, és egy csomópont szülője csak azon 
csomópontok közül kerülhet ki, amelyek előbb jönnek a rendezésben (éppúgy, mint a 
14. fejezet konstrukciós eljárásában). A teljes általánosság kedvéért a lehetséges rende- 
zések között is keresnünk kell. 

Két alternatív módszer van arra, hogy észrevegyük, amikor egy jó megoldást talál- 
tunk. Az első annak tesztelése, hogy az aktuális adatok kielégítik-e azokat a feltételes 
függetlenségre vonatkozó állításokat, amelyek a struktúrában implicit módon benne 
vannak. Például az étterem probléma egy naiv Bayes-modellje feltételezi, hogy: 


P(Pénrek/ Szombat, BárlVárjunkE) — P(Péntek/ SzomtbatlVárjunkE)P(BárlVárjunkE) 
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és leellenőrizhetjük az adatokon, hogy ugyanez az egyenlet fennáll-e a megfelelő felté- 
teles gyakoriságok közt is. Viszont még akkor is, ha a struktúra a terület valós oksági 
természetét írja le, az adathalmaz — a statisztikai ingadozások miatt — az egyenletet soha 
nem elégíti ki pontosan. Ezért megfelelő statisztikai próbákat kell elvégeznünk, hogy 
eldöntsük: elég bizonyítékunk van-e arra, hogy a függetlenségi hipotézisek sérülnek, 
Az eredményül kapott háló bonyolultsága az ezen tesztekben alkalmazott küszöbtől 
függ majd — minél szigorúbb a függetlenségi teszt, annál több kapcsolatot adunk tnajd 
a struktúrához, és annál nagyobb lesz a túlilleszkedés veszélye. 

A jelen fejezetben bemutatott gondolatoknak jobban megfelelő megközelítés annak 
értékelése, hogy a javasolt modell mennyire magyarázza meg az adatokat (valószínűsé- 
gi értelemben). Mindamellett óvatosnak kell lennünk ennek mérésénél. Ha egyszerűen 
a maximum-likelihood hipotézist akarjuk megtalálni, akkor egy teljesen összekötött há- 
lónál fogunk kikötni, mivel további szülőcsomópontok hozzáadása egy csomóponthoz 
nem csökkentheti a valószínűséget (lásd 20.9. feladat). Valamilyen módon büntetnünk 
kell a modell bonyolultságát. A MAP (vagy MLH) megközelítés egyszerűen levon egy 
ezek után hasonlítja össze a különböző struktúrákat. A Bayes-megközelítés a struktú- 
rák és paraméterek együttes priorját használja. Rendszerint túl sok — a változók számán 
szuperexponenciális — struktúra van ahhoz, hogy mind felett összegezzünk, így a gya- 
korlatban legtöbben az MCMC (Markov lánc Monte Carlo) módszert használják, hogy 
mintát vegyenek a struktúrákból. 

A bonyolultság büntetése (akár MAP, akár Bayes-megközelítésben) fontos kapcsolatot 
hoz be az optimális struktúra és a feltételes valószínűségek hálóbeli reprezentációs mód- 
ja között. Táblázatosan ábrázolt eloszlás esetén a bonyolultság büntetése a szülőcsomó- 
pontok számával exponenciálisan nő, míg, mondjuk, zajos-VAGY eloszlások esetén csak 
lineárisan. Ez azt jelenti, hogy a zajos-VAGY (illetve más tömören paraméterezett) mo- 
dellek tanulása több szülőcsomópontot eredményez, mint a táblázatos eloszlás tanulása. 


20.3. REJTETT VÁLTOZÓKKAL TÖRTÉNŐ TANULÁS: 
AZ EM ALGORITMUS 


Az előző rész a teljesen megfigyelhető esettel foglalkozott. Számos valós problémában 
vannak rejtett változók (hidden variables), amelyeket néha latens változóknak (latent 
variables) is hívnak. Ezek nem figyelhetők meg a tanulás céljára rendelkezésre álló ada- 
tokban. Például az orvosi feljegyzések gyakran tartalmazzák a megfigyelt tüneteket, az 
alkalmazott kezelést, esetleg e kezelés eredményét, de ritkán tartalmazzák magának a be- 
tegségnek a közvetlen megfigyelését. Megkérdezhetnénk. ..ha a betegséget magát nem 
figyelhetjük meg, akkor miért nem állítunk fel egy modellt nélküle? A választ a 20.7. 
ábrán tüntettük fel, amely szívbetegségek egy kis, fiktív modelljét mutatja. Három haj- 
lamosító tényező és három megfigyelhető tünet van (amelyek túl nyomasztók ahhoz, 
hogy megnevezzük őket). Tegyük fel, hogy mindegyik háromféle értéket vehet fel 
(pl. nincs, közepes, súlyos). A rejtett változó eltávolítása az (a) hálóból a (b) hálóhoz 


5 Néhány feljegyzés tartalmazza az orvos által felállított diagnózist, de ez a szimptómák oksági következ- 
ménye, amit viszont a betegség okozott, 
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(a) (b) 


207. ábra. (a) A rejtett változónak feltételezett szívbetegség egyszerű diagnosztikai hálója. Minden 
egyes változónak három lehetséges értéke van, a változókat a feltételes eloszlásukban szereplő független 
változók számával címkéztük, a végső számuk 78. (b) A SzívBetegség eltávolításával készült ekvivalens 
háló. Vegyük észre, hogy a tünetváltozók most már nem feltételesen függetlenek, ha a szülőket megad- 
juk. Ez a háló 708 paraméten igényel. 


vezet; a paraméterek száma 78-ról 708-ra nő. Tehát a rejtett változók drámaian csökkent- 
hetik a Bayes-háló megadásához szükséges paraméterek számát. Ez viszont drámaian 
csökkentheti a paraméterek megtanulásához szükséges adatok mennyiségét. 

A rejtett változók fontosak, de bonyolítják a tanulási problémát. A 20.7. (a) ábrán pél- 
dául nem világos, hogy adott szülőcsomópontok esetén hogyan tanulható meg a 
SzívBetegség feltételes eloszlása, mivel nem ismert az értéke az egyes esetekben. Ugyan- 
ez a probléma fellép a tünetek eloszlásának tanulásánál is. Ebben a részben egy olyan — 
expectation-maximization,7 EM nevű — algoritmust ismertetünk, amely nagyon általá- 
nos megoldást ad erre a problémára. Három példát mutatunk be, majd általános leírást 
adunk. Ez az algoritmus először holmi mágiának tűnik, de amint a mögöttes intuíciót 
megértettük, a tanulási problémák hatalmas területén egy sor helyen alkalmazhatjuk. 


Nem ellenőrzött osztályozás: Gauss-eloszlások 
keverékének tanulása 


A nem ellenőrzött osztályozás vagy klaszterezés (unsupervised clustering) az a prob- 
léma, amikor objektumok valamilyen gyűjteményében több kategóriát különböztetünk 
meg. A probléma nem ellenőrzött, mivel a kategóriacímkék nincsenek megadva. Tegyük 
fel például, hogy felvesszük százezer csillag spektrumát. Az a kérdés, hogy a spektru- 
mok alapján vannak-e különböző típusú csillagok, és ha igen, akkor hányféle, és mik 
a jellemzőik? Mindannyian jól ismerünk olyan neveket, mint , vörös óriás" és . fehér tör- 
pe", de a csillagoknak nincs ilyen címke a kalapjukon — a csillagászoknak nem ellen- 
őrzött osztályozást kell végezniük ahhoz, hogy ezeket a kategóriákat felállítsák. Más pél- 
dák lehetnek: a fajok, nemek, rendek stb. azonosítása a Linné-féle taxonómiában vagy 
hétköznapi tárgyak természetes kategóriáinak megalkotása (lásd 10. fejezet). 


7 Az eljárást magyarul várhatóérték-képzés-maximalizás eljárásnak nevezhetnénk, de a magyar szakiro- 
alomban is az angol elnevezés terjedt el. (A szerk.) 
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A nem ellenőrzött osztályozás az adatokkal kezdődik. A 20.8. (a) ábra 500 adatpon- 
tot ábrázol, mindegyik két folytonos attribútum értékét adja meg. Az adatpontok meg- 
felelhetnek pl. csillagoknak, a két attribútum pedig pl. a spektrumvonalak erőssége két 
adott frekvencián. A következő lépés, hogy meg kell értenünk, milyen valószínűségi 
eloszlás generálhatta az adatokat. Az osztályozás azt feltételezi, hogy az adatok a P 
kevert eloszlásból (mixture distribution) származnak. Egy ilyen eloszlás k kompo- 
nensből (component) áll, amelyek mindegyike önmagában egy-egy eloszlás. Az adat- 
pont úgy jön létre, hogy először kiválasztjuk az egyik komponenst, majd ebből a kom- 
ponensből generálunk egy mintát. Jelöljük a C véletlen változóval a komponenseket, 
amely változó az I, ..., k értékeket veheti fel. A kevert eloszlást ekkor a 


k 
PGJ— YI P(C—DPx]JC—) 

1-1 
összefüggés írja le, ahol x jelenti az adatpont attribútumait. Folytonos adatok esetén a 
komponensekre természetesen adódik a többváltozós Gauss-eloszlás, ami az úgyneve- 
zett kevert Gauss- (mixture of Gaussians) eloszlás családot adja. A kevert Gauss- 
eloszlás paraméterei: w; — P(C — i) (az egyes komponensek súlya), zt ; (az egyes kom- 
ponensek várható értéke) E; (az egyes komponensek kovarianciája). A 20.8. (b) ábra 
három Gauss-eloszlás keverékét mutatja, valójában ez volt az (a) ábrán látható adathal- 
maz forrása. 

Ez esetben a nem ellenőrzött osztályozási probléma abban áll, hogy a 20.8. (a) ábrán 
látható nyers adatokból kell visszaállítani a 20.8. (b) ábrán láthatóhoz hasonló kevert 
modellt. Nyilvánvaló, hogy ha tudnánk, melyik adatot melyik komponens generálta, 
akkor könnyű lenne visszaállítanunk az egyes Gauss-komponenseket. Egyszerűen kivá- 
laszthatnánk az egyes komponensekhez tartozó összes adatpontot, majd alkalmazhat- 
nánk a (20.4) egyenletet (tulajdonképpen annak többváltozós verzióját) a Gauss-paramé- 
tereknek az adatokhoz való illesztésére. Másrészről, ha tudnánk az egyes komponensek 
paramétereit, akkor — legalábbis valószínűségi értelemben — meg tudnánk adni, hogy 
melyik adatpont melyik eloszláshoz tartozik. A probléma az, hogy sem az adatpontok 
komponensekhez rendelését, sem a komponensek paramétereit nem ismerjük. 
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20.8. ábra. (a) 500 kétdimenziós adatpont, amely három osztály jelenlétét sugallja. (b) Egy három-kom- 
Ponensű kevert Gauss-modell, a súlyok (balról jobbra) 0.2, 03 és 0.5. Az (a) ábrán látható adatokat eb- 
ből a modellből generáltuk. (c) Az adatokból az EM algoritmussal rekonstruált modell 
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Az EM algoritmus alapötlete ebben az összefüggésben az, hogy úgy teszünk, mintha 
ismernénk a modell paramétereit, majd kiszámítjuk minden egyes pont minden egyes 
komponenshez való tartozásának valószínűségét. Ezek után újraillesztjük a komponen- 
seket az adatokhoz: mindegyik komponenst a teljes adathalmazhoz illesztjük, az egyes 
adatpontokat az adott komponenshez tartozás valószínűségével súlyozva. Az eljárást 
a konvergencia elértéig folytatjuk. Lényegében , teljessé tesszük" az adatokat azzal, 
hogy a rejtett változók — melyik adat melyik komponenshez tartozik — valószínűségi 
eloszlását kikövetkeztetjük a pillanatnyilag használt modell segítségével. A kevert 
Gauss-eloszlás esetén a paramétereknek tetszőleges módon kezdeti értéket adunk. majd 
a következő két lépést ismételjük: 


1. E-lépés: Számítsuk ki a pj — P(C — ilxz valószínűségeket, amelyek azt fejezik ki, hogy 
milyen valószínűséggel generálta az i-edik komponens Xj-t. A Bayes-szabály alapján 
Pj - aPxlC — 9) RC — 0 A P(xjJC — i) tényező az x; valószínűsége az 
í-edik Gauss-eloszlásban, míg P(C — í) az i-edik Gauss-eloszlás súlya. Használjuk a 
D— 2 jPj definíciót. 

2. M-lépés: Számítsuk ki az új átlag, szórás és komponens súly paramétereket a követ- 
kezők szerint: 


a ep [Bi 
j 
ze pylxj aj /B; 
él 
WA 
Az E-lépés vagy expectation (várhatóérték-képzés) lépés úgy fogható fel, mintha a rejtett 
indikátor változó (indicator variables) Z;; valószínűségének pij várható értékét (expec- 
ted value) számítanánk ki. Ha az í-edik komponens generálta xj-t, akkor Z;; értéke I, 
különben pedig 0. Az M-lépés vagy maximization (maximumkeresés) lépés a rejtett 
változók adott várható értéke mellett megkeresi azokat a paramétereket, amelyek maxi- 
málják az adatokra felállított hog likelihood függvényt. 
A végső modellt — amelyet az EM segítségével a 20.8. (a) ábra adatain tanultunk — 
a 20.8. (c) ábra mutatja. Látszólag megkülönböztethetetlen attól az eredeti modelltől, 
amellyel az adatokat generáltuk. A 20.9. (a) ábra az adatoknak a pillanatnyi modell- 
ből számított log likelihood értékét mutatja az EM algoritmus futása során. Két pont- 
ra hívjuk fel a figyelmet. Először is, a végső modellre a log likelihood némileg meg- 
haladja az arra a valós modellre számított értéket, amelyekkel az adatokat generáltuk. 
Ez meglepőnek tűnhet, de egyszerűen azt mutatja, hogy az adatokat véletlenszerűen 
generáltuk, és nem pontosan tükrözik a mögöttes modellt. A második, hogy az EM 
minden iterációs lépésben növeli az adatok tog likelihood értékét. Ez általánosságban 
is bizonyítható. Továbbá bizonyos feltételek mellett belátható. hogy az EM biztosan 
eléri a likelihood egy lokális maximumát. (Ritka esetekben elérhet egy nyeregpontba, 
vagy akár egy lokális minimumba is.) Ebben az értelemben az EM egy gradiensalapú 
hegymászó algoritmusra emlékeztet, de vegyük észre, hogy nincs , lépésméret" para- 
métere! 
A dolgok nem mennek mindig olyan jól, mint ahogy a 20.9. (a) ábra esetleg sugallja. 
Előfordulhat, hogy az egyik Gauss-komponens úgy összezsugorodik, hogy csak egyetlen 
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20.9. ábra. Az L log likelihood értéknek - az EM iterációszámának függvényében való - alakulását 

bemutató görbék. A vízszintes vonal a helyes modellnek megfelelő log likelihood értéket mutatja. 

(a) A 20.8. ábrán látható kevert Gauss-modellre vonatkozó görbe. (b) A 20.10. (a) ábrán látható Bayes- 

hálóra vonatkozó görbe. 


adatpontot fed le. Ebben az esetben a varianciája nullához tart, a belőle számított likeli- 
hood pedig végtelenhez! Másik probléma lehet, hogy két komponens , összeolvad", azo- 
nos átlagot és varianciát vesz fel, az adatpontokon pedig osztoznak. Az ilyen típusú 
degenerált lokális maximumok súlyos problémát jelentenek, elsősorban sokdimenziós 
terekben, Ennek a problémának egyik megoldása lehet megfelelő priorok állítása a mo- 
dell paramétereire és az EM algoritmus MAP-változatának alkalmazása. Másik lehető- 
ség a komponens újraindítása új paraméterekkel, ha túl kicsivé válik vagy túl közel kerül 
más komponensekhez. A paraméterek ésszerű kezdeti értékei szintén segítenek a prob- 
lérna megoldásában. 


Rejtett változókkal felépített Bayes-hálók tanulása 


A rejtett változókkal felépített Bayes-hálók tanulásánál ugyanazokat a megközelítése- 
ket alkalmazzuk, amelyek jól működtek a kevert Gauss-eloszlásokra. A 20.10. ábra azt 
a helyzetet mutatja, amikor két zsák cukorkát összekevertek. A cukrokat három tulajdon- 
ság írja le, az Íz és a Csomagolás mellett néhánynál megjelenik egy Lyuk a cukorka 
közepén, másoknál pedig nincs lyuk. 

A cukorkák eloszlását minden egyes zsákban egy naiv Bayes-modell írja le; a tulaj- 
donságok adott zsák esetén függetlenek, de mindegyik tulajdonság feltételes valószínű- 
ség eloszlása függ a zsáktól. A következő paramétereink vannak: 8 annak az a priori 
valószínűsége, hogy a cukorka az 1. zsákból származik; 67, illetve 92 annak valószínű- 
sége, hogy a cukorka meggyízű, feltéve, hogy az 1., illetve a 2. zsákból származik; 801, 
illetve 8cs2 azokat a valószínűségeket jelölik, hogy a csomagolás piros; 64, illetve Éj 2 
pedig azokat a valószínűségeket, hogy a cukorka lyukas. Vegyük észre, hogy az egész 
modell egy kevert modell. (Valójában a kevert Gauss-eloszlásokat is modellezhetjük 
Bayes-hálóval, ahogy azt a 20.10. (b) ábra mutatja.) Az ábrán a zsák egy rejtett változó, 
mivel attól a pillanattól, hogy összekevertük a zsákok tartalmát, többet nem tudjuk meg- 
mondani egy cukorkáról, hogy melyik zsákból származott. Vissza tudjuk ebben az eset- 
ben nyemi a zsákok leírását, ha csupán az összekevert cukorkákat tudjuk megfigyelni? 
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20.10. ábra. (a) A cukorkák kevert modellje. A különböző ízű cukorkák, a csomagolások, valamint a 
lyukas cukrok aránya a zsáktól függ, amelyet nem figyelünk meg. (b) Egy kevert Gaussra vonatkozó 
Bayes-háló. Az X megfigyelhető változó átlaga és kovarianciája a C komponenstől függ. 


Vigyük végig az EM-iterációt erre a problémára. Először nézzük az adatokat. 1000 
mintát generáltunk a következő paraméterekkel rendelkező (valódi) modell alapján: 
8—-05,0n— Bcsi — Bryi — 08.02 — Bcs2 — 912 — 03 (20.7) 


Azaz a cukorkák egyforma valószínűséggel származhatnak mindkét zsákból, az első 
zsák nagyobbrészt meggyízű cukrokat tartalmaz piros csomagolásban, és sok köztük a 
lyukas, a második inkább nem lyukas citromízűeket, zöld csomagolásban. A lehetséges 
nyolecféle cukor előfordulási számai a következők: 


Cs — piros Cs z zöld 
Lyzl 
1— meggy 273 














t— citrom 79 




















A paraméterek alapértékre állításával kezdünk. A könnyű számíthatóság kedvéért a kö- 
vetkező értékeket választjuk: 


90 — 06, 6) - 0 


— g(0 09 90) 90 
ca [av 7-0.6. 017 — 869) — 2 704 


Hi (20.8) 
Először nézzük a 8 paramétert. A teljesen megfigyelhető esetben ezt közvetlenül az 
1. zsákból, illetve 2. zsákból származó cukorkák megfigyelt számaiból becsülnénk. 
Mivel a zsák rejtett változó, ehelyett a várható számértékekkel számolunk. A várható 
cukorkaszám Íi(Zsák —1) annak valószínűsége, az összes cukorkára összegezve. hogy 
a cukorka az 1. zsákból származik: 


8 gyakorlatban jobb véletlen értékeket választani, hogy elkerüljük a szimmetria által okozott lokális maxi- 
mumokat. 
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N 
99 — (Zsák —1/N — ) 7 P(Zsák —Ilíz csomagoló j . Eyukak ;)/N 
jel 
Ezek a valószínűségek a Bayes-hálókra kifejlesztett tetszőleges következtetési algoritmus- 
sal számíthatók. Naiv Bayes-hálókra, mint amilyen példánkban is szerepel, a következte- 
tés , kézzel" elvégezhető, a Bayes-szabály és a feltételes függetlenség felhasználásával: 
1. Prázjjzsák — UP(csomagolójíZsák — IPilyukakjlZsák — IP(Zsák z 1) 


N 7 EjPtízjlZsák — DP(csomagolójlZsák — DP(lyukakjlZsák — i)P(Zsák — I) 


FL 





(Figyeljük meg, hogy a normalizáló konstans szintén a paraméterektőli függ.) Alkal- 
mazva ezt a képletet, mondjuk, a 273 pirosan csomagolt meggyízű cukorkára, amelyek- 
ben lyuk van, a következőt kapjuk: 





0) (0) 90) 9(0 
273 LZTZSA ZEN CANTA ösze 
109 9(0) 9(0) 901 10) 9(0) 40) 0 
10007 egyetgalte 0 ar efpeéyotna— 0 


A számok táblázatában található másik bét cukorkafajtával folytatva, 0!) — 0,6124-et 
kapunk. 

Nézzük a további paramétereket, mint pl. $7-et. A teljesen megfigyelhető esetben ezt 
közvetlenül a megfigyelt, 1. zsákból származó meggy- és citromízű cukorkák számából 
becsülnénk. Az 1. zsákból származó meggycukorkák várható száma: 


2 P(Zsák-ilíz .j — meggy csomagoló j tyukak j) 
Jiíz, emeggy 


Ezek a valószínűségek ismét bármely Bayes-háló algoritmussal kiszámíthatók. Befe- 
jezve ezt az eljárást, megkapjuk az összes paraméter új értékét: 


9 — 0,6124, 8) —0.6684. 09) —0.6483. 640, —0.6558 
912 — 0.3887, 0£7, 03817, 6, —0,3827 (209) 


Az adatok log likelihood értéke a kezdeti kb. —2044-ről az első iteráció során kb. 
-2021-re nő, ahogy a 20.9. (b) ábrán látható. Eszerint a frissítés magát a likelihoodot 
kb. e? sz 109 szorzófaktorral növelte. A tizedik iterációra a megtanult modell jobban 
illeszkedik, mint a valódi (L — —1982,214). Ezek után a javulás nagyon lassúvá válik. 
Ez nem szokatlan az EM algoritmusnál, ezért sok gyakorlatban használt rendszer a 
tanulás végső fázisában gradiensalapú algoritmusokkal — mint pl. a Newton-Raphson- 
módszer (lásd 4. fejezet) — kombinálja az EM algoritmust. 

Az ebből a példából levonható általános tanulság az, hogy a rejtett változókkal tör- 
ténő Bayes-háló tanulásparamétereinek frissítése közvetlenül rendelkezésünkre áll 
az egyes példákon történő következtetés eredményeképpen. Ráadásul csak lokális 
a posteriori valószínűségekre van szükségünk az egyes paraméterekhez. Az általános 
esetben, amikor az egyes X; változók feltételes valószínűségi paramétereit — azaz 
204 — PCX; — X.IPa; — pay) értékeket — tanuljuk, adott szülőcsomópontok esetén, a 
frissítést a normalizált várható számértékek adják: 
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By — KEX; — xy, Paz — pay )/N (Pa; — pap) 
A várható számértékek a példák összegzésével nyerhetők, kiszámítva a P(X; — Xjj, 
Pa; — pay) valószínűségeket egy tetszőleges Bayes-háló következtetési algoritmussal. 
A pontos algoritmusok esetén — beleértve a változó eliminációt is — ezek a valószínűsé- 
gek mind a következtetés melléktermékeként közvetlenül nyerhetők, a tanuláshoz nincs 
szükség semmilyen speciális extra számításra. Sőt minden egyes paraméter tanulásához 
szükséges információ lokálisan rendelkezésre áll. 


Rejtett Markov-modellek tanulása 


Az EM algoritmus utolsó, itt bemutatott alkalmazása a rejtett Markov-modellek 
(RMM) (hidden Markov model, HMM) állapotátmenet-valószínűségeinek tanulása. 
Idézzük fel a 15. fejezetből, hogy a rejtett Markov-modellek olyan dinamikus Bayes- 
hálóval reprezentálhatók, amelyeknek egyetlen, diszkrét állapotváltozója van, amint ez 
a 20.11. ábrán is látható. Minden egyes adatpont egy véges hosszúságú megfigyelés- 
sorozatnak felel meg, tehát a megoldandó probléma az, hogy megfigyelési sorozatok 
halmaza (vagy esetleg egyetlen hosszú sorozat) alapján állapotátmenet-valószínűségeket 
kell megtanulnunk. 

Már kimunkáltuk, hogy mi módon tudunk Bayes-hálókat megtanulni, de van egy ne- 
hézség: a Bayes-hálóknál minden egyes paraméter elkülönül, a rejtett Markov-modellben 
viszont időben ismétlődnek az egyes 8; — P(X,,a — IX, — i) állapotátmenet-valószí- 
nűségek (annak valószínűsége, hogy a f időpillanatban az i-edik állapotból a j-edikbe 
jutunk), azaz 6, — 0 minden £-re. Ahhoz, hogy megbecsüljük az i-edik állapotból a 
J-edik állapotba való átmenet valószínűségét, egyszerűen kiszámítjuk azon esetek vár- 
ható arányát, amikor a rendszer az í-edik állapotban van és a j-edik állapotba megy: 


By NOX FIX EN zi) 
fi fi 
Ismét tetszőleges RMM következtetési algoritmust használhatunk a várható számértékek 


kiszámítására. A 15.4. ábrán bemutatott előre-hátra (forward-backward) algoritmus 
könnyen módosítható úgy, hogy kiszámítsa a szükséges valószínűségeket. Egy fontos 


szempont. hogy azokra a valószínűségekre van szükségünk, amelyeket inkább simítás- 


He 2 PARp] [A/5ARD] [TAR] [ALAKOT 
Po] TIT ZT PIRo)] 0.7 áf 07 if 07 zs ! 
07 h tt hl 03 h] 03 kh] 03 k]ú3] 
R[ PWo] RT avat [2] Awo] [2] Rua] [8.hAwo 
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20.11. ábra. Rejtett Markov-modellt reprezentáló kiterített dinamikus Bayes-háló (a 15.14. ábra meg- 
ismétlése) 
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Sal (smoothing) nyerünk, nem pedig szűréssel (filtering): azaz nekünk utólagosan kell 
értékelnünk a bizonyítékokat az adott állapotátmenet bekövetkezési valószínűségének 
becslésekor. Mint a 15. fejezetben mondtuk, a gyilkosság bizonyítékát általában a gyil- 
kosság bekövetkezte (azaz az i állapotból a j állapotba való átmenetet) után nyerjük. 


Az EM algoritmus általános alakja 


Számos példát láttunk az EM algoritmusra. Mindegyik tartalmazta azt a lépést, hogy ki- 
számítottuk a rejtett változók várható értékét minden példára, majd ezeket a várható ér- 
tékeket úgy használtuk, mintha megfigyelt értékek lettek volna, és segítségükkel újra- 
számoltuk a paramétereket. Legyen x az összes példában az összes megfigyelt érték, je- 
lölje Z az összes példában az összes rejtett változót, és legyen € a valószínűségi modell 
összes paramétere. Ekkor az EM algoritmus: 





gep — argmax 9 P(Z — z]jx 09) L(x.Z — 28) 
e z 


Az EM algoritmus dióhéjban ez az egyenlet. Az E-lépés az összegzés kiszámítása, ami 
a teljessé tett" adatokra, a log likelihoodnak a P(Z — z]x. 6/i)) eloszlás szerint számí- 
tott várható értéke, Ez a valószínűség a rejtett változóknak az adatok felhasználásával 
nyert a posteriori valószínűsége. Az M-lépés viszont nem más, mint ennek a log 
likelihoodnak a maximalizálása a paraméterek szerint. Kevert Gauss-jelekre a rejtett 
változók a Z/j-k, ahol Z/j — I, ha a j-edik mintát az i-edik komponens generálta. Bayes- 
hálóknál az egyes példák nem megfigyelt változó értékei a rejtett változók. RMM 
esetben az / — j átmenetek a rejtett változók. Ha azonosítottuk a megfelelő rejtett vál- 
tozókat az adott alkalmazásban, akkor az általános formából kiindulva levezethető az 
EM algoritmus. 

Amint megértettük az általános elgondolást, amin az EM alapul, az összes variáns és 
javítás könnyen levezethető. Például: sok esetben az E-lépés — a rejtett változók 
Posteriorjainak kiszámítása — kezelhetetlen problémát okoz, mint például a nagy Bayes- 
hálókban. Kiderült, hogy alkalmazhatunk egy közelítő E-lépést, és még ezzel is haté- 
kony algoritmust kapunk. Egy mintavételi algoritmussal — mint amilyen például az 
MCMC (lásd 14.5. alfejezet) — a tanulási folyamat nagyon szemléletes: minden egyes, 
az MCMC által bejárt állapotot (a rejtett és megfigyelt változók konfigurációját) úgy 
kezelünk, mintha teljes megfigyelés volna. Ennek megfelelően a paraméterek minden 
egyes MCMC-átmenet után frissíthetők. A közelítő következtetés más formái — mint 
például a variációs és hurkos módszerek — szintén hatékonynak bizonyultak nagyon 
nagy hálók tanulásánál. 


Bayes-hálóstruktúra tanulása rejtett változók esetén 


A 20.2. alfejezetben a Bayes-hálóstruktúra tanulásának problémáját tárgyaltuk teljes ada- 
tok esetén. Amikor rejtett változókat is figyelembe veszünk, a dolgok nehezebbé válnak. 
A legegyszerűbb esetben a rejtett változók a megfigyeltekkel együtt fel vannak sorolva, 
bár az értékük nem ismert, de a tanuló algoritmus tud a létezésükről, és helyet kell nekik 
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találjon a hálóstruktúrában. Például egy algoritmus tanulhatja úgy a 20.7. (a) ábrán lát- 
ható struktúrát, hogy megadjuk neki, hogy egy SzívBetegség nevű (háromértékű) válto- 
zót be kell építsen a struktúrába. Ha a tanuló algoritmus nem kapja meg ezt az informá- 
ciót, akkor két lehetőség van: vagy úgy viselkedik, mintha az adatok teljesek volnának 
(ami arra kényszeríti, hogy a 20.7. (b) sokparaméteres modellt tanulja meg), vagy kita- 
lál új rejtett változókat a modell egyszerűsítése érdekében. Ez utóbbi megközelítés meg- 
valósítható úgy, hogy új módosítási lehetőségeket vezetünk be a struktúrakeresésbe: 
a kapcsolatok módosításán túl az algoritmus hozzáadhat vagy törölhet egy rejtett válto- 
zót, illetve megváltoztathatja argumentumszámát. Természetesen az algoritmus nem 
fogja tudni, hogy a bevezetett új változó neve SzívBetegség; hasonlóképpen nem tud ér- 
telmes nevet adni az értékeinek. Szerencsére általában a bevezetett új rejtett változó elő- 
zetesen már létező változókkal van kapcsolatban, így egy szakember rendszerint meg 
tudja vizsgálni az új változót is tartalmazó lokális feltételes eloszlásokat, és meg tudja 
állapítani a jelentését. 

Éppúgy, mint a teljes adatokra vonatkozó esetben, egy tisztán maximum-likelihood struk- 
túratanulás teljesen összekötött hálót eredményez (ráadásul rejtett változók nélkülit), így 
használnunk kell a komplexitásbüntetés valamilyen formáját. Használhatjuk az MCMC-t is 
a Bayes-tanulás approximációjára. Például: ismeretlen komponensszámú kevert Gauss- 
jelek tanulásakor rúlmintavételezhetjük a számot; ekkor a közelítő Gauss-jelek számának 
közelítő a posteriori eloszlását az MCMC-folyamat mintavételi frekvenciája adja. 

Az eddigiekben az általunk vizsgált eljárásnak volt egy külső hurka, amely a struktú- 
rakeresés folyamata, és egy belső hurka, ami egy paraméteres optimalizálási eljárás. 
A teljes adatokra vonatkozó esetben a belső hurok nagyon gyors — csupán ki kell nyerni 
az adathalmazból a feltételes gyakoriságokat. Ha rejtett változók is vannak, akkor a bel- 
ső hurok az EM algoritmussal történő számos iterációt vagy egy gradiensalapú algo- 
ritmust is tartalmazhat. Minden iterációs ciklusban ki kell számítani a Bayes-háló 
a posteriori eloszlásait, ami önmagában NP-teljes probléma. Ez a megközelítés bonyolult 
modellek tanulása esetén napjainkig nem bizonyult a gyakorlatban is alkalmazhatónak. 
Egy lehetséges előrelépés a strukturális EM (structurai EM), ami nagyon hasonlóan 
működik, mint a normál (parametrikus) EM, leszámítva azt, hogy nemcsak a paraméte- 
reket, hanem a stniktúrát is frissíti. Éppúgy, mint ahogy a normál EM algoritmus arra 
használja az aktuális paramétereket, hogy a várható számértékeket meghatározza az 
E-lépés során, majd alkalmazza ezeket a számértékeket az M-lépésben új paraméterek 
választására, a strukturális EM az aktuális struktúrát használja a várható számértékek 
meghatározására, majd arra alkalmazza ezeket a számértékeket az M-lépésben, hogy a 
potenciális új struktúrák likelihoodját meghatározza. (Ellentétben a külső hurok/belső 
hurok módszerrel, amelynél minden potenciális struktúrára kiszámítjuk a várható szám- 
értékeket.) Ezen az úton a strukturális EM számos strukturális változtatást tud végrehaj- 
tani a hálón anélkül, hogy egyszer is újraszámolná a várható számértékeket. Így a mód- 
szer képessé válik nemtriviális Bayes-hálóstruktúrák tanulására. Mindamellett sok 
munkát kell még befektetni, míg azt mondhatjuk majd, hogy a struktúratanulás problé- 
mája megoldott. 
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Eddigiekben a statisztikai tanulás tárgyalásában arra koncentráltunk, hogy valószínűségi 
modellek egy behatárolt családjának paramétereit egy struktúrájában nem kötött adathal- 
mazra illesszük. Például a kevert Gaussokat használó, nem ellenőrzött tanulás feltételezi, 
hogy az adatok megmagyarázhatók rögzített számú Gauss-eloszlás összegeként. Az ilyen 
módszereket paraméteres tanulásnak (parametric learning) nevezzük. A paraméte- 
res tanuló eljárások gyakran nagyon egyszerűek és hatékonyak, de egy meghatározott 
behatárolt modelicsalád feltételezése sokszor túlzott egyszerűsítése annak, ami az ada- 
tokat szolgáltató valós világban történik. Nos, az természetesen igaz, hogy ha nagyon 
kevés adatunk van, akkor nem reménykedhetünk egy bonyolult és részletes modell 
megtanulásában, de butaságnak tűnik a hipotézis komplexitását akkor is rögzítve tarta- 
ni, amikor az adathalmaz nagyon nagyra nő. 

A paraméteres módszerekkel ellentétben a nemparaméteres tanulási (nonparametric 
learning) módszerek lehetővé teszik, hogy a hipotézis bonyolultsága együtt növekedjék az 
adatokkal. Minél több adatunk van, annál körmönfontabb lehet a hipotézis. Két, nagyon 
egyszerű nemparaméteres példányalapú tanulást használó módszercsaládot fogunk vizs- 
gálni, amelyeket azért nevezünk így, mert közvetlenül a tanító példányokból hoznak létre 
hipotéziseket. 


Legközelebbi-szomszéd modellek 


A legközelebbi-szomszéd (nearest-neighbor) modellek alapötlete az, hogy bármely 
egyedi x bemeneti pont tulajdonságai valószínűleg hasonlók az x pont környezetébe eső 
Pontok tulajdonságaihoz. Például ha sűrűségbecslést (density estimation) kívánunk 
végezni - azaz meg akarjuk becsülni egy ismeretlen valószínűség sűrűségfüggvény-ér- 
tékét x-ben -, akkor egyszerűen mérhetjük azt. hogy x környezete milyen sűrűn van be- 
szórva pontokkal. Ez nagyon egyszerűen hangzik, amíg rá nem jövünk, hogy meg kell 
határoznunk, mit is értünk , szomszédság" alatt. Ha a szomszédság túl kicsi, akkor egy- 
általán nem fog pontokat tartalmazni. Ha túl nagy, akkor esetleg az összes adatpontot 
tartalmazni fogja, és olyan sűrűséget eredményez, ami mindenütt ugyanakkora. Egy 
megoldási lehetőség, ha a szomszédságot úgy definiáljuk, hogy legyen éppen elég tág 
ahhoz, hogy k pontot tartalmazzon, ahol k elég nagy ahhoz, hogy ésszerű becslést 
végezhessünk. Rögzített esetén a szomszédság mérete változó, ahol ritkán vannak az 
adatok, ott a szomszédság tág térrész. ahol az adatok sűrűn helyezkednek el, ott a 
szomszédság szűk. A 20.12. (a) ábra egy példát mutat: két dimenzióban szétszórt adat- 
pontokat. A 20.13. ábra mutatja az ezen adatokra elvégzett k-legközelebbi-szomszéd 
sűrűségbecslést £ — 3, 10 és 40 esetére. k — 3 esetében a sűrűségbecslést minden egyes 
pontban csak 3 szomszédos pontra alapozzuk, és ezért erősen változó eredményt 
kapunk. k — 10 esetén a 20.12. (b) ábrán látható valódi sűrűség jó becslését kapjuk. 
k — 40 esetén a szomszédság túl tággá válik, és az adatok struktúráját mindenestől 
elvesztjük. Gyakorlatban - kis dimenziószám esetén — egy 5 és 10 közé eső k a legtöbb 
esetben jó eredményt ad. Keresztvalidáció alkalmazásával is jó értéket kaphatunk a k-ra. 

Ahhoz, hogy egy kérdéses pontban a legközelebbi szomszédokat meg tudjuk határoz- 
ni, egy távolságmetrikára — D(xy, xo)-re — van szükségünk. A 20.12. ábra kétdimenziós 
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20.12. ábra. (a) A 20.8. (a) ábra adatainak 128 pontos részhalmaza, két kiválasztott ponttal. és 10 Jeg- 
közelebbi szomszédjukkal. (b) Az adatok előállításánál használt kevert Gauss-eloszlás 3D ábrája. 


sűrűség 





(a) (b) (c) 


20.13. ábra. A 20.12. (a) ábrán látható adatokra végzett sűrűségbecslés, k — 3 (a); k z 10 (b) és k — 40 
(c) esetén 


példájában euklideszi távolságot használtunk. Ez nem felel meg, ha a tér minden dimen- 
ziójában valami mást mérünk — például magasságot és súlyt —, mivel egy dimenzió ská- 
lájának megváltoztatása megváltoztatja a legközelebbi szomszédok halmazát. Az egyik 
lehetőség, hogy minden egyes dimenzió skáláját normalizáljuk. Ehhez először megmér- 
jük az összes tulajdonság varianciáját a teljes adathalmazon, majd a tulajdonságértéket 
úgy fejezzük ki, hogy megadjuk: a tulajdonságérték az adott tulajdonság varianciájának 
hányszorosa. (Ez a Mahalanobis-távolság IMabalanobis distance) — amely a tulaj- 
donságok kovarianciamátrixát veszi figyelembe — speciális esete.) Végül diszkrét eset- 
ben alkalmazhatjuk a Hamming-távolságot (Hamming distance), amely úgy definiál- 
ja D(xy. x2)-t, mint azon tulajdonságok számát, amelyben xj és x2 eltér. 

A 20.13. ábrán láthatóhoz hasonló sűrűségbecslések a bemeneti tér feletti együttes el- 
oszlásokat határoznak meg. A Bayes-hálóktól eltérően a példányalapú reprezentációk 
nem tartalmaznak rejtett változókat, ami azt jelenti, hogy nem alkalmazhatunk nem 
ellenőrzött osztályozást, mint ahogy a kevert Gauss-modellnél tettük. Továbbra is 
alkalmazhatjuk a kívánt y értéknek az x bemeneti tulajdonságok alapján történő jóslá- 
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sára a sűrűségbecslést, ha kiszámítjuk P(yIx) — P(y, x)/P(x)-et, feltéve, hogy a taní- 
tó adatok a kívánt értékre nézve is tartalmaznak értékeket. 

A legközelebbi-szomszéd tanulási algoritmus használható közvetlen ellenőrzött tanu- 
lásra is. Ha adott egy tesztpélda x bemeneti értékekkel, akkor az y — A(x) az x 
k-legközelebbi-szomszédjának y értékeiből nyerhető. Diszkrét esetben többségi szava- 
zással kaphatunk egyetlen jósolt értéket. Folytonos esetben átlagolhatjuk a k darab érté- 
ket, vagy lokális lineáris regressziót végezhetünk a k pontra illesztve. ez utóbbi esetben 
a jóslást a kialakuló hipersík x-beli értéke adja. 

A k-legközelebbi-szomszéd tanulási algoritmus nagyon egyszerűen megvalósítható, 
kevés hangolást igényet, és gyakran elég jól működik. Jó dolog, ha először egy új tanu- 
lási problémán próbáljuk ki. Mindazonáltal nagy adathalmazokban hatékony mechaniz- 
must kell találnunk arra, hogy a kérdéses x pont legközelebbi szomszédjait megtaláljuk, 
hiszen túl hosszú lenne minden pontra kiszámítani a távolságot. Egy sor szellemes, a ta- 
nító adatok előfeldolgozásán alapuló módszert javasoltak ennek a lépésnek a hatékony- 
nyá tételére. Szerencsétlen módon a legtöbb ilyen módszer nem viselkedik jól a tér 
dimenziójának növekedésével (azaz a tulajdonságok számának növekedésével). 

A sokdimenziós terek még egy további problémát jelentenek, nevezetesen azt, hogy egy 
ilyen térben a legközelebbi szomszédok rendszerint nagyon messze vannak. Vegyünk egy 
N elemű, d dimenziós egységkockában elhelyezkedő adathalmazt, és tegyük fel, hogy a 
szomszédságok b oldalú hiperkockák, amelyek térfogata b1. (Ugyanez a megfontolás mű- 
ködne hipergömbök feltételezése esetén is, de a hipergömb térfogatképlete bonyolultabb.) 
Ahhoz, hogy k pontot tartalmazzon, az átlagos szomszédság a teljes térfogat — amit egy- 
ségnyinek tekintünk — k/N-ed részét kell elfoglalnia. Ennek megfelelően b" — k/N, vagyis 
b — (k/NYI/d. Eddig jó. Legyen most d — 100, k — 10 és N — 1 000 000 értékű. Akkor 
b sz 0,89 - azaz a szomszédság majdnem az egész bemeneti teret elfoglalja! Ez arra utal, 
hogy sokdimenziós esetben a legközelebbi-szomszéd alapú módszerek nem megbízhatók. 
Alacsony dimenziószám esetén nincs probléma, d — 2 esetén b — 0,003. 


Kernelmódszerek 


A kernelmodellben (kernel model) úgy tekintünk minden tanító példányra, mintha 
egy kis saját sűrűségfüggvényt — kernelfüggvényt (kernel function) — generálna. Az ere- 
dő sűrűségfüggvény becslés nem más, mint a kis kernelfüggvények súlyozott összege. 
Egy x; tanító példány egy K(x, x;) kernelfüggvényt generál, amely a tér minden x pont- 
jához egy valószínűséget rendel. Így a sűrűségbecslés: 


N 
P(x LIK(xx) 
Na 
Normális esetben a kernelfüggvény csak az x és x; közötti D(x, x;) távolságtól függ. 
A legnépszerűbb kernelfüggvény (természetesen) a Gauss-függvény. Az egyszerűség 
kedvéért egy gömbszimmetrikus Gauss-függvényt feltételezünk, amelynek minden ten- 
gely mentén w a szórása, azaz: 
1 2 DX 


KLÁN EZT 2w 


844 20. STATISZTIKAI TANULÁSI MÓDSZEREK 


sűrűség 





(a) (c) 


20.14. ábra. A 20.12. (a) ábrán látható adatok sűrűségbecslése Gauss-kernelekkel, w — 0.02 (a); w— 0.07 
(b) és w — 0,20 (c) esetén. 


ahol d az x dimenziószáma. Hátra van még a megfelelő w érték választásának problémá- 
ja. Éppúgy, mint az előzőkben egy túl kis szomszédság nagyon hepehupássá teszi a 
becslést — mint a 20.14. (a) ábrán látható. A (b) ábrán látható, hogy egy közepes w érték 
nagyon jó becslést ad. A (c) ábrán bemutattuk, hogy a túl nagy szomszédság eredménye- 
képp teljesen elveszítjük a struktúrát. Jó w értéket választhatunk keresztvalidációval. 
Ellenőrzött tanulást kemelekkel úgy végezhetünk, hogy a tanító példányokból szár- 
maztatott összes jóslás súlyozott kombinációját vesszük. (Összehasonlítva a k-legköze- 
lebbi-szomszéd módszerrel, ott a k-legközelebbi-példány súlyozatlan kombinációját 
használjuk.) Az í-edik példánynak a kérdéses x pontra vett súlyát a K(x, x;) kernelfügg- 
vényérték adja. Diszkrét jóslás esetén súlyozott szavazást vehetünk, folytonos esetben 
súlyozott átlagot vagy súlyozott lineáris regressziót. Figyeljük meg, hogy a kernelekkel 
végzett jóslás azt igényli, hogy az összes tanító példányt figyelembe kell vennünk. A ker- 
nelek összekombinálhatók a legközelebbi-szomszéd indexelési sémáival azért, hogy 
csupán a szomszédos példányok alapján előállított súlyozott jóslást alkalmazzuk. 


20.5. NEURÁLIS HÁLÓK 


A neuron egy olyan agysejt, amelynek alapfeladata elektromos jelek összegyűjtése, 
feldolgozása és szétterjesztése. A 42. oldalon az 1.2. ábra egy tipikus neuron sematikus 
rajzát mutatja. Azt gondoljuk, hogy az agy információfeldolgozó kapacitása elsősorban 
ilyen neuronok hálózatából alakul ki. Ezért a korai MI néhány kutatása mesterséges 
neurális hálók (neural networks) létrehozására irányult. (A terület más. szintén hasz- 
nált elnevezései: konnekcionizmus [connectionism], párhuzamos elosztott feldolgozás 
(parallel distributed processing] és neurális számítástechnika (neural computation].) 
A 20.15. ábra a neuron egyszerű matematikai modelljét mutatja, ahogy McCulloch és 
Pitts (McCulloch és Pitts, 1943) megalkották. Elnagyolva az mondható, hogy a neuron 
akkor , tüzel", amikor a bemeneti értékek súlyozott összege meghalad egy küszöböt. 
1943 óta sokkal részletesebb és valósághűbb modelleket alkottak mind a neuronra, 
mind az agy nagyobb rendszereire, ez vezetett a számítógépes idegháló-modellezés 
(computational neuroscience) modern tudományterületének megjelenéséhez. Más- 
részt az MI és a statisztika kutatóinak érdeklődését felkeltették a neurális hálózatok 
absztraktabb tulajdonságai, mint például az elosztott számítás elvégzésére, a bemeneti 
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20.15. ábra. A neuron egyszerű matematikai modellje. Az egység kimeneti aktivációja a; — dev 14 aj a] 
ahol aj a j-edik egység kimeneti aktívációja és W ; a j-től t-ig vezető összeköttetés súlya. .V-0 


zajjal szembeni érzéketlenségre és a tanulásra való képesség. Bár ma már tudjuk, hogy 
más rendszerek, például a Bayes-hálók is rendelkeznek ezekkel a tulajdonságokkal, de 
a neurális háló maradt a tanuló rendszerek egyik leghatékonyabb és legnépszerűbb for- 
mája, ezért megéri külön tárgyalni. 


A neurális háló egységei 


A neurális hálók irányított kapcsolatokkal (link) összekötött csomópontokból vagy 
egységekből (unit) állnak. A j-edik egységtől az i-edik felé vezető kapcsolat hivatott az 
a aktivációt j-től az i-ig terjeszteni. Minden egyes kapcsolat rendelkezik egy hozzá asz- 
szociált W; ; numerikus súllyal (weight), ami meghatározza a kapcsolat erősségét és elő- 
jelét. Minden egyes i egység először a bemeneteinek egy súlyozott összegét számítja ki: 


in; -w jidj 
j-0 
A kimenetét úgy kapja, hogy ezek után egy g aktivációs függvényt (activation function) 
alkalmaz a kapott Véságzos 


a; — g(in)) —g nw já a] (20.10) 


Figyeljük meg, hgy. használtunk egy eltolássúlyt (bias weight) Wgo;-t, amelyet egy 
rögzített értékű ag — —1 bemenetre kapcsolunk. Rövidesen megmagyarázzuk, hogy mi 
a jelentősége. 

Az aktivációs függvénnyel szemben két elvárásunk van. Először az. hogy az egység 
legyen saktív" (--I körüli kimenet). ba a , helyes" bemeneteket kapja, és , inaktív" (0 
körüli kimenet), ha , rossz" bemeneteket kap. Másodszor az, hogy az aktiváció legyen 
nemlineáris, különben az egész neurális háló egy egyszerű lineáris függvénnyé fajul 
(lásd 20.17. feladat). A 20.16. ábra kétféle aktivációs függvényt mutat be: a küszöb- 
függvényt (threshold function), illetve a szigmoid függvényt (sigmoid function) 
(mely utóbbi logisztikus függvényként [iogistic function] is ismert). A szigmoid függ- 
vény előnye, hogy differenciálható, ami — mint később látni fogjuk — fontos a súlyta- 
nulási algoritmus szempontjából. Vegyük észre, hogy mindkét függvénynek van egy 
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küszöbpontja (akár kemény, akár lágy) a nullánál; az eltolássúly állítja be az egység ak- 
tuális küszöbpontját. Ez azt jelenti, hogy az egység akkor aktiválódik, ha a , valódi" be- 


menetek súlyozott összege ) 7. Wyy aj meghaladja Wgj-L. 


g(in) e(in) 
BE se És ús 
in; in; 
(a) (b) 


20.16. ábra. (a) A küszöb aktivációs függvény, amely 1-et ad a kimeneten, ha a bemenete pozitív, kü- 
lönben pedig 0-t. (Néha az előjelfüggvényt is használják ehelyett, amely --1-et ad a bemenet előjelétől 
függően.) (b) A szigmoid függvény 1/(14-e7"). 


Wo: 15 Wo- 05 Wa — -0,5 


wWoTe MET ete 
s e wWs-I 


Waz1l W,z 1 


És VAGY NEM 


20.17. ábra. Megfelelő bemeneti és eltolássúlyokkal rendelkező, küszöbaktivációjú egységek képesek 
logikai kapuként működni 


Némi fogalmunk alakulhat ki az egyes egységek működéséről, ha összehasonlítjuk 
őket a logikai kapukkal. Az egyes egységek tervezésének eredeti motivációi között 
(McCulloch és Pitts, 1943) szerepelt az, hogy képesek az alapvető logikai függvények 
reprezentálására. A 20.17. ábra bemutatja, hogy az És, VAGY és NEM logikai függvények 
hogyan reprezentálhatók egy megfelelő súlyokkal rendelkező küszöbegység segítségé- 
vel. Ez azért fontos, mert azt jelenti, hogy ezen egységek felhasználásával tetszőleges 
logikai függvény kiszámítására tudunk hálózatot építeni. 


Hálóstruktúrák 


A neurális hálóstruktúrák két fő csoportja: a hurokmentes vagy előrecsatolt hálók 
(feed-forward network) és a visszacsatolt vagy rekurrens hálók (recurrent net- 
work). Az előrecsatolt háló a pillanatnyi bemenet függvényét reprezentálja, azaz nincs 
semmilyen más belső állapota, csak maguk a súlyok. A rekurrens háló viszont a ki- 
meneteit visszacsatolja a bemeneteire. Ez azt jelenti, hogy a háló aktivációs szintjei 
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dinamikus rendszert alkotnak, elérhetnek stabil állapotot. de mutathatnak oszcillációt, 
sőt kaotikus viselkedést is. Ezenfelül a háló egy adott bemenetre adott válasza a kezde- 
ti állapotától függ, amely a korábbi bemenetektől függhet. Ennélfogva a rekurrens 
hálók (ellentétben az előrecsatolt hálókkal) rövid távú memóriát is biztosíthatnak. Ezál- 
tal érdekesebbé válnak mint agymodellek, de egyben nehezebben is érthetők. Ez a rész 
az előrecsatolt hálókra koncentrál, a fejezet végén néhány hivatkozást adunk, segítve a 
rekurrens hálók további tanulmányozását. 

Nézzük meg közelebbről azt az állítást, hogy az előrecsatolt háló a bemeneteinek 
függvényét reprezentálja. Vizsgáljuk a 20.18. ábra egyszerű hálózatát, amelynek két 
bemeneti egysége. két rejtett egysége (hidden unit) és egy kimeneti egysége van. 
(Az egyszerűség kedvéért ebben a példában elhagytuk az eltolásegységeket.) Adott 
x — (xi x2) bemeneti vektor esetén a bemeneti egységek aktivációja (a), 42) — (xy. x2), 
és a hálózat a következő számítást végzi: 


as — g(Wz 5az 1-W4 54 ) 
— g(W4 59 (Mi zaj 4-W2 302 )--W4 58 (4 4a1 4 4 a ) (20.11) 


Azaz kifejezve a rejtett egységek kimenetét, mint a saját bemeneteik függvényét, 
megmutattuk, hogy az egész háló as végső kimenete a háló bemeneteinek függvénye. 
Továbbá azt látjuk, hogy a háló súlyai ennek a függvénynek a paramétereiként szolgál- 
nak; ha W-vel jelöljük a paramétereket, akkor a háló a f(x) függvényt számítja ki. 
Ha változtatjuk a súlyokat, akkor változik a háló által reprezentált függvény. Ez a mód- 
ja a neurális hálók tanulásának. 

A neurális hálót osztályozásra vagy regresszióra használhatjuk. Ha folytonos kimenete 
van a hálónak (pl. szigmoid egységekkel). akkor logikai osztályozás esetén hagyományosan 
egy kimeneti egységet használunk, és ha ennek aktivációs értéke 0,5 feletti, azt az egyik, ha 
0,5 alatti, akkor a másik osztályba tartozásként interpretáljuk. Egy k osztályos osztályozási 
feladatnál feloszthatjuk az egyetlen kimeneti egység értéktartományát k részre, de megszo- 
kottabb, hogy ehelyett k elkülönült kimeneti egységet használjunk, ahol mindegyiknek az 
aktivációs értéke a bemenet adott osztályba tartozásának valószínűségét reprezentálja. 

Az előrecsatolt hálókat rendszerint rétegekbe (layer) szervezzük oly módon, hogy 
minden egyes egység csak a közvetlenül megelőző réteg egységeitől kap bemeneti jelet. 
A következő két alfejezetben egyrészt az egyrétegű hálózatokkal foglalkozunk, ame- 
lyeknek nincsenek rejtett egységei. másrészt a többrétegű hálókkal, amelyek egy vagy 
több rejtett réteggel rendelkeznek. 





20.18. ábra. Egy nagyon egyszerű, két bemeneti egységgel, egyetlen — két egységből álló — rejtett ré- 
teggel és egy kímeneti egységgel rendelkező háló 
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Egyrétegű előrecsatolt neurális hálók (perceptronok) 


Azt a hálót, amelyben az összes bemenet közvetlenül a kimenetekre kapcsolódik egyré- 
tegű neurális hálónak (single layer neural network) vagy perceptron (perceptron) 
hálónak nevezzük. Mivel mindegyik kimeneti egység független a többitől — mindegyik 
súly csak egyetlen kimenetre van hatással — vizsgálatainkat korlátozhatjuk az egy- 
kimenetű perceptronra, mint azt a 20.19. (a) ábra magyarázza. 

Kezdjük annak a hipotézistérnek a tanulmányozásával, amelyet egyetlen perceptron 
reprezentálhat. Küszöbaktivációs függvény esetén úgy tekinthetjük a perceptront, mint 
ami logikai függvényt reprezentál. Az elemi logikai függvényeken (ÉS, VAGY És NEM, 
lásd 20.17. ábra) túl a perceptron képes néhány egészen , bonyolult" logikai függvényt 
is nagyon tömören reprezentálni. Például a többségfüggvényt (majority function), 
amely csak akkor ad ki 1-et, ha n bemeneteinek több mint fele I, egy olyan perceptron 
reprezentál, amelynek minden súlya W;— I és a küszöb Wg — n/2. Egy döntési fának 
O(2") csomópontra lenne szüksége ennek a függvénynek a reprezentálásához. 

Sajnos számos olyan logikai függvény van, amelyet a küszöbfüggvényt használó 
perceptron nem tud reprezentálni. A (20.10) egyenletet vizsgálva látjuk, hogy a küszöb- 
érték-perceptron akkor és csak akkor ad 1-et, ha bemeneteinek (beleértve az eltolás- 
bemenetet is) súlyozott összege pozitív: 

n 


2Wixj 0 vagy W-x50 
jz 


A W . x — 0 egyenlet egy hipersíkot határoz meg a bemeneti térben, tehát a per- 
ceptron akkor és csak akkor ad 1-et, ha a bemenet ennek a hipersíknak az egyik ol- 
dalán van. Ezért a küszöbperceptront lineáris szeparátornak (linear separator) is 
nevezik. A 20.20. (a) és (b) ábra mutatja a szeparáló hipersíkot (ami két dimenzióban 
egy egyenes) a kétbemenetű És, illetve vAGY függvények perceptronreprezentációja 
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(a) (b) 


20.19. ábra. (a) Egy perceptronhálózat három kimeneti egységből, amelyeknek öt közös bemenete van. 
Ha kiválasztunk egy kimeneti egységet (mondjuk a másodikat, vastag vonallal kiemelve), akkor azt lát- 
juk, hogy bemeneti összeköttetései nincsenek semmilyen hatással a többi kimeneti egységre. (b) Egy 
kétbemenetű szigmoid aktivációs függvényű perceptronegység kimenetének ábrázolása. 
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20.20. ábra. Lineáris szeparálhatóság küszöbperceptronok esetén. Fekete pötty jelzi a bemeneti tér olyan 
Pontjait, amelyekre a függvény értéke I, fehér pötty pedig az olyan pontokat, amelyre 0 ez az érték. 
A perceptronkimenet az egyenes nem árnyékolt oldalán 1. A (c) esetben nincs olyan egyenes, amely jól 
osztályozná a bemeneteket. 


esetén. Fekete pötty jelzi a bemeneti tér olyan pontjait, amelyekre a függvény értéke 
1, fehér pötty pedig az olyan pontokat, amelyre 0 ez az érték. A perceptron azért ké- 
pes reprezentálni ezt a függvényt, mert létezik olyan egyenes. ami az összes fehér 
pontot az összes feketétől elválasztja. Az ilyen függvényeket lineárisan szeparálha- 
tónak (linearly separable) nevezzük. A 20.20. (c) ábra egy olyan függvényre mutat 
példát, amely nem szeparálható lineárisan — ez az XOR függvény. Nyilvánvalóan nincs 
lehetőség arra, hogy egy küszöbperceptron megtanulja ezt a függvényt. Általánosság- 
ban elmondható, hogy egy küszöbperceptron csak lineárisan szeparálható függvé- 
nyek reprezentációjára képes. Ez a függvényeknek csak kis töredékét jelenti; a 20.14. 
feladat azt kéri, hogy fejezze ki számszerűen, mekkora is ez a töredék. A szigmoiddal 
felépített perceptronok hasonlóképpen korlátozott képességűek abban az értelemben, 
hogy csupán , lágy" lineáris szeparátorokat reprezentálnak. (Lásd 20.19. (b) ábra.) 

Korlátozott kifejezőképessége ellenére a küszöbperceptronnak vannak előnyei is. 
Különösen is fontos, hogy létezik olyan egyszerű tanuló algoritmus, amely a küszöb- 
perceptront tetszőleges lineárisan szeparálható adathalmazra képes illeszteni. Mégsem 
mutatjuk most be ezt, inkább fevezetünk egy ehhez közel álló tanuló algoritmust a 
szigmoid perceptronokra. 

Ennek az algoritmusnak az az alapgondolata (valójában a neuronháló tanuló algorit- 
musok legtöbbjének is ez), hogy a tanító mintahalmazon mért hiba valamilyen mérté- 
kének minimalizálása érdekében módosítjuk a neuronháló súlyait. Tehát a tanulást 
formálisan a súlytérben (weight space) végzett optimalizálási keresésként fogalmaz- 
zuk meg? A hiba , klasszikus" mértéke a négyzetes hibaösszeg, amit a lineáris regresz- 
sziónál a 826-827. oldalon is használtunk. Egyetlen, x bemenettel és y kívánt kimenet- 
tel megadott példa négyzetes hibája a következőképpen írható fel: 








E -zEm 50-ig) 


ahol hyw(x) a perceptron kimeneti értéke. 


kk folytonos terekben használható általános optimalizálási technikákat lásd a 4.4. alfejezetben. 
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A négyzetes hiba csökkentésére gradiensalapú optimalizálási eljárást használhatunk, 
ehhez az E minden egyes súlyra vonatkozó parciális deriváltját meg kell határoznunk. 
Tehát: 








JE ÖErr 
a -Erx— 
0w; ÖW; 
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ahol g/ az aktivációs függvény deriváltja. Amikor a gradiensalapú algoritmusban 
csökkenteni akarjuk E-t, a súlyfrissítés összefüggése a következő: 


Wj —Wj ax Errxgíinjx xj (20.12) 


ahol a a bátorsági faktor (vagy tanulási faktor, learning rate). Intuitíve ez nagyon 
ésszerű. Ha a hiba Err — y — hw(x) pozitív. akkor a háló kimenete túl kicsi, tehát a po- 
zitív bemenetekhez tartozó súlyokat növeljük, a negatívakhoz tartozókat pedig csök- 
kentjük. Ha a hiba negatív, akkor éppen ennek ellenkezője történik.!! 

A teljes algoritmus a 20.21. ábrán látható. Egyesével sorban végigfuttatja a mintákat 
a hálón, és minden egyes példa után a hiba csökkentése érdekében kissé módosítja a sú- 
lyokat. A mintahalmaz egyszeri végigfuttatását epochnak (epoch) nevezzük. Az epocho- 
kat addig ismételjük, amíg valamilyen leállási feltétel nem teljesül — tipikus, hogy akkor 
állunk le, amikor a súlyváltozások már nagyon kicsivé válnak. Más módszerek esetén 
eredő gradienst számítunk az egész tanító halmazra, egyszerűen összeadva az egyes pél- 
dáknál a (20.12) származó gradienseket, és az eredő gradiens alapján frissítjük a súlyokat. 
A sztochasztikus gradiens (stochastic gradient) módszer nem ciklikusan veszi a tanító 
halmaz mintáit, hanem inkább véletlenszerűen választ mintákat a tanító halmazból. 

A 20.22. ábra két különböző problémára bemutatja a perceptron tanulási görbéjét. 
A bal oldali ábrán a 11 logikai bemenetre vonatkozó többségfüggvény (tehát a kimenet 
akkor I, ha 6 vagy több bemenet 1) tanulási görbéje látható. Várakozásunknak meg- 
felelően a perceptron meglehetősen gyorsan tanulja a függvényt, mivel a többségfügg- 
vény lineárisan szeparálható. Másrészről viszont a döntési fa tanuló nem nagyon halad 
a tanulással, mert a többségfüggvényt nagyon nehéz (bár nem lehetetlen) döntési fában 
reprezentálni. A jobb oldali ábrán az étterem példa látható. A probléma megoldása 
könnyen ábrázolható döntési fával, de lineárisan nem szeparálható. Az adatokra felvett 
legjobb szeparáló sík csak 6596-ot osztályoz helyesen. 

Az eddigiekben úgy tekintettük a perceptronokat, mint olyan determinisztikus függ- 
vényeket, amelyeknek valószínűleg hibával terhelt a kimenete. Lehetőségünk van, hogy 
a szigmoid perceptron kimenetét valószínűségként interpretáljuk — annak valószínűsé- 


10 gzigmoid függvény esetén ez a derivált g/ — e(1 — e). 

Küszöbperceptronokra, abol gí(in) nem definiált, a Rosenblatt (Rosenblatt, 1957) által kidotgozott eredeti 
Perceptron tanulási szabály tperceptron learning rule) megegyezik a (20.12) egyenlettel, leszámítva, hogy 
a gf(in) kimarad, Mivel gi(in) minden súlyra azonos, elhagyása az egyes mintáknál összességében csak a súly- 
ftissítés nagyságát változtatja meg, az irányát nem. 
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function PERCEPTRON-TANULÁS(példák. háló) returns egy perceptronhipotézis 
inputs: példák, egy mintahalmaz, mindegyikhez x — xi, ..., xy bemenet és y kimenet tartozik 
háló, egy Wj. j — 0...n súlyokkal és g aktivációs függvénnyel rendelkező perceptron 





repeat 
for each p in példák do 
in — Yo Wpjlpl 
Err — x(pl- gin) 
Wa War Err x gin) x xylpl 
until valamilyen megállási feltétet teljesül 
return NEURÁLIS-HÁLÓ-HIPOTÉZIS(háló) 











20.21. ábra. A gradiensalapú perceptron tanulási algoritmus. feltételezve, hogy a g aktivációs függvény 
differenciálható. Küszöbperceptronokra elhagyjuk a g/(ir) faktort a súlyfrissítésből. A NEURÁLIS-HÁLÓ- 
Hiporézis függvény egy olyan hipotézist ad vissza, amely bármely bemenetre kiszámítja a háló válaszát. 





geként, hogy adott bemenetek esetén a valós kimenet 1. Ezzel az interpretációval úgy 
használhatjuk a szigmoidot, mint a Bayes-hálók feltételes eloszlásainak kanonikus 
reprezentációját (lásd 14.3. alfejezet). Levezethetünk egy tanuló algoritmust is, a stan- 
dard módszernek megfelelően maximalizálva az adatok (feltételes) log likelihood érté- 
két, amint ezt a fejezet korábbi részében ismertettük. Lássuk, hogyan is működik ez. 

Vegyünk egyetlen tanító példát, amelynek kívánt kimeneti értéke 7, és legyen erre 
a példára a perceptron válasza p. Ha T — I, akkor az adat feltételes valószínűsége p, 
ha T — 0. akkor a feltételes valószínűség (1 — p). Egy egyszerű trükk alkalmazásával a 
log likelihoodot differenciálható formában írhatjuk fel. A trükk az, hogy ha a 0/1 vál- 
tozót egy kifej ejezés kítevőjébe írjuk, akkor indikátorváltozóként (ndlsatór variable) 
viselkedik: pTakkor p, ha 7 — I, egyébként 1; hasonlóképpen (1 - p)! D akkor (1 - p), 
ha T — 0, különben I. Ezek szerint az adat log likelihood értékét felírhatjuk, mint: 


L-logpT41—pj9-P) -Tlogp4-1—T) log — p) (20.13) 
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A helyesen asztályozottak aránya 
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20.22. ábra. A perceptronok és döntési fák teljesítményének összehasonlítása. (a) A perceptronok job- 
bak a 11 bemenetű többségfüggvény tanulásában. (b) A döntési fák jobbak az étterem példában a 
VárjunkE predikátum tanulásában. 
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A szigmoid függvény tulajdonságainak hála, a gradiens rendkívül egyszerű formára 
hozható (20.16. feladat): 


BET S Eszi 

ÖW; jl 
Vegyük észre, hogy szigmoid perceptronok esetén a maximum-likelihood tanulás súly- 
frissítési vektorát megadó egyenlete alapvetően azonos a négyzetes hiba minimalizá- 
lásán alapuló frissítés vektorával. Tehát azt mondhatjuk, hogy a perceptronnak még 


megközelítéssel származtattuk. 


Többrétegű előrecsatolt neurális hálók 


Vizsgáljuk most a rejtett neuronokkal rendelkező hálókat. A legelterjedtebb esetben 
egy rejtett réteget!2 szoktak használni, ezt mutatja 20.24. ábra. A rejtett réteg hozzá- 
adásának az az előnye, hogy kiterjeszti a háló által reprezentálható hipotézisek terét. 
Gondoljunk minden egyes rejtett neuronra úgy, mint ami egy lágy küszöbfüggvényt 
reprezentál a bemeneti térben — lásd a 20.19. (b) ábrát. Ezek után gondoljunk úgy egy 
kimeneti neuronra, mint ami számos ilyen függvény lineáris kombinációjának lágy 
küszöbfüggvénye. Például összeadva két - egymással szemben álló — lágy küszöb- 
függvényt, és küszöbözve az eredményt, a 20.23. (a) ábrán látható , hegygerinc" 
függvényt kapjuk. Egymásra derékszögben álló két ilyen hegygerinc kombinálásával 
(tehát 4 rejtett neuron kimenetének kombinálásával) a 20.23. (b) ábrán látható , du- 
dort" kapjuk. 

Több rejtett neuronnal különböző helyeken több, eltérő méretű dudort tudunk létre- 
hozni. Valójában egyetlen, megfelelően nagy rejtett réteggel a bemenetek tetszőleges 
folytonos függvénye tetszőleges pontossággal reprezentálható, sőt két réteggel még 
nemfolytonos függvények is reprezentálhatók. 3 Sajnos egy egyedi neurális struktúra 
esetén nemigen lehet megmondani, hogy milyen függvények reprezentálhatók, és mi- 
lyenek nem. 

Tegyük fel, hogy az étterem problémára akarunk konstruálni egy egy-rejtett-réteggel 
rendelkező hálót. Minden példát 10 attribútum ír le, tehát egy 10 bemenetű hálóra lesz 
szükség. Hány rejtett neuron kell? A 20.24. ábrán bemutatunk egy négy rejtett neuron- 
nal felépített hálót. Az derült ki, hogy ez nagyjából megfelelő ehhez a problémához. 
A rejtett neuronok számának előzetes meghatározása még napjainkban sem jól megol- 
dott probléma. (Lásd 856-857. oldal.) 

A többrétegű háló tanuló algoritmusa hasonló a 20.21. ábrán bemutatott per- 
ceptrontanulási algoritmushoz. Egy kisebb különbség, hogy több kimenet is lehet, 
így nem egy skalár kimeneti értékünk, hanem egy hyw(x) kimeneti vektorunk van, és 
minden egyes példához is egy y kívánt kimeneti vektor tartozik. Fontosabb különb- 


12 Egyesek ezt háromrétegű hálózatnak nevezik, mások kétrétegűnek (mivel a bemenetek nem igazi" neu- 
tonok). A zűrzavar elkerülése érdekében mi ,egy-rejtett-rétegű háló"-nak nevezzük. 

13 A bizonyítás bonyolult, de legfőbb pontja az. hogy a bemenetek számával exponenciálisan nő a szüksé- 
ges rejtett neuronok száma. Például n bemenetű logikai függvények kódolására 27/n rejtett neuron kell. 
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20.23. ábra. (a) Két — egymással szemben álló — lágy küszöbfüggvény kombinációjának eredménye: 
egy hegygerinc. (b) Két hegygerinc kombinációjának eredménye a dudor. 


ség, hogy míg a kimeneti rétegben a hiba nyilvánvalóan y — hw, addig a rejtett 
rétegben a hiba misztikusnak tűnik, hiszen a tanító minták nem mutatják, hogy 
mimnek kellene lennie a rejtett csomópontok értékének. Kiderül, hogy a hibát visz- 
szaterjeszthetjük (back-propagate) a kimeneti rétegről a rejtett rétegekre. A hiba- 
visszaterjesztési eljárás (back-propagation) közvetlenül kiadódik a teljes hibagradiens 
levezetéséből. Először egy intuitív bizonyítással mutatjuk be az eljárást, majd meg- 
mutatjuk a levezetést is. 

A kimeneti rétegre a súlyfrissítési szabály azonos a (20.12) egyenlettel. Több kime- 
netünk van, legyen Err; az y — hw hibavektor i-edik komponense. Hasznos lesz, ha 
bevezetjük a módosított hibát, A; — Err; x g(in;)-t, így a súlyfrissítési szabály: 


Wa. — Wat ax ajx A; (20.14) 


Ahhoz, hogy a bemeneti neuronok és a rejtett neuronok közti összeköttetések fris- 
sítését megoldjuk, a kimeneti csomópontok hibájához hasonló mennyiséget kell defi- 
niálnunk. Ez az a pont, ahol a hiba-visszaterjesztést végezzük. A gondolat az, hogy a 
Jj rejtett csomópont valamilyen arányban , felelős" minden egyes — vele összeköttetés- 
ben lévő - kimeneti csomópont A; hibájáért. Így a A, értékeket a rejtett csomópont 


Kimeneti egységek a; 


Rejtett egységek a; 


Bemeneti egységek az 





20.24. ábra. Többrétegű neurális háló egy rejtett réteggel és 10 bemeneti egységgel, alkalmas az étterem 
problémához 
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és a kimeneti csomópont közötti összeköttetés erőssége alapján osztjuk és visszater- 
jesztjük, hogy megkapjuk a rejtett réteg A; értékeit. A A értékek terjesztési szabálya 
a következő: 


Ap gin WA; (20.15) 
Ezek után a bemenetek és a rejtett réteg közötti súlyok frissítési szabálya szinte azonos 
a kimeneti réteg frissítési szabályával: 

W.j —Wyj-taxapxAj 
A hiba-visszaterjesztési algoritmus a következő módon foglalható össze: 


s Számítsuk ki a kimeneti neuronokra a A értékeket a megfigyelt hiba alapján. 

" A kimeneti réteggel kezdve ismételjük a következő lépéseket minden rétegre, amíg 
a legelső rejtett réteget el nem érjük: 
— Terjesszük vissza a A értékeket a megelőző rétegre. 
— Frissítsük a két réteg közötti súlyokat. 


Az algoritmust a 20.25. ábra mutatja be részleteiben. 

A matematika iránt vonzalmat érzők kedvéért most az alapegyenletekből levezet- 
jük a hiba-visszaterjesztési algoritmust. Egyetlen mintára a négyzetes hiba definíci- 
ója: 


£-5 DG — ap)? 
i 








fonction HIBA-VISSZATERJESZTÉS-TANULÁS(példák, háló) returns egy neurális háló 
inputs: példák, minták halmaza, mindegyikhez x bemeneti és y kimeneti vektor 
háló, többrétegű háló, L réteggel, W; ; súlyokkal és g aktivációs függvénnyel 


repeat 
for each p in példák do 
for each j csomópontra a bemeneti rétegben do az — xj[pl 
for(—2toLdo 
in —EJWjj aj 
a; — gin) 
for each í csomópontra a kimeneti rétegben do 
Ap gin x Cpl - ap 
forf—L-1toldo 
for each j csomópontra az /-edik rétegben do 
Aj — gin DWj; Az 
for each í csomópontra az (Z -- 1)-edik rétegben do 
Wa— Witaxajx A; 
until valamilyen megállási feltétel teljesül 
return NEURÁLIS-HÁLÓ-HIPOTÉZIS(háló) 

















20.25. ábra. A többrétegű hálókra kidolgozott hiba-visszaterjesztéses tanulási algoritmus 


20.5. NEURÁLIS HÁLÓK 855 


ahol az összegzés a kimeneti réteg csomópontjaira vonatkozik. Egy bizonyos W; ; súly- 
ra vett gradiens kiszámításához csak az a; aktivációt kell deriválnunk, mivel az összeg 
összes többi tagja független w; artől: 





80E Ba; Ög(in;) 
—-—04—g— s —(y— ap 
ÖWig Wa ÖWj 





séztjjz apetin 2 E" 03; —apgtiny 7 


já 





-—(y—apegíin)aj ——aj A; 


ahol A-t az előzőkkel megegyezően definiáltuk. Ahhoz, hogy a bemeneti réteget és a rejtett 

réteget összekötő W, ; súlyokra vonatkozó gradienst megkapjuk, meg kell tartanunk az i fe- 

letti teljes összegzést, hiszen az összes kimeneti a; értékre hatással lehetnek W, ; változásai. 

Az aj aktiívációkat szintén mind ki kell fejtenünk. Aprólékosan bemutatjuk a levezetést, 

mivel érdekes megfigyelni. ess a differenciáló operátor visszaterjed hálón keresztül: 
0E ) Ög(in;) 

öw 7-0 a) wa 5--)0—a) OW 


i 





Ő 
z 73 7 a; KÉZ 





-- PAM gy 





DAM 1 TE) 
-— 8í(in; 
ejj 4 


7-2 ina Era) 
— IDA 8 (inda, 5—a d; 
i 


ahol a A-t az előzőkkel megegyezően definiáltuk. Tehát megkaptuk azt a frissítési sza- 
bályt, amelyet már korábban megkaptunk intuitív úton is. Az is nyilvánvaló, hogy az 
eljárás folytatható több mint egy rejtett rétegű hálókra is, ami igazolja a 20.25. ábrán 
bemutatott általános algoritmust. 

Keresztülverekedvén magunkat (vagy átugorva) a matematikai levezetésen lássuk 
most, hogy milyen teljesítményt nyújt egy egy-rejtett-rétegű háló az étterem problémán. 
A 20.26. ábrán két görbét mutatunk be. Az első a tanítási görbe (training curve), 
amely a súlyfrissítés során az átlagos négyzetes hiba alakulását mutatja egy adott 100 
elemű étterem példahalmazon mérve. Ez jól demonstrálja, hogy a háló valóban konver- 
gál a tanító mintákra való tökéletes illeszkedéshez. A második görbe az étteremadatok 
standard tanulási görbéje. A neurális háló jól tanul, bár nem annyira gyorsan, mint a dön- 
tési fa tanulás. Ez talán nem meglepő, hiszen az adatokat egy egyszerű döntési fával 
generáltuk. 
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20.26. ábra. (a) Az étterem probléma egy adott példahalmazán felvett tanulási görbe, ami a súlyok 
számos epoch során történő módosításával elért fokozatos hibacsökkenést mutatja. (b) Összehasonlító 
tanulási görbék. amelyek azt mutatják, hogy a döntési fa tanulás valamivel jobb teljesítményt ad, mint a 
többrétegű háló hiba-visszaterjesztéses tanulása. 


A neurális hálók természetesen messze bonyolultabb tanulási feladatokra képesek, bár 
meg kell jegyeznünk, hogy szükség van némi babrálásra ahhoz, hogy megfelelő háló- 
struktúrát kapjunk. és a súlytérben valahol a globális optimum közelébe konvergáljunk. 
A szó szoros értelmében tízezerszám vannak publikált neurális háló alkalmazások. A 20.7. 
alfejezet alaposabban bemutat egyet. 


Neurális hálóstruktúrák tanulása 


Az eddigiekben adott hálóstruktúra mellett történő súlytanulással foglalkoztunk. A Bayes- 
hálókhoz hasonlóan azt is meg kell értenünk, hogy hogyan találhatjuk meg a legjobb háló- 
struktúrát. Ha túl nagy hálót használunk. akkor az egy nagy táblázatot kialakítva képes lesz 
memorizálni az összes példát, de nem feltétlenül lesz képes olyan bemenetekre jól álta- 
lánosítani, amelyeket nem látott korábban." Más szavakkal a neurális háló — éppúgy, 
mint az összes statisztikus modell — hajlamos a túlilleszkedésre (overfitting), ha túl sok 
modellparaméter van. Ezt bemutattuk a 18.1. ábrán (752. oldal), ahol a (b) és (c) sok- 
paraméteres modell jól illeszkedett az adatokra, de nem volt képes olyan jó általánosí- 
tásra, mint a kevés paraméterrel rendelkező (a) és (d) modellek. 

Ha ragaszkodunk a teljesen összekötött hálókhoz, akkor egyedül a rejtett rétegek 
számára és méretére korlátozódnak a választási lehetőségeink. A szokásos megkö- 
zelítés, hogy sok struktúrát kipróbálunk, és megtartjuk a legjobbat. A 18. fejezetben 
ismertetett keresztvalidációs (cross-validation) technikára van szükségünk, ha el 
akarjuk kerülni a teszthalmazra való kukucskálást (peeking). Azaz azt a hálóarchitek- 
túrát választjuk, amely a validációs halmazon a legnagyobb jóslási pontosságot adja. 


14 Azt figyeék meg, hogy a nagyon nagy hálók mindaddig jól általánosítanak, amíg a súlyaikat kis értéken 
tartjuk. Ez a megszorítás az aktivációs értékeket a e(x) szigmoid föggvény lineáris tartományában tartja, ahol 
x közel nulla. Ez viszont azt jelenti, hogy a háló úgy viselkedik, mint egy sokkal kevesebb paraméterrel 
rendelkező lineáris függvény (lásd 20.17. feladat). 
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Ha figyelembe akarunk venni nem teljesen összekötött hálókat is. akkor szükségünk 
van egy hatékony módszerre, amely a lehetséges összeköttetési topológiák nagyon nagy 
terében keres. Az optimális agykárosodás (optimal brain damage) módszere egy tel- 
jesen összekötött hálóból indul ki, és összeköttetéseket távolít el belőle. Miután a hálót 
első menetben tanítottuk, egy információelméleti megközelítés segítségével meghatá- 
rozzuk az eltávolítható összeköttetések optimális készletét. A hálót ezek után újratanít- 
juk, és ha teljesítménye nem csökkent, az eljárást megismételjük. Az összeköttetések 
eltávolításán felül olyan neuronokat is eltávolíthatunk, amelyek nem sokkal járulnak 
hozzá a megoldáshoz. 

Rengeteg algoritmust javasoltak arra, hogy egy kisebb hálóból nagyobbat növessze- 
nek. Egyikük, a csempézés (tiling), a döntési fa tanulásra emlékeztet. Az ötlet az, hogy 
kezdjünk egyetlen neuronnal, amely a legjobbját nyújtja, hogy annyi tanító mintára 
adjon helyes választ, ahányra csak lehet. További neuronokat adunk hozzá, hogy meg- 
oldjuk azokat a példákat, amelyekre az első neuron rossz választ adott. Az algoritmus 
csak annyi neuront ad hozzá, amennyi az összes minta megoldásához szükséges. 


20.6. KERNELGÉPEK 


A neurális hálók tárgyalása után maradt egy dilemmánk. Az egyrétegű hálóknak na- 
gyon egyszerű és hatékony tanulási algoritmusuk van, de nagyon korlátozott a kifeje- 
zőképességük, csupán lineáris döntési határokat képesek megtanulni a bemeneti térben. 
Másrészt a többrétegű hálók sokkal kifejezőbbek — általános nemlineáris függvényeket 
képesek reprezentálni —, de a rengeteg lokális minimum jelenléte, illetve a sokdimen- 
ziós súlytér miatt nagyon nehéz a tanításuk. Ebben az alfejezetben egy relatíve új tanuló- 
módszer családot fedezünk fel, az úgynevezett szupport vektor gépeket (support vector 
machines, SVM), vagy általánosabban a kernelgépeket (kernel machines). Bizonyos 
fokig a kemelgépek a két oldal legjobb tulajdonságait egyesítik. Azaz ezek a módszerek 
hatékony tanítási algoritmusokat alkalmaznak, ugyanakkor képesek bonyolult, nemlineá- 
ris függvények reprezentálására. 

A kernelgépek teljes mélységű tárgyalása meghaladja ennek a könyvnek a kerete- 
ít, de a fő gondolatot egy példán keresztül illusztráljuk. A 20.27. (a) ábra egy kétdi- 
menziós bemeneti teret mutat, amelyet az x — (xy, x2) attribútumok írnak le. A pozi- 
tív példák (y — --1) egy kör alakú rész belsejében. a negatív példák (y — -1) azon 
kívül helyezkednek el. Nyilvánvaló, hogy a probléma megoldására nem létezik line- 
áris szeparátor. Tegyük fel, hogy valamilyen számított tulajdonságok segítségével új 
formára hozzuk a példákat -— azaz az összes bemeneti x vektort leképezzük a tulaj- 
donságértékekből formált új, F(x) vektorra. A példában használjuk a következő há- 
rom tulajdonságot: 

h-i  h-d — 47-V2nm (20.16 
Rövidesen látni fogjuk, hogy honnan vesszük ezeket a tulajdonságokat, de most csak 
nézzük meg azt, hogy mi is történt. A 20.27. (b) ábra mutatja az adatokat az új, a tulaj- 
donságok által definiált háromdimenziós térben: ebben a térben lineárisan szeparál- 
hatók! Ez a jelenség eléggé általános: ha az adatokat megfelelően sokdimenziós térbe 
képezzük le, akkor mindig lineárisan szeparálhatók lesznek. Itt mi csak három dimen- 
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(a) (b) 


20.27. ábra. (a) Egy kétdimenziós tanító halmaz, amelyben a poz példákat fekete, a negatívakat fe- 
hér körök jelölik. Az xf --x3 CI valódi elválasztó határt is bejelöltük. (b) Ugyanazok az adatok az 
CZ, FRY Xx ) háromdimenziós térbe való leképezés után. Az (a) ábrán látható kör atakú döntési ha- 
tár a háromdimenziós térben lineáris döntési felületbe ment át. 






ziót használtunk,!5 de ha N pontunk van — akkor speciális esetek kivételével -—, egy 
N - 1 vagy ennél magasabb dimenziós térben a pontok mindig lineárisan szeparálhatók 
lesznek (lásd 20.21. feladat). 

Ennyi az egész? Egyszerűen létrehozunk egy nagy halom számított tulajdonságot, és a 
megfelelő sokdimenziós térben megkeressük a lineáris szeparátort? Sajnálatos módon 
nem ilyen egyszerű. Emlékezzünk, hogy a d dimenziós térben a lineáris szeparátort egy d. 
paraméteres egyenlet határozza meg, így aztán az a veszély fenyeget, hogy ha d sz N (ahol 
N az adatpontok száma), akkor könnyen túlilleszkedhetünk az adatokra. (Ez ahhoz hason- 
ló, mint amikor egy magas fokszámú polinommal túlillesztünk adatokat, ahogy ezt a 18. 
fejezetben tárgyaltuk.) Ezen okból a kemelgépek rendszerint az optimális lineáris szepa- 
rátort találják meg. Azt nevezzük optimálisnak, amelynek legnagyobb a tartaléka 
(margin): a lineáris szeparátor és a pozitív példák között az egyik oldalon, illetve a 
lineáris szeparátor és a negatív példák között a másikon. (Lásd 20.28. ábra.) A számí- 
tógépes tanulás elmélet módszereit (lásd 18.5. alfejezet) használva megmutatható, hogy 
ez a szeparátor az új példák robusztus általánosítására nézve nagyon jó tulajdonságok- 
kal rendelkezik. 

Hogyan találjuk meg ezt a szeparátort? Kiderül, hogy ez egy kvadratikus progra- 
mozással (guadratic programming) megoldható optimalizálási feladat. Tegyük fel, 
hogy x; példáink vannak, az osztálybasorolásuk y; — :£1, és a bemeneti térben optimá- 
lis szeparátort akarunk találni. Ekkor a megoldandó kvadratikus programozási feladat 
azon paraméterértékek megtalálása, amelyek az a; 2 0 és 37 a; yy — 0 korlátozó felté- 
telek mellett maximálják a következő kifejezést: 


15 Az olvasó felfedezheti, hogy elég tett volna csupán fj és f használata, de a 3D leképezés jobban illuszt- 
rálja az ötletet. 
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20.28. ábra. Az első két dimenzióra vetített közelkép: a 20.27. (b) ábra optimális szeparátora. A szepará- 
tort vastag vonallal jelöltük, a hozzá legközelebbi pontokat — a szupport vektorokat — bekarikáztuk. 
A tartalék nem más, mint a pozitív és negatív példák közti elválasztó sáv szélessége. 


1 
29 220 PIT SBT A) (20.17) 


Bár ennek a kifejezésnek a deriválása nem nagyon fontos pontja a történetnek, de azért 

van két lényeges tulajdonsága. Először is a kifejezésnek egyetlen, globális maximuma 

van, ami hatékonyan megtalálható. Másodszor az adatok kizárólag pontpárok 31 
skalárszorzataként jelennek meg a kifejezésben. Ez a második tulajdonság magára a 
szeparátorra ís igaz, ha az optimális a;-ket kiszámítottuk, akkor: 


h(x) — sal Dooe vo] (20.18) 


Az ezen egyenlettel definiált optimális szeparátor utolsó fontos tulajdonsága az. hogy 
az egyes adatpontokkal asszociált a; súlyok mind nullák, kivéve a szeparátorhoz legkö- 
zelebb eső pontokat - ezeket nevezzük szupport vektoroknak (support vector). 
(Azért nevezzük így őket, mert ők , tartják" a szeparáló síkot.) Mivel rendszerint jóval 
kevesebb szupport vektor van, mint adatpont, ezért az optimális szeparátort meghatáro- 
zó tényleges paraméterszám rendszerint jóval kisebb /-nél. 

Rendszerint nem várhatjuk el, hogy lineáris szeparátort találjunk az x bemeneti térben, 
de könnyen belátható, hogy a sokdimenziós F(x) tulajdonságtérben találhatunk lineáris 
szeparátorokat. Ennek érdekében a (20.17) egyenletben Xx; - x-t egyszerűen kicseréljük 
F(xj) - F(xj)-re. Ez önmagában nem túlzottan figyelemre méltó — x kicserélése F(x)-re 
bármely tanuló algoritmusban elérné a kívánt hatást —, de a skalárszorzatnak van néhány 
érdekes tulajdonsága. Az F(x;) : F(x;) gyakran kiszámítható anélkül, hogy először kiszá- 
mítanánk minden pontra /-et. A (20.16) egyenlettel definiált háromdimenziós tulajdon- 
ságtér példánkban némi algebrai átalakításokkal megmutatható, hogy: 


F(x) : P(x) — (xy xy? 
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xy kifejezést kernelfüggvénynek (kernel function) nevezzük, és K(x;, x)-vel 
jelöljük. A kernelgépek szempontjából ez egy olyan függvény, amely pontpárokra 
alkalmazható avégett, hogy valamilyen tulajdonságtérben kiszámítsuk a skalárszor- 
Zatukat. Ennek megfelelően újrafogalmazhatjuk állításunkat: a (20.17) egyenletben 
X;-xjt egyszerűen kicserélve a K(x;, xj) kernelfüggvényre, a sokdimenziós F(x) tulaj- 
donságtérben találhatunk lineáris szeparátorokat. Így a tanulást a sokdimenziós térben 
végezhetjük, de csupán kernelfüggvények értékét kell kiszámítanunk. nem kell az ösz- 
szes pontra a tulajdonságok teljes készletét kiszámítani. 

A következő lépés — aminek most már kézenfekvőnek kell lennie — az, hogy meglás- 
suk, a K(xy, x)—(x x)? kernelben nincs semmi különleges. Ez egy bizonyos sokdimen- 
ziós tulajdonságtérnek felel meg, de más kemelfüggvények más tulajdonságterekkel 
vannak kapcsolatban. A Mercer-tétel (1909) azt mondja ki, hogy bármely , ésszerű 16 
kernelfüggény megfelel valamilyen tulajdonságtérnek. Ez a tulajdonságtér még egész 
ártatlannak látszó kernelek esetén is nagyon nagy lehet. Például a K(xy, xj) — (1-4 x; - x) d 
Ppolinomiális kernel (polynomial kernel) egy olyan tulajdonságtérnek felel meg, amely- 
nek dimenziója d-ben exponenciális. Ha a (20.17) egyenletben ilyen kerneleket haszná- 
lunk, akkor hatékonyan kereshetünk lineáris szeparátorokat sok milliárd (vagy egyes 
esetekben végtelen) dimenziós terekben. Az eredményként kapott lineáris szeparátorokat 
visszavetítve az eredeti bemeneti térbe, a pozitív és negatív példákat elválasztó tetszőle- 
gesen tekervényes, nemlineáris határfelületeket kaphatunk. 

Említettük az előző részben, hogy a kernelgépek kiemelkedően teljesítenek a kézírá- 
sos számjegyek felismerésében, de gyorsan felhasználják őket más alkalmazásokhoz is, 
különösen olyanokhoz. ahol sok bemeneti tulajdonság van. Ennek a folyamatnak része- 
ként számos új kernelt dolgoztak ki, amelyek karakterfüzérekre, fákra és más nem- 
numerikus adattípusokra alkalmazhatók. Az is megfigyelhető, hogy a kernelmódszer 
nemcsak optimális szeparátorok keresésére alkalmas, hanem bármely olyan algoritmus- 
ra, amely úgy átalakítható, hogy csak adatpontpárok skalárszorzatát használja, mint 
a (20.17), illetve (20.18) egyenlet. Amint ezt sikerült megtennünk, a skalárszorzat 
kicserélhető egy kernelfüggvényre, és elkészítettük az algoritmus kernelesített (kerne- 
lized) változatát. Ez az átalakítás többek közt a £-legközelebbi-szomszéd algoritmusra 
és a perceptron tanulásra is könnyen elvégezhető. 


20.7. ESETTANULMÁNY: KÉZZEL ÍROTT SZÁMJEGYEK 
FELISMERÉSE 


A kézzel írott számjegyek felismerése számos alkalmazásban felmerülő fontos problé- 
ma. Néhány ezek közül: postai levelek irányítószám szerinti automatikus osztályozása, 
csekkek és adó-visszatérítési számlák automatikus leolvasása, kézi számítógépek adat- 
bevitele. Ez olyan terület, ahol gyors volt a fejlődés, részben a jobb tanuló algoritmu- 
soknak, részben a jobb tanító adatbázisoknak köszönhetően. Az Egyesült Államok 
Mérés- és Szabványügyi Hivatala (National Institute of Standards and Technology, 
NIST) egy 60 000 megcímkézett számjegyből álló archívumot hozott létre, amelyben 
minden számjegy egy 20 x 20 — 400 pixeles, 8 bites szürke árnyalatú képen jelenik 


16 Igy ésszerű alatt azt értjük, hogy a Ki — K(x;. xj) mátrix pozítív definít; lásd A) függelék. 
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meg. Ez az új tanuló algoritmusok összehasonlításának egyik standard mércéjévé 
(benchmark) vált. A 20.29. ábra bemutat néhány számjegyet. 

Számos különböző tanuló algoritmust kipróbáltak. Az elsők egyike, és egyben valószí- 
nűleg a legegyszerűbb, a 3-legközelebbi-szomszéd (3-nearest-neighbor) osztályozó, 
amelynek további nagy előnye, hogy nem igényel tanítási időt. Ugyanakkor memóriaala- 
pú algoritmusként mind a 60 000 képet tárolnia kell. és a futási idejű teljesítmény lassú. 
A teszthalmazon elért hibaaránya 2497. 

Kifejlesztettek egy egy-rejtett-rétegű neurális hálót (single-hidden-layer neural 
network) a feladatra, 400 bemenettel (egy bemenet pixelenként) és 10 kimenettel (osz- 
tályonként egy). Keresztvalidációt használva azt találták, hogy durván 300 rejtett neuron 
adta a legjobb teljesítményt. A rétegek között teljes összeköttetést valósítottak meg, így 
összesen 123 300 súlyt használtak. Ez a háló 1,696 hibaarányt ért el. 

LeNet néven egy sor speciális neurális hálót (specialized neural network) szer- 
kesztettek egybe azért, hogy a problémában rejlő struktúrát kihasználják. Az egyik 
strukturális adottság, hogy a bemeneti pixelek kétdimenziós tömböt alkotnak, a másik, 
hogy egy ábra kismértékű pozíció- vagy dőlésiirány-változása lényegtelen. Minden egyes 
háló 32 x 32 egységből álló bemeneti réteget tartalmaz, amelyre a 20 x 20 pixelt úgy 
kapcsolták, hogy minden egyes bemeneti egység egy lokális szomszédságot reprezentált, 
Ezt három rejtett réteg követte. Mindegyik réteg számos n x n-es mezőből áll, ahol  ki- 
sebb, mint a megelőző réteg, tehát a háló a bemenetek alul-mintavételezését valósítja 
meg. Egy mezőn belül mindegyik egységre azonos súlyokat kényszerítünk, így a me- 
ző tulajdonságdetektorként működik: olyan tulajdonságokat érzékel, mint egy hosszú 
függőleges vonal vagy egy rövid félkörív jelenléte. A kimeneti réteg 10 neuronból ált. 
Ennek az architektúrának számos változatát kipróbálták: egyik tipikus képviselőjük 
a rejtett rétegeiben rendre 768, 192, illetve 30 neuront tartalmazó háló volt. A tanító hal- 
mazt kiegészítették további mintákkal, ezeket a valósakból kismértékű affin transzfor- 
mációkkal nyerték, amelyek a következők voltak: eltolás, kismértékű elforgatás, nagyí- 
tás/kicsinyítés. (Természetesen a transzformációknak kismértékűeknek kell lenniük, kü- 
lönben a 6-ot 9-cé transzformáljuk!) A LeNet által elért legkisebb hibaarány 0,996 volt. 

Egy turbózott neurális háló (boosted neural network) három LeNet-architektúrát 
kombinált: a másodikat egy olyan mintakeverékkel tanították, amelyen az első 5096-os 
hibát produkált, a harmadikat pedig olyan mintákkal, amelyekre az első kettő kül ző 
eredményt adott. A tesztelés során a három háló a tíz lehetséges számjegy mindegyikére 
egy-egy súllyal szavazott, ezeket összeadva határozták meg a győztest. A teszthibaarány 
0,796 volt. 

Egy 25 000 szupport vektort használó szupport vektor gép (support vector machine) 
(lásd 20.6. alfejezet) 1,156 hibaarányt ért el. Ez azért figyelemre méltó, mert az SVM- 
technika — éppúgy mint az egyszerű legközelebbi-szomszéd megközelítés — szinte nem 
igényelt gondolkodást vagy iteratív kísérletezést a fejlesztőtől, mégis az évekig fejlesz- 
tett LeNet-et megközelítő eredményt ért el. A szupport vektor gépek valójában nem 
használják ki a probléma struktúráját, tehát ugyanolyan jól teljesítenének, ha a pixele- 
ket valamilyen permutált sorrendben használnánk. 

A virtuális szupport vektor gépet (virtual support vector machine) egy standard 
SVIM-ként indítjuk, majd egy olyan technikával javítjuk, amelyet a probléma struktúrájának 
kihasználására hoztak létre. Ahelyett hogy az összes lehetséges pixelpárból képzett kernelt 
megengednénk, ez olyan kernelekre koncentrál, amelyek szomszédos pixelpárokból formá- 
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20.29. ábra. Néhány példa az NIST kézzel írt számjegyekre létrehozott adatbázisából. A felső sorban a 
0-9 karakterek könnyebben felismerhető példáit mutatjuk be, az alsó sorban pedig ugyanezen szám- 
jegyekre nehezebben felismerhető példákat látunk. 


lódtak. A LeNethez hasonlóan itt is a példák transzformáltjaival egészítjük ki a tanító hal- 
mazt. Egy virtuális SVM érte el az eddigi legjobb hibaarányt, 0,5690-ot. 

Az alakillesztés (shape matching) a számítógépes látás egyik eljárása, amelyet arra 
hoztak létre, hogy tárgyak két különböző képének megfelelő részeit összerendeljék. (Lásd 
24. fejezet.) Az alapötlet, hogy vegyünk egy-egy ponthalmazt mindkét képről, és számít- 
suk ki az első kép minden egyes pontjára, hogy a második kép mely pontja felel meg neki. 
Ebből a megfeleltetésből aztán számítsuk ki a két képet összekapcsoló transzformációt. Ez 
a transzformáció a képek közt egy távolságmértéket határoz meg. Ez a távolságmérték 
indokoltabb, mint egyszerűen az egymástól különböző pixelek megszámlálása. Kiderült. 
hogy az erre a távolságmértékre alapozott 3-legközelebbi-szomszéd algoritmus nagyon jól 
működik. Csupán 20 000-et használva a 60 000 számjegyből, és egy Canny éldetektor ké- 
pének csupán 100 pixelét felhasználva az alakillesztéses eljárás 0,639£ teszthibaarányt ért el. 

Becslések szerint az emberek (human) kb. 024 hibaarányt érnek el ennél a prob- 
lémánál. Ez a szám némiképpen gyanús, mert az embereket nem tesztelték olyan ala- 
posan, mint a gépi tanulás algoritmusait. Az Egyesült Államok Postájának (United States 
Postal Service) egy hasonló — számjegyekből képzett — adathalmazán az emberek által 
elkövetett hibaarány 2,596 volt. 

A következő ábra összegzi a tárgyalt hét eljárás esetén a hibaarányt, a futási időt, a me- 
móriaigényt és a szükséges tanítási időt. Még egy mértéket ad ezekhez, a számjegyek 
azon arányát, amelyet vissza kell utasítanunk, hogy a 0,59- hibaarányt elérjük. Ha például 
egy SVM-nek megengedjük, hogy bemeneti képeinek 1,896-át visszautasítsa — azaz 
átpasszolhatja valakinek, hogy az hozza meg a végső döntést -, akkor a képek többi 
98,290-án a hibaarány 1,196-ról 0,596-ra csökken. 

A következő táblázat a hét tárgyalt technikára összegzi a hibaarányt és néhány továb- 
bi jellemzőt. 
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A statisztikai tanulás módszerei széles skálán helyezkednek el: az egyszerű átlagszámí- 
tásoktól a bonyolult modellek — mint például a Bayes-hálók vagy neurális hálók — 
konstruálásáig. Alkalmazási területük a számítógép-tudományra, a mérnöki alkalmazá- 
sokra, a neurobiológiára, a pszichológiára és a fizikára is kiterjed. Ebben a fejezetben 
bemutattunk néhány alapelvet, és ízelítőt adtunk a matematikai tárgyalásból. A követ- 
kező fő pontok szerepeltek: 


tetésként fogalmazzák meg, a megfigyelések alapján frissítve a hipotézisek a priori 
eloszlásait. Ez a megközelítés jó eszköz az Ockham borotvája elv megvalósítására, 
de bonyolult hipotézisterek esetén hamar kezelhetetlenné válik. 

. A maximum a posteriori (MAP) tanulás az adatok alapján választ ki egyetlen, a 
legvalószínűbb hipotézist. A hipotézis priort itt is használjuk, ez a módszer gyakran 
jobban kezelhető, mint a tiszta Bayes-tanulás. 

" A maximum-likelihood tanulás egyszerűen azt a hipotézist választja, amely maxi- 
málja az adatok likelihood értékét. Megfelel egy egyenletes prior mellett végrehaj- 
tott MAP-tanulásnak. Egyszerű esetekben, mint a lineáris regresszió és a teljesen 
megfigyelhető Bayes-hálók, a maximum-likelihood megoldás könnyen előállítható 
zárt alakban. A naiv Bayes- (naive Bayes) tanulás különösen hatékony technika, 
amely különböző bonyolultságú feladatokra is jól illeszthető. 

s Amikor a változók közt van néhány rejtett (nem megfigyelhető), akkor az EM algo- 
ritmussal lokális maximum-likelihood megoldásokat találhatunk. Az alkalmazások 
kiterjednek a kevert Gauss-jelek osztályozására, a Bayes-hálók tanulására és a rej- 
tett Markov-modellek tanulására. 

s A modellválasztásra (model selection) ad példát a Bayes-hálók struktúrájának 
tanulása. Ez rendszerint egy, a struktúrák terében végzett diszkrét keresést foglal 
magában, Szükség van valamilyen módszerre a modell bonyolultsága és az illeszke- 
dés mértéke közti kompromisszum létrehozásához. 

" A példányalapú modellek (instance-based model) a tanító példányok gyűjtemé- 
nyének eloszlását reprezentálják. Így a paraméterek száma a tanító halmaz méretével 
nő. A legközelebbi-szomszéd (nearest neighbor) módszerek a kérdéses mintapont 
közelében lévő példányokat nézik, míg a kernelmódszerek az összes példány távol- 
sággal súlyozott kombinációját. 

" A neurális hálók (neural networks) nem mások, mint sok paraméterrel rendelkező. 
komplex nemlineáris függvények. Paramétereiket zajos adatok alapján tanulhatják 
meg. Több ezer alkalmazásban használták már őket. 

" A perceptron egy előrecsatolt neurális háló, amelynek nincs rejtett rétege, és csak li- 
neárisan szeparálható (linearly separable) függvények reprezentálására alkalmas. 
Ha az adatok lineárisan szeparálhatók, akkor egy egyszerű súlyfrissítési szabály al- 
kalmazásával az adatokra való pontos illeszkedést tudunk elérni. 

" A többrétegű előrecsatolt (multilayer feed-forward) neurális hálók — ha kellő számú 
neuronjuk van - tetszőleges függvények reprezentálására képesek. A hiba-visszater- 
jesztési (back-propagation) algoritmus a kimeneti hiba minimalizálása érdekében 
gradiensalapú csökkentést valósít meg a paramétertérben. 
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A statisztikai tanulás továbbra is igen aktív kutatási terület. Mind az elmélet, mind a 
gyakorlat hatalmas lépésekkel haladt, míg elértünk addig a pontig, hogy szinte bármely 
modell megtanulható, ha megvalósítható rá egzakt vagy közelítő következtetés. 





Irodalmi és történeti megjegyzések 


Az MI korai éveiben a statisztikai tanuláselmélet a kutatás aktívan művelt területe volt 
(Duda és Hart, 1973), de elkülönült az MI fősodrától, ahogy ez utóbbi egyre inkább 
a szímbolikus módszerekre koncentrált. Különböző formákban folytatódott — egyesek 
explicit módon valószínűségiek, mások nem — olyan területeken, mint az alakzatfel- 
ismerés (pattern recognition) (Devroye és társai, 1996) és az információkeresés (infor- 
mation retrieval) (Salton és McGill, 1983). Nem sokkal a Bayes-háló modellek beveze- 
tése után, az 1980-as évek végén az érdeklődés ismét erősen ráirányult, nagyjából ugyan- 
ebben az időben jelent meg a neurális hálók statisztikai megközelítése. Az 1990-es évek 
végén a gépi tanulás, a statisztika és a neuronhálók területén is az érdeklődés középpont- 
jába kerültek az adatok alapján nagy valószínűségi modelleket létrehozó módszerek. 

A naiv Bayes-modell egyike a legrégebbi és legegyszerűbb Bayes-hálóknak, megjele- 
nése egészen az 1950-es évekig követhető vissza. Eredetüket megemlítettük a 13. fejezet 
záró megjegyzéseiben. Részleges magyarázat található Domingos és Pazzani publikáció- 
jában (Domingos és Pazzani, 1997). A naiv Bayes-tanulás turbózott változata nyerte az 
első KDD Cup adatbányászati versenyt (Elkan, 1997). Heckerman kitűnő bevezetését 
adja a Bayes-háló tanulás általános problematikájának (Heckerman, 1998). Spiegelharter 
és társai a Bayes-hálók Bayesi paramétertanulását tárgyalták Dirichlet-priorok esetére 
(Spiegelharter és társai, 1993). A Bucs szoftvercsomag (Gilks és társai, 1994) számos 
gondolatot megtestesített ezek közül, nagyon hatékony eszközt biztosított az összetett 
valószínűségi modellek felállítására és tanulására. A Bayes-hálóstruktúra tanulásának 
első algoritmusai feltételes függetlenségi teszteket használtak (Pearl, 1988; Pearl és 
Verma, 1991). $pirtes és társai hasonló elvek alapján dolgozták ki átfogó megközelíté- 
süket, valamint a TETRAD csomagot Bayes-hálóstruktúra tanulás céljaira (Spirtes és 
társai, 1993). Az azóta végrehajtott algoritmikus javítások a 2001-es KDD Cup adatbá- 
nyászati versenyen egy Bayes-háló tanulási algoritmus (Cheng és társai, 2002) meggyő- 
ző győzelméhez vezettek. (Itt a speciális megoldandó feladat egy 139 351 tulajdonsággal 
leírt bioinformatikai probléma volt!) Cooper és Herskovits egy likelihood maximalizálá- 
son alapuló struktúratanulási megközelítést fejlesztett ki (Cooper és Herskovits, 1992), 
ezt Heckerman és társai fejlesztették tovább (Heckerman és társai, 1994). Friedman és 
Goldszmidt mutatták ki a lokális feltételes eloszlások reprezentációjának a megtanult 
struktúrára gyakorolt hatását (Friedman és Goldszmidt, 1996). 

A rejtett változókkal és a hiányzó adatokkal való valószínűségi modell tanulás általá- 
nos problematikáját az EM algoritmussal kísérelték meg kezelni (Dempster és társai, 
1977). Ezt számos meglévő módszerből absztrahálták, amelyek közt található a rejtett 
Markov-modell (HMM) tanulásra szolgáló Baum-Welch-algoritmus is (Baum és Petrie, 
1966). (Maga Dempster az EM algoritmust inkább sémának tekinti, nem algorítmusnak, 
mivel jó adag elméleti matematikai munkára lehet szükség mielőtt egy új eloszláscsalád- 
ra alkalmazható lenne.) Manapság az EM egyike a tudományos kutatásban legelterjedteb- 
ben használt algoritmusoknak, McLachlan és Krishnan egy teljes könyvet szenteltek neki 
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És tulajdonságainak (McLachlan és Krishnan, 1997). A kevert modellek — beleértve a ke- 
vert Gauss-modellek — tanulásának speciális problémáit Titterington és társai tárgyalták 
(Titterington és társai, 1985). Az AUTOCLASS volt az első sikeres rendszer az MI-n belül, 
amely az EM-et alkalmazta kevert modellezésre (Checseman és társai, 1988; Cheeseman 
és Stutz, 1996). Az AUTOCLASS-t egy sor valós tudományos osztályozási feladatra alkal- 
mazták; ezek közül kettő: spektrális tulajdonságok alapján új csillagtípusok felfedezése 
(Goebel és társai, 1989); új fehérje- és intronosztályok felfedezése DNS/fehérjeszekven- 
cia adatbázisokban (Hunter és States, 1992). 

A rejtett változókkal rendelkező Bayes-hálók tanulására kifejlesztett EM algoritmus 
Lauritzen munkája (Lauritzen, 1995). Mind a Bayes-hálók, mind a dinamikus Bayes- 
hálók esetén a gradiensalapú eljárások is hatékonynak bizonyultak (Russell és társai, 
1995; Binder és társai, 1997a). A strukturális EM algoritmus kifejlesztése Friedman 
nevéhez fűződik (Friedman, 1998). A Bayes-hálók struktúrájának megtanulhatósága 
szoros kapcsolatban van a kauzális kapcsolatok adatokból történő visszanyerésének 
kérdésével. Azaz lehetséges-e Bayes-hálókat úgy megtanulni, hogy az előállított háló- 
struktúra valós kauzális hatásokat jelezzen? A statisztikusok hosszú évek óta elkerülték 
ezt a kérdést, azt hitték, hogy a megfigyelt adatok (ellentétben a kísérletek során előáll- 
takkal) csak korrelációs információt hordoznak. Végül is bármely két változóra, amelyek 
egymással kapcsolatban állónak tűnnek, lehet, hogy valójában inkább egy harmadik - 
mindkettőre kauzális hatást gyakorló — ismeretlen változó hatása alatt állnak, nem pedig 
egymásra gyakorolnak közvetlen hatást. Ennek ellenkezőjére Pearl adott meggyőző érve- 
ket (Pearl, 2000). Megmutatta, hogy valójában számos eset van, amikor a kauzalitás kide- 
ríthető, és kauzális háló (causal network) formalizmus alakítható ki az oksági kapcsola- 
tok, a beavatkozás hatásának, valamint a szokásos feltételes valószínűségek beépítésére. 

A legközelebbi-szomszéd modellek legalább Fix és Hodges (Fix és Hodges, 1951) 
munkájáig nyúlnak vissza, és azóta a statisztika és alakfelismerés standard eszközei. 
Az MI-n belül Stanfill és Waltz népszerűsítették ezeket a modelleket (Stanfill és Waltz, 
1986), ők a távolságmetrika adatokhoz történő adaptálási módszereivel foglalkoztak. 
Hastic és Tibshirani kifejlesztettek egy módszert, amellyel a tér egyes pontjaihoz kötöt- 
ték az ezen pont körüli adateloszlástól függő metrikát (Hastie és Tibshírani, 1996). 
A legközelebbi-szomszédok hatékony indexelési sémával történő megtalálásával az al- 
goritmusokat kutató közösség foglalkozott (pl. Indyk, 2000). A kernelsűrűség-becslést, 
amelyet Parzen ablak (Parzen window) sűrűségbecslésnek is neveznek, kezdetben 
Rosenblatt és Parzen tanulmányozta (Rosenblatt, 1956; Parzen, 1962). Azóta óriási az 
irodalma a különböző becslők tulajdonságai vizsgálatának. Devroye alapos bevezetést 
nyújt ehhez a témához (Devroye, 1987). 

A neurális hálók irodalma túl nagy ahhoz (napjainkig kb. 100 000 publikáció), hogy 
részletesen bemutathassuk. A korai fejleményekről Cowan és Sharp készített összefog- 
lalót (Cowan és Sharp, 1988b; 1988a), McCulloch és Pitts munkásságával kezdve az 
áttekintést (McCulloch és Pitts, 1943). Norbert Wiener — a kibernetika és a szabályo- 
záselmélet egyik úttörője (Wiener, 1948) — együtt dolgozott McCullochkal és Pitts- 
szel, és nagy hatást gyakorolt egy sor fiatal kutatóra, például Marvin Minskyre, aki 
valószínűleg elsőként fejlesztett ki működő neurálisháló-hardvert 1951-ben (Minsky és 
Papert, 1988, pp. ix-x.) Ezalatt Nagy-Britanniában W. Ross Ashby (szintén a kiberne- 
tika egyik úttörője; Ashby, 1940). Alan Turing. Grey Walter és mások megalakították 
a Ráció Klubot (Ratio Club) azok számára, akik , rájöttek Wiener gondolataira, még 
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mielőtt Wiener könyve megjelent". Ashby Az agy felépítése (Design for a Brain, 1948, 
1952) című könyvében vetette fel, hogy stabil adaptív viselkedést létrehozó alkalmas 
visszacsatoló hurkokkal rendelkező homeostatikus!" (homeostatic) eszközök segítsé- 
gével intelligenciát lehetne létrehozni. Turing egy kutatási jelentést írt Intelligens 
Gépek (Intelligent Machinery) címen (Turing, 1948), amely a következő mondattal 
kezdődik: , Javaslom megvizsgálni azt a kérdést, hogy vajon lehetséges-e az, hogy a gé- 
pek intelligens viselkedést mutassanak", majd leírja a rekurrens neurális hálózatokat, 
amelyeket , B típusú nem szervezett gépek" néven vezet be, és megadja tanításuknak 
exy lehetséges megközelítését. Sajnos ezt a jelentést 1969-ig nem is publikálták, és nap- 
jainkig lényegében figyelmen kívül hagyták. 

Frank Rosenblatt (Rosenblatt, 1957) nevéhez fűződik a modern , perceptron" felfe- 
dezése, és ő bizonyította be a perceptronkonvergencia tételt (Rosenblatt, 1960), bár ezt 
már a neurális hálók területén kívül eső, tisztán matematikai munkák is előrevetítették 
(Agmon, 1954; Motzkin és Schoenberg, 1954). Volt némi, a többrétegű hálózatokra irá- 
nyuló korai kutatás is, amelynek eredményei például a Gamba-perceptronok (Gamba és 
társai, 1961) és a madaline-ok (Widrow, 1962). A Learning Machines (Nilsson, 1965) c. 
könyv áttekintést ad a korai kutatás legnagyobb részéről. A korai perceptronkutatások ha- 
lálát siettette — a szerzők későbbi állítása szerint csak magyarázta — a Perceptrons c. 
könyv (Minsky és Papert, 1969), amelyben a terület matematikai precizitásának hiányát 
Panaszolták fel. A könyv rámutatott, hogy egyrétegű perceptronokka! csak lineárisan 
szeparálható helyzetek reprezentálhatók, és felhívta a figyelmet a többrétegű hálók 
hatékony tanuló algoritmusainak hiányára. 

A San Diegóban, 1979-ben tartott konferencia publikációira alapozott kiadvány 
(Hinton és Anderson, 1981) tekinthető a konnekcionizmus újjáéledése jelének. Nagy fi- 
gyelmet keltett a kétrészes , PDP" (Párhuzamos elosztott feldolgozás — Parallel Distri- 
buted Processing) antológia (Rumelhart és társai, 19862), illetve a Nature-ben megjelent 
rövid cikk (Rumelhart és társai, 1986b). A neurális hálókkal foglalkozó cikkek száma az 
1980-1984 közötti publikációk számáról 200-szorosára nőtt 1990-1994-re. A mágneses 
spin üvegek fizikai elméletének felhasználásával elvégzett neurális háló analízis (Amit és 
társai, 1985) nem csupán szorosabb kapcsolatot hozott a statisztikus mechanika és 
neurális hálók elmélete közt, hanem tekintélyt is adott a területnek. A hiba-visszaterjesztés 
(back-propagation) technikáját viszonylag hamar kitalálták (Bryson és Ho, 1969), de több 
alkalommal újra felfedezték (Werbos, 1974: Parker, 1985). 

Az 1990-es években megjelent szupport vektor gépeknek (Cortes és Vapnik, 1995) 
napjainkban gyorsan növekvő az irodalmuk, amely olyan tankönyveket is magában 
foglal, mint Cristianini és Shawe-Taylor könyve (Cristianini és Shawe-Taylor, 2000). 
Nagyon népszerűnek és bizonyos feladatokra nagyon hatékonynak bizonyultak, ilyenek 
például a szövegkategorizálás (Joachims, 2001), a bioinformatikai kutatás (Brown és 
társai, 2000). a természetes nyelvű szöveg feldolgozása, mint a kézzel írt számjegyek 
DeCoste és Schölkopf által megvalósított felismerése (DeCoste és Schőlkopf, 2002). 

A szavazó perceptron szintén egy olyan technika, amely a kerneltrükköt alkalmazza az 
exponenciális tulajdonságtér implicit reprezentációjára (Collins és Duffy, 2002). 


17 omeosztázis: egy szervezet különböző. de egymással kölcsönhatásban álló elemei vagy elemek csoport- 
jai között fennálló stabil egyensúly vagy egyensúly felé vató törekvés. Gyakran biológiai összefüggésben hasz- 
nált kifejezés. (A ford.) 
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Számos forrás adható meg a neurális hálók valószínűségi interpretációjára, például 
(Baum és Wilczek, 1988), valamint (Bridle, 1990). A szigmoid függvény szerepét Jordan 
tárgyalja (Fordan, 1995). MacKay javasolta a neurális hálók Bayes-i paraméterbecslését 
(MacKay, 1992), amelyet Neal fejlesztett tovább (Neal, 1996). A neurális hálók függvény- 
reprezentációs képességeit Cybenko vizsgálta (Cybenko, 1988; 1989), aki megmutatta, 
hogy két rejtett réteg elegendő tetszőleges függvény reprezentációjához, tetszőleges 
folytonos függvény reprezentációjához pedig elég egy réteg. A haszontalan összeköt- 
tetések eltávolítását célzó , optimális agykárosodás" módszer LeCun és társai eredménye 
(LeCun és társai, 1989), míg Sietsma és Dow mutatták meg, hogyan kell a felesleges 
neuronokat eltávolítani (Sietsma és Dow, 1988). A nagyobb struktúrák növesztéssel való 
előállítására szolgáló csempézési algoritmus Mézard és Nadal munkája (Mézard és Nadal, 
1989). A kézzel írt számjegyek felismerésével foglalkozó algoritmusokról LeCun és társai 
írtak áttekintő publikációt (LeCun és társai, 1995). Azóta jobb hibaarányt értek el Belongie 
és társai (2002) az alakillesztési eljárás (Belongie és társai, 2002), valamint DeCoste és 
Schölkopf a virtuális szupport gép alkalmazásával (DeCoste és Schölkopf, 2002). 

A számítógépes tanulás elmélete területén tevékenykedő kutatók foglalkoztak a neurá- 
lis háló tanulás komplexitásával. Az első számítási eredményeket Judd kapta (Judd, 
1990), aki megmutatta, hogy egy példahalmazzal konzisztens súlyhalmaz megtalálásának 
általános problémája — még nagyon erősen korlátozó feltételek esetén is — NP-teljes. 
A mintakomplexitásra vonatkozó eredmények közül néhány Baum és Haussler munká- 
jához fűződik, akik megmutatták, hogy W súly esetén a hatékony tanításhoz szükséges 
mintaszám W log W arányában nő (Baum és Haussler, 1989).1§ Azóta Anthony és Bartlett 
egy sokkal fejlettebb elméletet fejlesztettek ki (Anthony és Bartlett, 1999), amely magá- 
ban foglalja azt a fontos eredményt, hogy a háló reprezentációs képessége a súlyok nagy- 
ságrendjétől és számától egyaránt függ. 

Az általunk nem tárgyalt legnépszerűbb neurális háló a radiális bázisfüggvény (RBF) 
(radial basis function) háló. A radiális bázisfüggvény kernelek súlyozott kombináció- 
ját (természetesen rendszerint Gauss-kernelekét) alkalmazza függvényapproximációra. 
Az RBF-hálókat két fázisban taníthatjuk: először egy nem ellenőrzött osztályozással 
tanítjuk a Gauss-függvények paramétereit (az átlagokat és varianciákat), mint a 20.3. 
alfejezetben láttuk. A második fázisban a Gauss-függvények relatív súlyát határozzuk 
meg. Ez egy lineáris egyenletrendszer megoldása, amiről tudjuk, hogy közvetlenül 
hogyan oldható meg. Így az RBF-tanítás mindkét fázisának vonzó tulajdonságai vannak: 
az első fázis nem ellenőrzött, tehát nincs szükségünk hozzá címkézett mintákra, a má- 
sodik ugyan felügyelt. de hatékonyan elvégezhető. A részleteket lásd Bishop publiká- 
ciójában (Bishop, 1995). 

A rekurrens hálókat (recurrent network), amelyekben a neuronok hurkokba van- 
nak kapcsolva, említettük ugyan a fejezetben, de nem részleteztük. A legjobban meg- 
értett rekurrens háló osztályt valószínűleg a Hopfield-hálók (Hopfield networks) 
(Hopfield, 1982) alkotják. A Hopfield-háló kétirányú kapcsolatokat használ szímmetri- 
kus súlyokkal (azaz W; ; — W; ;), minden neuron bemeneti és egyben kimeneti egység 
is, a g aktivációs függvény az előjelfüggvény. az aktivációs szint pedig csak a -k1 lehet. 
A Hopfield-háló asszociatív memóriaként működik: miután egy mintahalmazon taní- 


18 Ez nagyjából igazolta , Bernie bácsi" törvényét: a szabályt Bernie Widrowról nevezték el, aki azt javasolta, 
hogy nagyjából tízszer annyi mintát használjanak, mint a súlyok száma. 
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tottuk, egy új bemeneti stimulus hatására egy olyan aktivációs mintára áll be, amely a 
tanító példák közül a leginkább emlékeztet az új bemenetre. Ha például a tanító halmaz 
egy halom fénykép, az új bemenet pedig az egyik fénykép egy kis darabja, akkor akti- 
vációs szintjeivel a háló vissza fogja állítani az adott darabból a fényképet. Figyeljük 
meg, hogy a fényképek nincsenek elkülönülten tárolva a hálóban: mindegyik súly az 
összes fénykép egy részleges kódja. Érdekes elméleti eredmény, hogy az N neuronból 
álló Hopfield-háló legfeljebb 0,138W tanító mintát képes megbízhatóan tárolni. 

A Boltzmann-gépek is szimmetrikus súlyokat használnak, de tartalmaznak rejtett 
egységeket is (Hinton és Sejnowski, 1983; 1986). Ráadásul aktivációs függvényük 
sztochasztikus: a kimenet ! értékének valószínűsége a teljes súlyozott bemenetnek 
valamilyen függvénye. A Boltzmann-gépek ennek megfelelően a szimulált lehűtés ke- 
resési eljárásra (lásd 4. fejezet) emlékeztető állapotátmenetek során jutnak el a tanító 
halmazt a legjobban közelítő konfigurációhoz. Kimutatható, hogy a Boltzmann-gépek 
nagyon közeli rokonságban vannak bizonyos speciális Bayes-hálókkal, amelyeket szto- 
chasztikus szimulációs algoritmussal értékelünk ki. (Lásd 14.5. alfejezet.) 

A kernelgépek alapötletének első alkalmazása Aizerman és társai munkájához fűző- 
dik (Aizerman és társai, 1964, de a szupport vektor gépek felé mutató, teljes elméleti 
kidolgozás Vlagyimir Vapniknak és kollégáinak köszönhető (Boser és társai, 1992; 
Vapnik, 1998). A precíz elméleti tárgyalás megtalálható Cristianini és Shawe-Taylor, 
illetve Schölkopf és Smola könyvében (Cristianini és Shawe-Taylor, 2000; Schölkopf 
és Smola, 2002), valamint egy barátságosabb kifejtés található Cristianini és Schölkopf 
Al Magazine-ban megjelent cikkében. 

Ennek a fejezetnek az anyaga a statisztika, alakfelismerés és neurális hálók kutatásá- 
ban elért eredményeket integrálja, tehát a történetet sokszor, sokféle módon elmondták 
már. A Bayes-statisztikáról jó publikációkat találunk, ilyenek például a (DeGroot, 1970), 
a (Berger, 1985), továbbá a (Gelman és társai, 1995). A statisztikus tanulás elméletének 
kiváló tárgyalása található a (Hastie és társai, 2001) munkában. Az alakosztályozás té- 
makörében Duda és Hart könyve számít klasszikusnak (Duda és Hart, 1973), melynek 
nemrég új kiadása is megjelent (Duda és társai, 2001). A neurális hálókról a (Bishop, 
1995) és a (Ripley, 1996) a legfontosabb könyvek. A számítógépes neurális tudományt 
a (Dayan és Abbott, 2001) könyv tárgyalja. A neurális hálók és hozzájuk kapcsolódó 
témák legfontosabb konferenciái az évente megrendezett NIPS- (Neural Information 
Processing Conference) konferenciák, melyek kiadványait az Advances in Neural 
Information Processing Systems sorozatban jelentetik meg. A Bayes-hálók tanulásáról 
szóló írások az Uncertainty in AI és a Machine Learning konferenciákon jelennek meg, 
továbbá számos statisztikával foglaikozó konferencián. A neurális hálókkal foglalkozó 
újságok között érdemes megemlíteni a Neural Computationt, a Neural Networksöt és 
az IEEE Transaction on Neural Networksöt. 


Feladatok 


20.1. A20.1. ábrán használt adatokat úgy tekinthetjük, mintha As generálta volna őket. 
A másik négy hipotézis mindegyikére generáljon egy-egy 100 hosszúságú adat- 
halmazt, rajzolja fel a megfelelő P(hild1,.... d.) és P(D,a1 — citromld)...., dm) 
görbéket! Értékelje az eredményeket. 
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20.2. 


20.3. 


244. 


20.5. 


20.7. 


20.8. 


Ismételje meg a 20.t. feladatot úgy, hogy a P(D,,4 — citromlhhuaps-:-s dm) il- 
letve P(D, 4 — citrom]hun) görbéket rajzolja fel. 


Tegyük fel, hogy Anna számára a meggycukorkák hasznossága c4, a citrom- 
cukorkáké /4, míg Béla számára a hasznosságok rendre cg és (p. (De ha Anna 
kibontott egy cukorkát, akkor azt Béla már nem fogja megvásárolni tőle.) Ha 
Béla sokkal jobban szereti a citromízű cukorkát, mint Anna, akkor Anna felte- 
hetőleg bölcsen teszi, ha eladja a cukros zacskóját, amikor már kellően biztos a 
citromízűek arányában. Másrészről viszont, ha Anna túl sok cukrot kibontott 
már az arány eldöntése során, akkor a zacskó értéktelenné válik. Vizsgálja meg 
a cukroszacskó-eladás optimális pillanatának meghatározását. Határozza meg az 
optimális eljárás várható hasznosságát, a 20.1. alfejezet a priori eloszlásainak 
feltételezésével. 





Két statisztikus elmegy az orvoshoz, és mindkettőről ugyanazt a diagnózist ál- 
lítja fel az orvos: 4096 eséllyel a halálos A betegségben, 6096 eséllyel a szintén 
végzetes B betegségben szenvednek. Szerencsére van az A és B betegségnek is 
olcsó, 10096-ban hatásos, mellékhatás nélküli gyógyszere. A statisztikusoknak 
lehetőségük van az A elleni, a B elleni vagy mindkét gyógyszert szedni, de dönt- 
hetnek úgy is, hogy egyiket sem szedik. Mit fog az első statisztikus — aki elszánt 
Bayes-hívő - választani? Mit tesz a második, aki mindig a maximum-likelihood 
hipotézist választja? 

Az orvos némi kutatás után felfedezi, hogy a B betegségnek két változata van, 
a dextro-B és a levo-B, amelyek egyforma valószínűséggel lépnek fel. és egy- 
formán jól kezelhetők az anti-B gyógyszerrel. Mit fog csinálni a két statisztikus 
most, hogy három hipotézis van? 


Magyarázza meg, hogyan alkalmazható a 18. fejezetben tárgyalt turbózás mód- 
szere a naiv Bayes-tanulásra. Tesztelje a kapott algoritmust az étterem tanulási 
problémán. 


Vegyen m darab (xj, yj) adatpontot, az xj-ből a (20.5) egyenlet alapján generálja 
9j-t. Keresse meg azokat a 04, 0 és o értékeket. amelyek maximálják az adatok 
feltételes log likelihood értékét. 


Vizsgálja a láz 14.3. alfejezetben bemutatott zajos-VAGY modelljét. Magyaráz- 
Za meg, hogyan alkalmazható a maximum-likelihood tanulás arra, hogy egy tel- 
jes adathalmazra illesszük egy ilyen modell paramétereit. (Segítség: a parciális 
deriváltakra használja a láncszabályt.) 


Ebben a feladatban a (20.6) egyenlettel definiált béta-eloszlások tulajdonságait 

vizsgáljuk. 

(a) A (0. I] tartomány feletti integrálás alapján mutassa meg, hogy a béta[a,b] 
eloszlás normalizáló faktorát a — T(a -- b)/T(apT(b) adja, ahol T(x) az 
úgynevezett gamma-függvény, amelynek definíciója: T(x-1— xx TIT) 
és I(1) — I. (Egész x-ekre T(x 4 1) — x!) 
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20.9. 


20.10. 


20.11. 


20.12. 


20.13. 
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(b) Mutassa meg, hogy az átlagérték a/(a - b). 

(c) Állítsa elő a modus(okajt (a legvalószínűbb 8 értéke(ke)t). 

(d) Jellemezze a béta[c, e] eloszlást nagyon kis € esetén. Mi történik, ha egy 
ilyen eloszlást frissítünk? 


Vegyen egy tetszőleges Bayes-hálót, egy ehhez a hálóhoz tartozó teljes adathal- 
mazt és az adathalmaznak a háló által megadott likelihood-értékét. Adjon egy- 
szerű bizonyítást arra, hogy az adathalmaz likelihood-értéke nem csökkenhet, ha 
a hálóhoz hozzáadunk egy új kapcsolatot, majd újraszámoljuk a maximum- 
likelihood paramétereket. 


Vizsgálja meg az EM alkalmazását arra a problémára, amikor a 20.10. (a) ábrán 
látható háló paramétereit akarjuk tanulni. miközben az igazi paraméterértékeket 
a (20.7) egyenlet adja. 

(a) "Magyarázza meg, hogy miért nem működne az EM algoritmus, ha csak két 
attribútum volna, és nem három. 

(b) Végezze el az első iterációra vonatkozó számítást a (20.8) egyenletből 
kiindulva. 

(c) Mi történik, ha induláskor az összes paramétert ugyanarra a p értékre állít- 
juk? (Segítség: hasznos lehet. ha empirikusan megvizsgálja, mielőtt az 
általános eredményt megpróbálná levezetni.) 

(d) Írja fel a 836. oldalon található adattáblázatra a log likelihoodnak a paramé- 
terekkel kifejezett összefüggését. Számítsa ki minden egyes paraméterre a 
parciális derivált értékét! Vizsgálja meg a (c) részben rögzített pont jellegét. 


Hozzon létre manuálisan egy olyan neurális hálót, amely két bemenetének az 
XOR függvényét számítja ki. Bizonyosodjon meg arról, helyesen specifikálta-e 
azt, hogy milyen egységeket kell használni. 


Hozzon létre egy olyan szupport vektor gépet, amely az XOR függvényt számít- 
ja ki. Kényelmesebb lesz, ha mind a bemeneteknél, mind a kimenetnél —1-et és 
I-et használ 0 és --1 helyett. Ennek megfelelően egy minta például ([-1, 1], 1) 
vagy (1-1, -1], -1) lesz. Tipikus, hogy az x bemenetet egy ötdimenziós se 
képezzük le, ahol kettő az eredeti xy és xz dimenzió, a másik három pedig Al, 2. x4, 
illetve xy xa kombinációi. Ebben a feladatban viszont csak két dimenziót hasz- 
nálunk: xj-et és xy x2-t. Rajzolja fel ebben a térben a négy bemeneti pontot és a 
maximális tartalékkal rendelkező osztályozót. Mekkora a tartalék? Rajzolja meg 
a határoló vonalat az eredeti, euklideszi térben. 


Egy egyszerű perceptron nem képes az XOR függvény (vagy általánosabban 
a paritásfüggvény) ábrázolására. Mutassa be, hogy hogyan alakulnak egy négy- 
bemenetű, ugrásfüggvényt használó perceptron súlyai, amikor sorban a paritás- 
függvényből származó minták érkeznek (kezdetben minden súly 0,! értékű 
volt). 
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20.14. Idézzük fe! a 18. fejezetből, hogy n bemenet esetén 22" különböző logikai függ- 
vény létezik. Hányat tud reprezentálni ezek közül az ugrásfüggvényt használó 
perceptron? 


20.15. Vegyük a következő — hat bemeneti értéket (7j—IG) és egy, ezekhez tartozó kí- 
vánt kimeneti értéket (7) megadó — mintahalmazt. 
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(a) Futassa a perceptron tanulási szabályt erre az adathalmazra, és adja meg 
a végső súlyokat. 
(b) Futassa a döntési fa tanulási algoritmust, és adja meg az eredményül kapott 
döntési fát. 
(c) Értékelje az eredményeket. 


24.16. A (20.13) egyenletből kiindulva mutassa meg, hogy ÖL/ÖW; — Err : Xxj. 


20.17. Tegyük fel, hogy egy lineáris aktivációs függvényeket használó neurális hálónk 
van. Azaz minden neuron kimenete a bemenetek súlyozott összegének c-szerese, 
ahol c egy konstans. 


(a) 


(b) 


Tegyük fel, hogy a hálónak egy rejtett rétege van. Írja fel a súlyok egy 
adott W értékkészletére azokat az egyenleteket, amelyek megadják a ki- 
meneti réteg neuronjainak kimeneti értékeit W és a bemeneti réteg I érté- 
keinek függvényében — anélkül hogy explicit módon megjelennének az 
egyenletekben a rejtett neuronok kimeneti értékei. Mutassa meg, hogy 
létezik olyan háló, amelynek nincs rejtett rétege, de ugyanezt a függvényt 
valósítja meg. 

Ismételje meg az (a) rész alatti feladatot, de tetszőleges számú rejtett 
réteg esetére. Milyen következtetést vonhat le a lineáris aktivációs függ- 
vényekre? 


20.18. Hozzon létre egy adatstruktúrát rétegekbe szervezett, előrecsatolt neurális hálók 


HT 





fi leírására, amely tartalmazza az előreterjesztéshez és a hiba-visszaterjesztéshez 


szükséges információt is. Ezt használva írjon egy NEURÁLIS-HÁLÓ-KIMENET 
nevű programot, amely egy mintát és egy neurális hálót kap bemenetként, és 
kiszámítja a neurális hálónak a mintára adott kimeneti válaszát. 


20.19. Tegyük fel, hogy egy tanító halmaz csupán egyetlen példát tartalmaz, de azt 
100-szor. A 1090 esetből 80-ban az egyetlen kimeneti érték 1; a másik 20-ban 0. 
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20.20. 


20.21. 
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Mit ad erre a példára egy hiba-visszaterjesztéssel tanított háló, ha tanítottuk, és 
elérte a globális optimumot? (Segítség: a globális optimum megtalálásához 
differenciálja a hibafüggvényt, és keresse a nullahelyét.) 


A 20.24. ábrán látható hálónak négy rejtett neuronja van. Ezt a neuronszámot 
némiképpen ötletszerűen választottuk. Végezzen szisztematikus kísérleteket, 
hogy különböző számú rejtett neuronnal rendelkező hálókra lemérje a tanulási 
görbét. Mi az optimális neuronszám? Lehetséges lenne keresztvalidációs mód- 
szerrel megtalálni a legjobb hálót még a kísérletek előtt? 


Vegyük azt a problémát, amikor N adatpontot akarunk lineáris osztályozóval 

szétválasztani pozítív és negatív példákra. Nyilvánvaló, hogy N — 2 pont esetén 

ez egy d — 1 dimenziós egyenesen mindig megtehető, függetlenül attól, hogy 

a pontok hol helyezkednek el, és hogy vannak címkézve (kivéve, ha ugyanazon 

a helyen vannak). 

(a) Mutassa meg, hogy a szeparálás mindig elvégezhető N — 3 pontra egy 
d — 2 dimenziós síkon, ha a pontok nem egy egyenesre esnek. 

(b) Mutassa meg, hogy nem lehet mindig elvégezni a szeparálást N — 4 pont- 
ra egy d — 2 dimenziós síkon. 

(c) Mutassa meg, hogy a szeparálás mindig elvégezhető N — 4 pontra egy 
d — 3 dimenziós térben, ha a pontok nem esnek egy síkra. 

(d) Mutassa meg, hogy nem lehet mindig elvégezni a szeparálást N — 5 pont- 
ra egy d — 3 dimenziós térben. 

(e) Egy törekvő diák kitűzheti maga elé, hogy bebizonyítja: N — 1 dimenziós 
térben általános helyzetben található N pont lineárisan szeparálható 
(de N -- I nem). Ebből következik, hogy az N — 1 dimenziós lineáris félterek 
VC-dimenziója (lásd 18. fejeze) N. 


21. MEGERŐSÍTÉSES TANULÁS 


Ebben a fejezetben azt vizsgáljuk, hogy egy ágens hogyan képes tanulni a sikereiből és 
a kudarcaiból, illetve a jutalomból és a büntetésből. 


21.1. BEVEZETÉS 


A 18. és 20. fejezetben olyan tanuló módszereket mutattunk be, amelyek példák alapján 
függvényeket vagy valószínűségi modelleket sajátítanak el. Ebben a fejezetben azzal fog- 
lalkozunk, hogy az ágens mi módon tanulhatja meg azt, hogy wit tegyen, különösen akkor, 
amikor nincs tanár, aki minden előforduló körülmény esetére elárulná a helyes cselekvést. 

Vegyük példaként a sakkot. Tudjuk, hogy az ágens képes megtanulni sakkozni fel- 
ügyelt tanulással, vagyis ha példaként sakkállásokat mutatunk neki, megnevezve az 
adott állásban a legjobb lépést. De mit tud csinálni az ágens akkor, ha nincs kéznél egy 
barátságos tanító, aki példákat mutatna? Véletlen lépések kipróbálásával végül is az 
ágens felépítheti környezetének prediktív modelljét: milyen lesz az állás, ha meglép egy 
adott lépést, esetleg még azt is modellezheti, hogy az ellenfél várhatóan mit fog vála- 
szul lépni. A következő azonban a probléma: visszacsatolás nélkül — tehát anélkül, hogy 1 
tudná, mi a jó és mi a rossz — az ágensnek semmilyen alapja sem lesz eldönteni azt, 
hogy melyik lépést húzza meg. Az ágensnek tudnia kell, hogy valami jó történt, amikor 
nyert, illetve valami rossz történt, amikor vesztett. Az ilyen típusú visszacsatolást nevez- 
zük jutalomnak (reward) vagy megerősítésnek (reinforcement). A sakkhoz hasonló 
játékokban a megerősítés csak a játék végén jelenik meg. Más környezetben a jutalom 
gyakrabban jön, például a pingpongban mindegyik pont jutalomnak tekinthető éppúgy, 
mint a mászás tanulásakor bármely előrefelé haladás. Az általunk használt tárgyalás- 
módban az ágens a jutalmat is az észlelés részeként kezeli, de valahogy bele kell lennie 
s huzalozva", hogy ez a rész jutalom, és nem csupán egy észlelésfajta. Úgy tűnik, hogy 
az állatokba be van építve, hogy a fájdalom és az éhség negatív , jutalom", míg a gyö- 
nyör és az élelem pozitív jutalom. A megerősítéses tanulást az állatok pszichológiáját 
kutatók 60 éve intenzíven tanulmányozzák. 

A jutalom fogalmát a 17. fejezetben vezettük be. ahol a Markov döntési folyamatok 
(Markov decision process, MDP) optimalitásának definiálására szolgált. Optimális 
stratégiának neveztük azt a stratégiát, amely maximálja a várható összjutalmat. A meg- 
erősítéses tanulás (reinforcement learning) feladata az, hogy optimális (vagy közel 
optimális) stratégiát tanuljunk az adott környezethez. Míg a 17. fejezetben az ágensnek 
a teljes környezeti modell és a jutalomfüggvény a rendelkezésére állt, addig a jelen fe- 
jezetben egyikről sem feltételezünk semmilyen előzetes tudást. Képzelje el, hogy egy 
új, ismeretlen játékot játszik, amelynek nem ismeri a szabályait. Nagyjából száz lépés 
után az ellenfele bejelenti: ön vesztett. Dióhéjban ez jellemzi a megerősítéses tanulást. 
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Számos bonyolult problématerületen a megerősítéses tanulás az egyetlen lehetséges út 
arra, hogy egy programnak magas szintű működést tanítsunk. Például a játékok terén na- 
gyon nehéz lenne a szakember dolga: a lehetséges nagyszámú állás pontos és következe- 
tes értékelését kellene elvégeznie annak érdekében, hogy a példák alapján közvetlenül meg- 
tanítson egy kiértékelő függvényt. Ehelyett a programnak megadható az az információ, 
hogy nyert vagy vesztett, és ezt felhasználhatja egy olyan kiértékelő függvény tanulására, 
amely elfogadható pontossággal képes megbecsülni bármely adott állásban a nyerés való- 
színűségét. Hasonlóképpen rendkívül nehéz megtanítani egy ágenst helikopter vezetés- 
ére, de ha megfelelő negatív jutalmat kap minden balesetnél, bukdácsoló mozgásnál vagy 
a beállított útvonaltól való eltérésnél, akkor az ágens önállóan megtanulhat repülni. 

Bizonyos értelemben a megerősítéses tanulás az egész MI-problémát átfogja. Egy 
ágenst belehelyezünk valamilyen környezetbe, és meg kell tanulnia ott sikeresen viselked- 
ni. Ahhoz, hogy ezt a fejezetet áttekinthető bonyolultsági szinten tartsuk, csak egyszerű 
helyzetekre és egyszerű ágensekre fogunk koncentrálni. A fejezet legnagyobb részében tel- 
jesen megfigyelhető környezetet feltételezünk, tehát a megfigyelések informálnak az aktu- 
ális állapotról. Másrészt viszont azt feltételezzük, hogy az ágens sem azt nem tudja, hogyan 
működik a környezet, sem azt, hogy cselekedeteinek mi a hatása, továbbá megengedjük a 
cselekedetek valószínűségi (nemdeterminisztikusan meghatározott) kimenetelét. Három 
olyan ágensfelépítést fogunk áttekinteni, amelyeket először a 2. fejezetben vezettünk be: 


s A basznosságalapú ágens (utility-based agent) az állapotokra alapozott hasznos- 
ságfüggvényt tanul, és ennek alapján választja ki azokat a cselekvéseit, amelyekkel 
maximálja az elérhető hasznosság várható értékét. 

s A 0-tanuló (0-learning) ágens egy cselekvésérték (action-value) függvényt — 
vagy más néven 0-függvényt — tanul, valamilyen várható hasznot tulajdonítva egy 
adott helyzetben egy adott cselekvésnek. 

s Egy reflexszerű ágens (reflex agent) olyan stratégiát tanul, amely közvetlenül 
képezi le az állapotokat cselekvésekre. 


Egy hasznosságalapú ágensnek a környezet valamilyen modelljével is rendelkeznie 
kell ahhoz, hogy tudja, cselekvése milyen állapotba vezet. Például ahhoz, hogy az os- 
táblajáték hasznosságfüggvényének hasznát vegyük, az ostáblajátékot játszó program- 
nak tudnia kell, hogy melyek a lehetséges szabályos lépések, és ezek hogyan hatnak az 
állásra. Csak ilyen módon van arra lehetősége, hogy a lépése eredményeképpen kapott 
állásra alkalmazza a hasznosságfüggvényt. Egy 0-tanuló ágens viszont össze tudja 
hasonlítani a lehetséges választásait anélkül, hogy tudná, mire vezetnek, így nincs szük- 
sége a környezet modelljére. Másrészt viszont, mivel nem tudják, hogy cselekvéseik 
hova vezetnek, a 0-tanuló ágensek nem képesek előre nézni. Ez viszont, mint látni is 
fogjuk, súlyosan kortátozhatja tanulási képességeiket. 

A 21.2. alfejezetben a passzív tanulással (passive learning) kezdünk foglalkozni, 
amelyben az ágensnek rögzített stratégiája van, és az állapotok hasznosságának (vagy 
az állapot-cselekvés párok hasznosságának) megtanulása a feladat. Ez magában foglal- 
hatja a környezet modelljének megtanulását is. A 21.3. alfejezet az aktív tanulással 
(active learning) foglalkozik. amikor is az ágensnek azt is meg kell tanulnia. hogy mit 
tegyen. Az alapvető elv a felfedezés (exploration), az ágensnek a lehető legtöbbet meg 
kell tapasztalnia környezetéről ahhoz, hogy megtanulja, mi a célszerű viselkedés ben- 
ne. A 21.4. alfejezet bemutatja, hogy az ágens hogyan tudja felhasználni az induktív 
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tanulást arra, hogy sokkal gyorsabban tanuljon a tapasztalataiból. A 21.5. alfejezet 
a közvetlen stratégiareprezentáció tanulásának módszereivel foglalkozik reflexszerű 
ágenseknél. A Markov döntési folyamatok (lásd 17. fejezet) megértése döntő fontossá- 
gú ennek a fejezetnek a tárgyalása szempontjából. 


21.2. PASSZÍV MEGERŐSÍTÉSES TANULÁS 


Az egyszerűség kedvéért egy ismert, teljes mértékben hozzáférhető környezet állapot- 
reprezentációját használó passzív ágens esetét tárgyaljuk először. Passzív tanulás esetén 
az ágens Tr stratégiája rögzített, az s állapotban mindig a 7r(s) cselekvést hajtja végre. 
A cél egyszerűen a stratégia jóságának — tehát az U7(s) hasznosságfüggvénynek — a meg- 
tanulása. Példaként a 17. fejezetben bevezetett 4 x 3-as világot fogjuk használni. A 21.1. 
ábra mutatja ezt a világot, és a megfelelő hasznosságokat. Nyilvánvaló, hogy a passzív ta- 
nulás hasonló a stratégiakiértékelési (policy evaluation) feladathoz, amely része a 17.3. 
alfejezetben ismertetett stratégiaiterációs (policy iteration) algoritmusnak. A legfonto- 
sabb különbség, hogy a passzív ágens nem ismeri az állapotátmenet-modellt (transition 
model), a T(5, a, 5")-t, amely annak a valószínűséget adja meg, hogy az a cselekvés hatá- 
sára az s állapotból az 57 állapotba jutunk, továbbá nem ismeri a jutalomfüggvényt 
(reward function), R(5)-et, amely minden állapothoz megadja az ott elnyerhető jutalmat. 
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(a) 
211. ábra. (a) A 4 x 3-as világban alkalmazott r stratégia. Ez optimális stratégia, ha nem alkalmazunk 


leénékelést, és minden állapotban, amely nem végállapot, R(5J— —0,04. (b) A 4 x 3-as világ állapotainak 
hasznossága a rr stratégia esetén. 


Az ágens - a stratégiája felhasználásával — egy sor kísérletet (trial) végez. Minden 
egyes kísérletben az (1,1) állapotból indul, és az állapotátmenetek valamilyen sorozatát 
észleli, amíg el nem érkezik a (4.2), illetve a (4.3) végállapotok valamelyikébe. Észle- 
lései alapján információt kap mind az aktuális állapotról, mind az ott nyert jutalomról. 
Például így nézhetnek ki a tipikus kísérletek: 

DD a04(12) 00 (1.39. 004 (1.2).a09( 1. a (2.3) .404—(3.3) 404 da 


1D om. 0013) 0023). (3.31.400—(3.2). 90 (3.3).g0 (43) sa 
(1. a 21.41. (3.2). 0 (4.2) eaz 
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Vegyük észre, hogy mindegyik állapotészlelés mellett — alsó indexként — feltüntettük 
az elnyert jutalmat. Célunk a jutalmakban rejlő információ felhasználása arra, hogy az 
egyes s állapotokhoz — amelyek nem végállapotok — rendelhető várható hasznosságot, 
U7(5)-t megtanuljuk. A hasznosságot úgy definiáljuk, mint a 7r stratégia követése ese- 
tén az összegzett (leértékelt) jutalom várható értéke. Ez — ahogy a (17.3) egyenletben a 
713. oldalon — már felírtuk: 

20 

IT RCsplrsg s] 
1-0 

Mindegyik. összefüggésünkben figyelembe veszünk egy " leértékelési tényezőt 
(discount factor), de a4 x 3 világban y — 1-et használunk. 


U"(9-E (21.1) 








Közvetlen hasznosságbecslés 


Widrow és Hoff az adaptív szabályozáselmélettel tadaptive control theory) foglal- 
kozva egy egyszerű módszert fedeztek fel a közvetlen hasznosságbecslésre (direct 
utility estimation) (Widrow és Hoff. 1960). Az ötlet a következő: az állapot hasznos- 
sága nem más, mint az adott állapotból kiindulva az összegzett jutalom várható értéke, 
és minden egyes kísérlet ennek az értéknek egy mintájával szolgál minden bejárt álla- 
potra. Például az előzőkben bemutatott háromelemű tipikus kísérlethalmaz első kísér- 
lete egy 0,72 értékű összegzett jutalommintát ad az (1,1) állapotra, két — 0,76 és 0,84 
értékű - mintát az (1,2) állapotra, továbbá két — 0,80 és 0,88 értékű - mintát az (1,3) 
állapotra és így tovább. Ennek megfelelően az algoritmus mindegyik kísérleti lépéssoro- 
Zat végén kiszámítja az összes állapotra a megfigyelt hátralevő jutalmat, és ez alapján 
frissíti az állapot hasznosságát, egyszerűen minden egyes állapotra mozgóablak átlago- 
lást végezve, és az eredményt egy táblában tárolva. Ha a kísérletek száma a végtelenhez 
tart, a minták átlaga a (21.1) egyenlettel megadott valódi várható értékhez fog tartani. 

Nyilvánvaló, hogy a közvetlen hasznosságbecslés nem más, mint egy példánya a fel- 
ügyelt tanításnak. A tanító példapárok bemeneti része az állapot, kimeneti része pedig 
a megfigyelt hátralevő jutalom. Tehát a megerősítéses tanulást standard induktív tanu- 
lási problémára redukáltuk, a 18. fejezetben tárgyaltaknak megfelelően. A 21.4. alfe- 
jezetben áttekintjük a hasznosságfüggvények hatékonyabb reprezentálására szolgáló 
eszközök használatát, például a neurális hálókét. Ezeknek a reprezentációknak a hasz- 
nálata esetén a tanulási technika közvetlenül a megfigyelt adatokra alkalmazható. 

A közvetlen hasznosságbecsléssel sikerült a megerősítéses tanulást standard induktív 
tanulási problémára redukálnunk, amelyről már nagyon sok mindent tudunk. Sajnála- 
tos módon egy nagyon fontos információforrás hiányzik, nevezetesen az, hogy az álla- 
potok hasznossága nem független egymástól! Minden egyes állapot hasznossága 
egyenlő az ebben az állapotban elnyerhető jutalom és az őt követő állapotok várható 
hasznosságának összegével. Tehát a hasznosságértékek kielégítik a rögzített stratégiá- 
ra vonatkozó Bellman-egyenletet (lásd még (17.10) egyenlet): 


UT (9— RDF T(s. 715) 5) UT (5) (212) 
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Azzal, hogy figyelmen kívül hagyja az állapotok közötti összefüggéseket, a közvetlen 
hasznosság becslése eljátssza a tanulás lehetőségeit. Például a bemutatott három kísér- 
let közül a második érinti a (3,2) állapotot, amelyet előzőleg az ágens nem érintett még. 
A következő átmenet után (3,3)-ba jut, amely az első kísérlet alapján nagy hasznosságot 
mutat. A Bellman-összefüggés azonnal rámutat, hogy valószínűleg akkor a (3,2)-nek is 
nagy a hasznossága, mivel a (3,3)-ba vezet, de a közvetlen hasznosságbecslés semmit se 
tanul meg ebből a kísérlet végéig. Általánosabban megfogalmazva azt mondhatjuk, hogy 
a közvetlen hasznosságbecslésre úgy tekinthetünk, mint ami jóval nagyobb U hipotézis- 
térben keres, mint amire szükség van. Ennek oka, hogy számos olyan függvényt is szá- 
mon tart a hipotézisek közt, amelyek sértik a Bellman-egyenletet. Emiatt az algoritmus 
gyakran csak nagyon lassan konvergál. 


Adaptív dinamikus programozás 


Ahhoz, hogy használhassuk az állapotok közti kényszerekben rejlő információt, az 
ágensnek meg kel! tanulnia, hogy az állapotok között milyen kapcsolatok állnak fenn. 
Egy adaptív dinamikus programozás (ADP) (adaptive dynamic programming, ADP) 
alapú ágens működésének lényege, hogy menet közben megtanulja a környezet állapot- 
átmenet-modelljét, és dinamikus programozási módszerrel megoldja a hozzá kapcsol- 
ható Markov döntési folyamatot. Egy passzív tanuló ágens számára ez azt jelenti, hogy 
a megtanult 7(5. rr(5), 5") állapotátmenet-modellt és a megfigyelt R(s) jutalmakat behe- 
lyettesíti a (21.2) Bellman-egyenletbe, majd kiszámítja az állapotok hasznosságát. Mint 
a 17. fejezetben a stratégiaiterációnál rámutattunk, ezek az egyenletek lineárisak (nincs 
maximalizálási lépés), így bármely lineáris algebrai programcsomaggal megoldhatók. 
Egy másik alternatíva, ha a módosított eljárásmód-iterációt (modified policy iteration) 
választjuk (lásd 720. oldal), egy egyszerűsített értékiterációs eljárást használva arra, 
hogy a tanult modell minden változása után frissítsük a hasznosságbecslés eredményét. 
Mivel a modell legtöbbször csak keveset változik az egyes megfigyelések után, az 
értékiterációs algoritmus kiinduló értékként felhasználhatja az előző hasznosságbecs- 
lést, és egész gyorsan konvergálhat. 

Magának a modellnek egyszerű a megtanulása, mivel a környezet teljesen megft- 
gyelhető. Ennek megfelelően egy ellenőrzött tanítási feladatunk van, amelyben a beme- 
net az állapot-cselekvés pár, a kimenet pedig a következő állapot. A legegyszerűbb 
esetben az állapotátmenet-modellt valószínűségek táblázatával reprezentálhatjuk. Szá- 
mon tartjuk, hogy a cselekvések egyes eredményei milyen gyakran lépnek fel, és abból 
a gyakoriságból becsüljük a 7(s. a, s") állapotátmenet valószínűségét, hogy hányszor 
következett 57", amikor az s állapotban az a cselekvést választottuk." Például ha a 875. 
oldal három útvonalában a Jobbra cselekvést háromszor választottuk az (1,3) állapotban, 
és a háromból kétszer a (2, 3) lett a következő állapot, akkor 7((1, 3), Jobbra, (2, 3)) be- 
csült értéke 2/3 lesz. 

A passzív ADP-ágens teljes programja a 21.2. ábrán látható. A 21.3. ábra mutatja a 
4 x 3-as világon elért teljesítményét. Az értékbecsléseinek javulási sebessége szem- 


1 Ez - mint a 20. fejezetben is tárgyaltuk — a maximurm-likelihood becslés. Egy Bayes frissítés Dirichlet- 
priorral jobb is lehet. 
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pontjából az ADP-ágens a lehetőségekhez képest a legjobban működik, ahogy csak az 
állapotátmenet-modell tanulási képességének megfelelően haladni tud. Ebben az érte- 
lemben más megerősítéses tanulási algoritmusok mérésének standardjaként szolgálhat. 
Ugyanakkor nagy állapotterek esetén némiképp kezelhetetlenné válhat. Például az os- 
táblajátékban nagyjából 10"9 egyenletet kell megoldania 109 ismeretlenre nézve. 





function Passzív-ADP-ÁGENS(észtelés) returns egy cselekvés 

inputs: észlelés, egy észlelés, amely a pillanatnyi 57 állapotot és az r/ jutalomjelet adja 

static: a, egy rögzített stratégia 
mdp, egy MDF, amely a 7 modellből, az R jutalomból és a 4 leértékelésből áll 
U, egy hasznosságtábla, kezdetben üres 
Na. az állapot-cselekvés gyakoriságtábla, kezdetben nulla 
Nag az állapot-cselekvés-áltapot hármasok gyakoriságtáblája. kezdetben nulla 
5. a, az előző állapot, illetve cselekvés, kezdetben üres 


if 5" új then do US] — /; RIS1— 1 
íf s nem üres then do 

inkrementálja N (s, al-t és Nyuy(s, a, $-t 

for each r amelyre Na, (s. a, () nem nulla do. 

TIs. a, 1) — Nyagls. a, 117 Nos. a) 

US ÉRTÉK-MEGHATÁROZÁS íg , U, mdp) 
if VÉGÁLLAPOTT[57] then s, a — üres else s, a — 5, (51 
return a 











21.2. ábra. Egy adaptív lineáris programozás alapon tanuló passzív megerősítéses ágens. A kód egysze- 
rűsítése érdekében feltettük, hogy minden egyes észlelés szétbontható egy észlelt állapotra és egy juta- 
lomjelre. 
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21.3. ábra, A passzív ADP-tanuló tanulási görbéi a 4 x 3-as világ tanulása során, a 21.1. ábrán látható 
optimális stratégia használata esetén. (a) Az állapotok egy kiválasztott részhalmazára kiszámított hasz- 
nosságbecslések a kísérletek számának függvényében. Figyeljük meg a 78-adik kísérlet környékén a je- 
lentős változásokat — ez az első eset, amikor az ágens a (4.2) végállapotba jut, melyben -1 jutalmat kap. 
(b) Az U(1,1) hibájának RMS-értéke 20 - egyenként 100 kísérletből álló — futásra átlagolva. 


21.2. PASSZÍV MEGERŐSÍTÉSES TANULÁS 879 
Az időbeli különbség tanulása 


Lehetőségünk van a két világ (szinte) legjobb vonásait egyesíteni: közelíthetjük az álla- 

potok közti kényszereket leíró egyenleteket anélkül, hogy megoldanánk az összes lehet- 

séges állapotra. Az alapötlet a következő: használjuk fel a megfigyelt állapotátmeneteket 1 
a megfigyelt állapotok olyan módosítására. hogy azok megfeleljenek a korlátozó egyen- 
leteknek. Vegyük például az (1,3)-ból (2,3)-ba való átmenetet a 875. oldal második kísér- 

letében. Tegyük fel, hogy az első kísérlet eredményeként a hasznosságuk becsült értéke 

UT(1,3) — 084 és U(2,3) — 092. Ha ez az átmenet mindig előáll, akkor azt várjuk, 

hogy a hasznosságoknak meg kell felelniük a következő kényszernek: 


UT(.3)——0,04-4UT(2.3) 


így UT(1,3) eszerint 0,88 lenne. Tehát a jelenlegi becsült érték (0,84) egy kicsit alacso- 
nyabb a kívánatosnál, növelni kellene. Általánosabban megfogalmazva, ha egy s-ből 5-be 
történő átmenet lép fel, akkor a következő módon frissítjük az 17(s) hasznosságot: 


U7 (9) — UT (5) af R(5) 43U7(s5) —UT (9) (21.32) 


Ebben az egyenletben a az úgynevezett bátorsági faktor (learning rate). Mivel ez az 
egyenlet a hasznosságok egymást követő állapotokhoz tartozó értékeit használja, ezért 
gyakran időbeli különbség vagy IK- (temporal-difference, TD) egyenletnek nevezik. 

Az időbeli különbségen alapuló módszerek alapötlete az, hogy először határozzuk 
meg azokat a feltételeket, amelyek korrekt becslési értékek esetén lokálisan fennállnak, 
majd állítsunk fel egy olyan értékfrissítésre szolgáló egyenletet, amely ezen ideális 
segyensúlyi" egyenlet irányába viszi a becsléseket. Passzív tanulás esetén az egyensú- 
lyi egyenletet a (21.2) szolgáltatja. A (21.3) egyenlet ténylegesen a (21.2) által meg- 
adott egyensúlyi helyzetbe viszi az ágenst, bár van némi finom trükk a dologban. Elő- 
ször vegyük észre, hogy a frissítés csak a megfigyelt következő állapotot, 5/-t veszi 
figyelembe, míg a tényleges egyensúlyi feltétel az összes lehetséges következő állapo- 
tot. Azt hihetnénk, hogy ez túlzottan megváltoztatja U7(5)-t, amikor egy ritka átmenet 
következik be. Valójában viszont ritka átmenetek ritkán következnek be, ezért az U7(5) 
átlagos értéke a helyes értékhez fog konvergálni. Továbbá, ha a-t megváltoztatjuk úgy, 
hogy ne egy rögzített paraméter legyen, hanem egy függvény, amely aszerint csökken, 
ahogy egy állapotnak a kísérletekben történő előfordulása nő, akkor maga az U(5) is a 
helyes értékhez fog tartani.? Ez a 21.4. ábrán látható ágensprogramhoz vezet. A 21.5. 
ábra bemutatja a passzív IK-ágens által a 4 x 3 világban mutatott teljesítményt. Ugyan 
nem tanul olyan gyorsan, mint az ADP-ágens, és nagyobb változékonyságol mutat, de 
sokkal kevesebb számítást igényel megfigyelésenként. Vegyük észre, hogy az IK nem agy 
igényel modellt a frissítés elvégzéséhez. A környezet szolgáltatja a szomszédos állapo- 
tok közti kapcsolatokat. a megfigyelt átmenetek formájában. 

Az ADP- és IK-megközelítés valójában szoros rokonságban van. Mindkettő lokális 
változtatásokat végez a hasznosságbecslésben annak érdekében, hogy minden egyes ál- 
lapot , megfeleljen" a rákövetkezőknek. Ugyanakkor van egy különbség. Az IK úgy 
módosítja az állapotot, hogy az megfeleljen a megfigyelt rákövetkező állapotnak ((21.3) 


2 Technikailag azt kívánjuk meg, hogy 3.2. jetm AC és Je (m cow fennálljon. Az a (1) — 1/n 
csökkenés megfelel ennek a feltételnek. A 21.5. ábrán o(n) — 60/(59 4 n)-t használtuk. 
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function Passzív-IK-ÁGENs(észtelés) returns egy cselekvés 
inputs: észlelés, egy észlelés, amely a pillanatnyi s" állapotot és az r" jutalornjelet adja 
static: x, egy rögzített stratégia 
U, egy hasznosságtábla, kezdetben üres 
N,, az állapotgyakoriságok tábla, kezdetben nulla 
s. a, r, az előző állapot, cselekvés, illetve jutalom, kezdetben üres 


íf s új then do UIS] —r 
if s nem üres then do 

inkrementálja V.fsl-t 

VIS] — US) -k atNIsIXr-4Y UISI UID 
if VÉGÁLLAPOT?[5] then s, a, r — nulla else s, a, r — 57, (51. 
return a 











21.4. ábra. Egy időbeli különbség alapon hasznosságot tanuló passzív megerősítéses ágens 
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21.5. ábra. Az IK-tanulás 4 x 3-as világon mért tanulási görbéi. (a) Néhány kiválasztott állapot hasz- 
nosságbecsiése a kísérletszám függvényében. (b) Az UXI,1) becslésének RMS-hibája, amelyet 20 futás 
átlagából számoltunk, mindegyik futás 500 kísérletet tartalmazott. Csak az első 100 kísérletből származó 
eredményt rajzoltuk fel, hogy a görbe a 21.3. ábrával összehasonlítható legyen. 


egyenlet). Az ADP viszont úgy módosítja az aktuális állapotot, hogy az összes lehetsé- 
ges következő állapotnak megfeleljen, de ezeket az állapotokat a valószínűségükkel sú- 
lyozza ((21.2) egyenlet). Ez a különbség eltűnik, amikor az IK-módosítást nagyszámú 
átmenetre átlagoljuk, mivel az állapothalmaz következő állapotainak gyakorisága nagy- 
jából arányos a valószínűségükkel. Egy, az előzőnél fontosabb különbség, hogy míg az 
IK minden megfigyelt állapotátmenet után egyetlen módosítást végez, addig az ADP 
annyit, amennyi csak szükséges ahhoz, hogy helyreállítsa az U/ hasznosságbecslések és 
a T környezetmodell közti konzisztenciát. Bár a megfigyelt állapotátmenet csak lokálisan 
változtatja meg 7-t, de szükség lehet arra, hogy ezt végigterjesszük [-n. Ennek megfele- 
lően úgy vehetjük, hogy az IK egy durva, de hatékony közelítése az ADP-módszernek. 

Mindegyik, az ADP által elvégzett módosítás az IK szempontjából úgy is tekinthető, 
mint az aktuális környezeti modell szimulációja segítségével generált , pszeudokísérlet" 
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eredménye. Kiterjeszthetjük az IK-megközelítést úgy, hogy a környezeti modell segít- 
ségével számos pszeudokísérletet generáljon — létrehozva olyan átmeneteket, ame- 
lyekről az aktuális környezet modellje alapján az IK-ágens el tudja képzelni, hogy 
megtörténhemek. Az IK-ágens akár nagyszámú képzelt átmenetet is generálhat min- 
den megfigyelt átmenetre. Ennek eredményeképpen a hasznosság becslései egyre 
inkább az ADP becsléseihez közelítenek, természetesen a fizetendő ár a megnövekedett 
számítási idő lesz. 

Hasonló módon az ADP-eljárás hatékonyabb változatait hozhatjuk létre közvetlenül 
approximálva az értékiteráció és stratégiaiteráció algoritmusait. Ne felejtsük, hogy a tel- 
jes értékiteráció kezelhetetlenné válhat, ha az állapottér nagy. Ugyanakkor a módosítási 
lépések közül számos csak nagyon parányi. Elfogadhatóan jó válaszok gyors generálá- 
sához vezető lehetséges megközelítés, ha megkötjük a megfigyelt átmenetek után elvég- 
zett módosítások számát. Azt ís megtehetjük, hogy valamilyen heurisztika segítségével 
rangsoroljuk a lehetséges módosításokat, és csak a legfontosabbakat végezzük el. A prio- 
ritásos végigsöprés (prioritized sweeping) heurisztikája preferálja azon állapotok mó- 
dosítását, amelyek valószínű követő állapotainak hasznosságában éppen most nagy 
módosítás történt. Ehhez hasonló heurisztikák segítségével a közelítő ADP-algoritmu- 
sok rendszerint nagyjából ugyanolyan gyorsan képesek tanulni, mint a teljes ADP, ha 
Pusztán a tanító szekvenciák számát nézzük. Viszont több nagyságrenddel hatéko- 
nyabbak lehetnek, ha a számítási igényt vizsgáljuk (lásd 21.3. feladat). Ezáltal lehető- 
vé válik számukra olyan állapotterek vizsgálata is, amelyek messze túl nagyok a teljes 
ADP-nek. A közelítő ADP-algoritmusoknak további előnye, hogy egy új környezet ta- 
nulásának korai fázisában a 7 környezeti modell gyakran olyan távol van a helyestől, 
hogy nincs sok értelme egy azzal pontosan konzisztens hasznosságfüggvényt kiszámíta- 
ni. A közelítő algoritmus használhat olyan minimális méretű módosítást, amely csökken 
annak mentén, ahogy a környezeti modell egyre pontosabbá válik. Ez elkerülhetővé teszi 
a nagyon hosszú értékiterációkat, amelyek a tanulás korai szakaszában azért lépnek fel, 
mert nagy változások történnek a modellben. 
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A passzív tanuló ágensnek rögzített stratégiája van, ez határozza meg a viselkedését. 
Az aktív ágensnek viszont el kell döntenie, hogy melyik cselekvést válassza. Vegyük 
először az adaptív dinamikus programozás alapján tanuló ágenst, és nézzük meg azt, 
hogyan kell módosítani, hogy ezt az új lehetőséget kezelni tudja, 

Először is az ágensnek nem csupán egy rögzített stratégia modelljét kell megtanulnia, 
hanem egy teljes modellt, amibe az összes cselekvésének lehetséges eredményeihez tar- 
tozó valószínűségek is beletartoznak. Erre a Passzív-ADP-ÁGENS esetén alkalmazott 
egyszerű tanulási eljárás is kiválóan alkalmas. Ezek után figyelembe kell vennünk, hogy 
az ágens választhat a cselekvések között. A megtanulandó hasznosságok azok, amelye- 
ket az optimális stratégia definiál. Ezek a hasznosságok megfelelnek a 714. oldalon kö- 
zölt Bellman-egyenletnek, amit itt megismétlünk: 


U(5) — R(s)-t-y max ETC a, 595) 21.44 
a§ 
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A 17. fejezetben közölt értékiterációs vagy siratégiaiterációs algoritmusok segítségével 
ezek az egyenletek megoldhatók az U hasznosságfüggvényre nézve. A végső kérdés az, 
hogy mit csináljunk az egyes lépésekben. Az egyik lehetőség, hogy a megtanult modell 
alapján nyert optimális U hasznosságfüggvény alapján az ágens meghatároz egy egy 
lépésre előretekintő optimális cselekvést annak érdekében, hogy maximálja a várható 
hasznosságot. A másik lehetőség, hogy ha stratégiaiterációt használt, akkor az optimális 
stratégia már rendelkezésére áll, így , gondolkodás nélkül" csak végre kell hajtania az op- 
timális stratégia által javasolt cselekvést. A kérdés az, hogy valóban végre kell-e hajtania? 


Felfedezés 


A 21.6. ábra bemutatja annak a kísérletsorozatnak az eredményét, amely során az 
ADP-ágens az egyes lépések során tanult optimális stratégia által javasolt cselekvést 
követi. Látható, hogy az ágens nem tanulja meg sem a helyes hasznosságértékeket, 
sem az igazi optimális stratégiát! Ehelyett a 39-edik kísérletnél megtalál egy stratégiát, 
amely a 41 jutalomhoz vezet az alsó — (2,1), (3,1), (3,2), (3,3) — úton (lásd 21.6. ábra). 
Ezek után kisebb változtatásokkal gyűjti a tapasztalatokat, és a 276-ik kísérlettől kezd- 
ve mereven ragaszkodik ehhez a stratégiához, így soha nem tanulja meg a többi állapot 
hasznosságát, és soha nem talál rá a valóban optimális útra a (1,2), (1.3), (2,3) állapo- 
tokon keresztül. Ezt mohó ágensnek (greedy agent) nevezzük. Ismételt kísérletek azt 
mutatták, hogy a mohó ágens ebben a környezetben nagyon ritkán találja meg az opti- 
mális stratégiát, és időnként borzalmas stratégiákhoz konvergál. 

Hogyan történhet meg, hogy optimális cselekvéseket választva szuboptimális ered- 
ményhez jutunk? A válasz abban rejlik, hogy a megtanult modell nem azonos az igazi 
környezettel, tehát az, ami optimális a megtanult modellben, szuboptimális lehet az igazi 
környezetben. Sajnálatos módon az ágens nem tudja, hogy milyen a valódi környezet, 
így nem képes az igazi környezetre nézve optimális cselekvést meghatározni. Mit kell 
akkor tennünk? 
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216. ábra. Annak a mohó ADP-ágensnek a felmutatott teljesítménye, amely végrehajtja a tanult modell 
alapján optimálisnak tűnő cselekvést. (a) A kilenc nem végállapot alapján számolt átlagos RMS-hiba. (b) 
Az a szuboptimális stratégia, amely felé ebben a kísérletsorozatban a mohó ágens konvergál. 
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Amit a mohó ágens nem veti figyelembe, az az, hogy a cselekvésnek több funkciója 
is van annál, mint hogy a jelenleg megtanult modell alapján jutalmat hozzon, ezenfelül 
hozzájárul az igazi modell megismeréséhez is a nyert észleléseken keresztül. A modell 
javítása viszont azt eredményezheti, hogy az ágens több jutalomhoz jut a jövőben? En- 
nek megfelelően az ágensnek kompromisszumot kell kötnie a kihasználás (exploita- 
tion) — a jelenlegi hasznosságbecslésében tükrözött modell alapján történő jutalom 
maximalizálás — és a felfedezés (exploration) között, ez utóbbi a hosszú távú eredmé- 
nyességet szolgálja. Ha csupán a kihasználásra tör, akkor azt kockáztatja, hogy beragad 
valamilyen megszokott kerékvágásba. Ha pedig csak a felfedezéssel törődik, hogy 
tudását bővítse, de soha nem ülteti át a tudást a gyakorlatba — nem hoz semmilyen hasz- 
not. A való életben állandóan döntenünk kell, hogy folytassuk-e kényelmes életünket, 
vagy vágjunk neki az ismeretlennek, hátha egy új és jobb életet fedezünk fel. Minél 
több mindent értünk, annál kevesebb felfedezésre van szükségünk. 

Tudunk-e ennél kicsit precízebbek lenni? Van egyáltalán optimális felfedezési stra- 
tégia? Kiderült, hogy ezt a kérdést a statisztikus döntéselmélet egy részterülete az ún. 
rabló probléma (bandit problem) kapcsán nagy mélységben tárgyalta (lásd a bekere- 
tezett részt). 

Bár a rablók problémáját rendkívül nehéz pontosan megoldani úgy, hogy egy optimá- 
lis felfedezési stratégiát nyerjünk, azonban készíthető egy ésszerű terv, ami végül az 
ágens optimális viselkedéséhez vezet. Minden ilyen eljárás a végtelen felfedezés határán 
lehet mohó (VFHM) (greedy in the limit of infinite exploration, LIE). Egy VFHM- 
séma alapján működő ágensnek korlátlan számban ki kell próbálnia minden cselekvést 
az összes állapotban. Ezáltal kerüli el annak veszélyét, hogy egy szokatlanul rossz kime- 
netelű sorozat miatt véges (nem nulla) valószínűséggel nem talál meg egy optimális 
cselekvést. Egy ilyen terv alapján működő ADP-ágens végül megtanulja az igazi 
környezeti modellt. Egy VFHM-tervnek végül mohóvá kell válnia, így az ágens cselek- 
vései optimálissá válnak a megtanult (azaz itt az igazi) modellre nézve. 





Rablók és felfedezés 


Las Vegasban a félkarú rabló egy pénzbedobós játékautomata. A játékos bedoh egy érmét, meghúz- 
za a kart, és elveszi a nyereményi (ha nyer). Egy n karú rablónak (x-armed bandit) n karja van. 
A játékosnak minden érme bedobásakor választania kell, hogy melyik kart húzza meg — azt, ame- 
lyik eddig a legjobban fizetett, vagy talán egy olyat. amelyet még nem próbált? 

Az n karú rabló probléma a világ sok, létfontosságú területén számos valós feladat formális modeli- 
jeként szolgálhat, mint például az MI kutatás-fejlesztés éves költségvetésének kialakítása. Mindegyik 
kar egy cselekvésnek felel meg (mint például 400 millió forint elkülönítése Mi-tankönyvek fejleszté- 
sére), és a kar meghúzásával járó nyeremény a cselekvés választása esetén várható haszonnak felel 
meg (esetünkben óriási haszon várható). Az ismeretlen terület feltárása — akár egy űj kutatásról, akár 
egy új üzletközpontról van szó - kockázatos, drága, bizonytalan haszonnal jár: másrészt ha egyáltalán 
nem kutatunk, akkor soha nem fogunk semunilyen értékes cselekvést felfedezni. 

Ahhoz. hogy a rabló problémát megfelelően formalizáljuk. pontosan meg kell határoznunk, hogy 
mit értünk optimális viselkedésen. Az irodalomban található legtöbb definíció azt feltételezi, hogy 
a cél az ágens élettartama alatt elérhető összes jutalom várható értékének maximalizálása. Ezek a 
definíciók megkívánják, hogy várható értéket képezzünk egyrészt az összes lehetséges világ felett, 


3 Vegyük észre a 16. fejezetben tárgyalt információérték-elmélettel fennálló közvetlen analógiát. 
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amelybe csak kerülhet az ágens, másrészt bármelyik adott világ minden egyes lehetséges cselekvé- 
si szekvenciája fölött. Itt a világot" a 715. a, 57) állapotátmenet-modell definiálja. Tehát ahhoz, 
hogy az ágens optimálisan cselekedjék, szüksége van a lehetséges modellek a priori eloszlására. 
Ezen az úton rendszerint teljesen kezelhetetlen optimalizációs problémákhoz jutunk. 

Néhány esetben azonban — például amikor az egyes gépek nyereményei függetlenek, és leérté- 
kelt jutalmakat használunk — minden egyes játékgépre kiszámítható az úgynevezett Gittins-index 
(Gittins, 1989). Az index csak annak függvénye. hogy hányszor választottuk a gépet, és eddig mennyit 
fizetett ki. Az index azt jelzi minden egyes gépre, hogy mennyire éri meg további pénzt bedobnunk, 
és a várható kifizetésen és az információ várható értékén alapul. A legnagyobb indexű gép választása 
az optimális felfedezési stratégia. Sajnálatos módon eddig még nem sikerült megtalálni annak a mód- 
ját, hogy hogyan kell a Gittins-indexet szekvenciális döntési problémákra kiterjeszteni. 

Az n karú rabló elmélet felhasználható arra. hogy bizonyítsuk a genetikus algoritmusok szelek- 
ciós stratégiájának ésszerűségét (lásd 4. fejezet). Tekintsünk az a karú rabló problémában minden 
egyes kart egy lehetséges génfüzérnek, továbbá a pénz bedobása ennél a karnál feleljen meg ezen 
gének reprodukciójának. Ebben az esetben a genetikus algoritmus optimálisan osztja szét a pénzt 
akkor, ha adott a függetlenségi feltételezések egy megfelelő halmaza. 








Számos VFHM-séma ismert; az egyik legegyszerűbb, ha az ágens az idő 1/t részé- 
ben véletlen cselekvést választ, egyébként pedig mohó stratégiát követ. Tény, hogy ez 
végül optimális stratégiához vezet, de időnként rendkívül lassan konvergál. Egy értel- 
mesebb megközelítés, ha az ágens némi súlyt ad azoknak a cselekvéseknek, amelyeket 
nem használt még gyakran, miközben igyekszik elkerülni azokat, amelyeknek a hasz- 
nosságát kicsinek hiszi. Ezt meg tudjuk valósítani úgy, ha úgy módosítjuk a (21.4) 
kényszeregyenletet, hogy nagyobb hasznosságot tulajdonítson a relatíve kipróbálatlan 
állapot-cselekvés pároknak. Lényegében egy optimista priort hoz létre, az ágens kez- 
detben úgy viselkedik, mintha hatalmas jutalmak lennének szétszórva a helyszínen. 
Jelölje Ut(5) az s állapot hasznosságának (tehát a hátralevő jutalom várható értékének) 
optimista becslését, N(a, s) pedig azt a számot, ahányszor az s állapotban az a cselek- 
vést választottuk. Tegyük fel, hogy az ADP-tanulási végző ágens értékiterációt végez, 
ez esetben a frissítési egyenletet [(17.6) egyenlet] át kell írnunk úgy, hogy az az opti- 
mista becslést tartalmazza. A következő összefüggés ezt megvalósítja: 


UT (5) — R(5)4 ymax JETeaUtoN N(a.5) (21.5) 
a lg 


Itt f (u, n) az úgynevezett felfedezési függvény (exploration function). Ez határozza 
meg a mohóság (a magas u értékek preferenciája) és a kíváncsiság (az alacsony n érté- 
kek preferenciája — cselekvések, amelyeket még nem alkalmaztunk nagyon gyakran) 
közötti kompromisszumot. Az f(u, n) függvénynek w-ban növekvőnek, n-ben csökke- 
nőnek kell lennie. Nyilvánvalóan sok lehetséges függvény megfelel ennek a feltételnek. 
Egy különösen egyszerű függvénydefiníció: 
RthancN, 
u egyébként 
ahol Rt a tetszőleges állapotban kapható legnagyobb jutalom optimista becslése, míg 
N, egy rögzíteit paraméter. Ennek alkalmazásával az ágens minden állapot-cselekvés 
párt legalább N, alkalommal kipróbál. 

Az, hogy a (21.5) egyenlet jobb oldalán nem U, hanem Ut szerepel, nagyon fontos. 
Ahogy a felfedezés folyik, a startállapot környéki állapotok és cselekvések jó néhány- 


(un) — ! 
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szor kipróbálásra kerülhetnek. Ha U-t — a pesszimistább becslést — használtuk volna, 
akkor az ágens hamar elveszthetné a szabad területek felfedezése iránti vonzalmát. 
Az Ut szerepeltetése azt jelenti, hogy a felfedezéshez kapcsolt jutalom visszaterjed a 
felfedezetlen terület határáról. Így nem csupán a szokatlan cselekvéseket preferáljuk, 
hanem a felértékeljük azokat a cselekvéseket, amelyek a felfedezetlen területek felé fog- 
ják vinni az ágenst. Ennek a felfedezési stratégiának a hatása jól látható a 21.7. ábrán, 
gyors konvergenciát látunk az optimális tel ményhez, ellentétben a mohó ágensnél 
látottakkal. Az optimálishoz nagyon közeli stratégiát talál mindössze 18 kísérlet után. 
"Vegyük észre, hogy maguk a hasznosságérték-becslések nem konvergálnak ilyen gyor- 
san, Ennek az az oka, hogy az ágens meglehetősen hamar felhagy az állapottér jutalmat 
nem eredményező részeinek felfedezésével, oda már csak , véletlenszerűen" téved. Mind- 
amellett teljesen ésszerű az ágens részéről, hogy nem sokat törődik azon állapotok hasz- 
nosságának pontos értékével, amelyekről tudja, hogy nemkívánatosak és elkerülhetők. 
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21.7. ábra. A felfedező ADP-ágens teljesítménye, R. — 2 és N, — 5 esetén. (a) Néhány kiválasztott álla- 
pot hasznosságának becslése az idő függvényében. (b) A hasznosságértékek RMS-hibája, és az ehhez 
kapcsolható, a stratégiából származó veszteség. 


Egy cselekvésérték-függvény tanulása 


Most, hogy már van egy aktív ADP-ágensünk, nézzük meg, hogy mi módon tudunk egy 
aktív időbeli különbség tanuló ágenst létrehozni. A legszembetűnőbb eltérés a passzív 
esethez képest, hogy az ágensnek többé nem áll rendelkezésére egy rögzített stratégia, 
tehát ha megtanul valamilyen U hasznosságfüggvényt, akkor meg kell tanulnia egy mo- 
dellt is, hogy egy U-n alapuló egylépéses előretekintő keretben cselekvést tudjon 
választani. A modellkialakítás problémája ugyanaz az IK-ágensnél, mint az ADP- 
ágensnél. Mi a helyzet magával az IK frissítési szabállyal? Talán meglepő, de a (21.3) 
IK frissítési szabály változatlan marad. Ez furcsának tűnhet a következő okból: tegyük 
fel, hogy az ágens olyan lépést választ, ami normál esetben jó célhoz vezet, de a környe- 
zet nemdeterminisztikus volta miatt az ágens valamilyen katasztrofális állapotban végzi. 
Az IK frissítési szabály ezt éppoly komolyan veszi, mintha ez a kimenetel a cselekvés 
normál következménye lenne, pedig csak egy pech volt, és nem kellene sokat aggódnia 
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miatta. Valójában az ilyen valószínűtlen kimenetel csak ritkán fordul elő egy nagy 
tanítósorozat-halmazban, így reményeink szerint hosszú távon a valószínűségével ará- 
nyosan kap súlyt a hatása. Ismét azt mondhatjuk, hogy az IK-ágens ugyanazokhoz az 
értékekhez fog tartani, mint az ADP-ágens, ahogy a tanítósorozatok száma tart a vég- 
telenhez. 

Van egy alternatív IK-módszer, amit 0-tanulásnak (0-learning) hívunk, ez cselek- 
vésérték-reprezentációt tanul, nem hasznosságot. O(a, s)-sel fogjuk jelölni annak az 
értékét, ha az s állapotban az a cselekvést választjuk. A 0-értékek közvetlenül össze- 
kapcsolhatók a hasznosságértékekkel a következő összefüggés alapján: 


U(s) — max (a.s) (21.6) 
a 


A 0-függvény úgy tűnhet, mintha csupán a hasznosságinformáció tárolásának egy el- 
térő módja lenne, de van egy nagyon fontos tulajdonsága: egy 0-függvényt tanuló IK- 
ágensnek nincs szüksége sem a tanulás, sem a cselekvés kiválasztás modelljére. Ezért 
a 0-tanulást modellmentes (model-free) módszernek is nevezik. Éppúgy, mint a hasz- 
nosságoknál, felírhatunk egy egyensúlyi egyenletet, amelyet a korrekt 0-értékeknek ki 
kell elégíteniük: 


O(a,5) — R(5)-k VIT Gva,s!) max O(a) 5) (21.7) 


s 
Az ADP-tanulást végző ágenssel azonos módon itt is felhasználhatjuk ezt az egyenle- 
tet egy iterációs eljárásban arra, hogy egy becsült modell alapján pontos (9-értékeket 
számoljunk. Ez viszont azt kívánná meg, hogy a modellt is megtanuljuk, hiszen az 
egyenlet használja a 7(5, a, 5")-t. Másrészről viszont az IK-megközelítés nem igényel 
modellt. Így a 0-értékekre vonatkozó IK frissítési összefüggés: 


Ala, 5) — O(a,5) t- a(R(5) - YmaxOa, §) - O(a, 5) (21.8) 


amely mindig kiszámításra kerül, amikor az s állapotban az a cselekvést választottuk, 
amely az 5" állapotba vitt. 

A 21.8. ábra mutatja be az IK-módszert használó, felfedező 0-tanuló ágens teljes 
programját. Vegyük észre, hogy ugyanazt az f felfedezési függvényt használja, mint 
amit a felfedező ADP-ágens is használt — ezért van szükség a végrehajtott cselekvések 
gyakorisági statisztikáira (az N táblára). Ha egy egyszerűbb felfedezési stratégiát hasz- 
nálnánk — mondjuk a lépések egy részében véletlenszerű működést iktatva be, ahol ez 
részarány az idővel csökken -, akkor mellőzhetnénk ezt a statisztikát. 

A 0-tanuló ágens megtanulja a 4 x 3-as világra az optimális stratégiát, de ezt sokkal 
lassabban teszi, mint az ADP-ágens. Ennek oka, hogy az IK nem kényszerít modellje 
alapján konzisztenciát az értékekre. Ez az összehasonlítás felvet egy általános kérdést: 
mi a jobb: egy modellt és egy hasznosságfüggvényt tanulni, vagy egy cselekvésérték- 
függvényt? Más szavakkal, mi a legjobb módja egy ágensfüggvény reprezentálásának? 
Ez a mesterséges intelligencia alapjait érintő kérdés. Mint az 1. fejezetben kijelentettük, 
az MI legnagyobb részében kulcsfontosságú történeti örökség a (gyakran ki nem mon- 
dott) ragaszkodás a tudásalapú (knowledge-based) megközelítéshez. Ez vezet ahhoz 
a feltevéshez, hogy az ágensfüggvény reprezentációjának legjobb módja, ha valamilyen 
szempontból az ágenst körülvevő környezet modelljét építjük meg. 

Néhány kutató ugyanakkor — mind az MI-közösségen belül, mind azon kívül — azt ál- 
kítja, hogy a modellmentes módszerek, mint például a 0-tanulás léte azt mutatja, hogy 
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function O-TANULÓ-ÁGENs(észlelés) returns egy cselekvés 
inputs: észlelés, egy észlelés, amely a pillanatnyi 57 állapotot és az r" jutalomjelet adja 
static: 0, egy cselekvésérték-tábla: amelyet az állapottal és a cselekvéssel indexelünk 
Nan Az állapot-cselekvés párok gyakoriságának táblája 
s, a. r, az előző állapot, cselekvés, illetve jutalom, kezdetben nulla 


íf s nem nulla then do 

inkrementálja N.oÍs, al-t 

Ola, 51 — Ola, s] 4 atwels, al(r -t 9 maxy Ola, 51— Ola, s) 
if VÉGÁLLAPOTOL57] then s, a, r— nulla 
else 5. a. r— 5. argmaxy JO, 91, Nyald, SD 


return a 








21.8. ábra. Egy felfedező 0-tanuló ágens. Egy aktív tanuló, amely megtanulja minden cselekvésnek 
minden egyes állapotban a ((a, 5) értékét. Ugyanazt az f felfedezési függvényt használja, amelyet a fel- 
fedező ADP-ágens is használt, de elkerüli az állapotátmenet-modell tanulását, mivel az állapot 0-értékét 
közvetlenül a szomszédos állapotok (7-értékeihez tudja kapcsolni. 


a tudásalapú megközelítés nem szükséges. Mindamellett nem sok egyéb van e kérdés 
eldöntésére, mint az intuíciónk. A mi intuíciónk szerint, ahogy a környezet komplexeb- 
bé válik, a tudásalapú megközelítés előnyei egyre nyilvánvalóbbá válnak. Ez még a játé- 
kokban — mint a sakk, a dámajáték és az ostáblajáték (lásd következő alfejezet) — is így 
jelentkezik, a modellalapú kiértékelő függvények tanulására fordított erőfeszítések több 
sikert hoztak, mint a 0-tanuló módszerek. 


21.4. A MEGERŐSÍTÉSES TANULÁS ÁLTALÁNOSÍTÓ- 
KÉPESSÉGE 


Az eddigiekben azt feltételeztük, hogy az ágens által megtanult hasznosságfüggvé- 
nyek és a 0-függvények táblázatos formában reprezentáltak, amelyben minden egyes 
bemeneti vektornak egy-egy kimeneti érték felel meg. Ez a megközelítés kis állapot- 
terekre jól működik, de a konvergencia ideje, valamint egy-egy íterációs lépés ideje 
(ADP esetén) gyorsan nő, ahogy a tér egyre nagyobb lesz. Alaposan kézben tartott 
közelítő ADP-módszerekkel kezelhető lehet 10 000 állapot vagy annál valamivel 
több. Ez kielégítő a kétdimenziós útvesztő jellegű problémák esetén, de reálisabb 
problémák szóba sem jöhetnek. A sakk és az ostáblajáték a valós világ apró részei 
csupán, mégis állapotterük 1059-10!29 állapotot tartalmaz. Az teljesen abszurd fel- 
tételezés, hogy mindezeket az állapotokat be kell járnunk ahhoz, hogy megtanuljuk a 
játékot! 

Ezeknek a problémáknak egy lehetséges kezelési módja, ha függvényapproximációt 
(function approximation) használunk, ami egyszerűen azt jelenti, hogy a leképezés- 
nek bármilyen reprezentációját használhatjuk, kivéve a táblázatos reprezentációt. 
A reprezentációt közelítőnek tekintjük, mivel nem áll fenn biztosan, hogy az igazi hasz- 
nosságfüggvény vagy 0-függvény reprezentálható a választott formában. A 6. fejezet- 
ben például leírtunk egy sakkjátékban használható kiértékelő függvényt (evaluation 
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function), amelyet tulajdonságok (feature) (vagy bázisfüggvények (basis function)) 
fi--. fa halmazának lineáris kombinációjával reprezentáltunk: 


ÚJ — 01(59--B2 (9 -48fAD) 


Megerősítéses tanulás során tanulhatjuk a 9 — 81,..., 0,, paramétereket úgy, hogy az 
az igazi hasznosságfüggvényt közelítse. Ahelyett, hogy mondjuk 10"? értéket tarta- 
nánk egy táblázatban, ez a függvényközelítés mondjuk n — 20 értékkel jellemezhető, 
ez elképesztő tömörítés! Bár senki sem ismeri a sakkjáték igazi hasznosságfüggvényét, 
azt senki se hiszi, hogy pontosan jellemezhető lenne 20 számmal. Mindamellett, ha az 
approximáció kielégítően jó, az ágens még mindig képes lehet kiválóan sakkozni! 

A függvényapproximáció tulajdonságai lehetővé teszik, hogy praktikusan felhasznál- 
ható legyen nagy állapotterek hasznosságfüggvényeinek reprezentálására, de nem ez az 
alapvető előnyük. A függvényapproximátorokkal elért tömörítés lehetővé teszi a tanuló 
ágens számára az általánosítást azokról az állapotokról amelyeket bejárt, azokra az 
állapotokra, amelyeket nem járt be. Azaz a függvényapproximáció legfontosabb aspek- 
tusa nem az, hogy kevesebb helyet igényel, hanem az, hogy lehetővé teszi az induktív 
általánosítást a bemeneti állapottérben. Hogy némi fogalmat alkothassunk ennek a ha- 
tásnak az erejéről: a lehetséges ostáblajáték állapotok közül csupán minden 10Y-edik 
állapotnak a vizsgálata alapján megtanulható olyan hasznosságfüggvény, amely képessé 
tehet egy programot, hogy olyan jól játsszon, mint egy ember (Tesauro, 1992). 

Az éremnek természetesen van másik oldala is: lehet, hogy a kiválasztott hipotézis- 
térben egyáltalán nincs olyan függvény, amely kielégítően approximálná az igazi hasz- 
nosságfüggvényt. Mint az induktív tanulásnál minden esetben, itt is kompromisszum 
van a hipotézistér mérete és a függvény megtanulásához szükséges idő között. Egy 
nagyobb hipotézistér valószínűbbé teszi, hogy jó approximációt lehet találni. de azt is 
jelenti, hogy a konvergencia valószínűleg lassabb lesz. 

Kezdjük a legegyszerűbb esettel, a közvetlen hasznosságbecsléssel (lásd 21.2. alfeje- 
zet). Függvényapproximáció esetén ez nem más, mint a felügyelt tanulás (supervised 
learning) egy esete. Tegyük fel például, hogy a 4 x 3 világ hasznosságértékeit egy egy- 
szerű lineáris függvénnyel reprezentáljuk. A négyzetek jellemzői egyszerűen az x és y 
koordinátáik, tehát: 


Úg(x,y)— 89 48x--8y (1.9) 


Tehát ha (69. 81, 82) — (0.5, 0,2, 0,1), akkorÚ (1, 1) — 0,8. Adott kísérlethalmaz ese- 
tén egy sor értéket nyerünk az Up(x,y) értékekre, és megtalálhatjuk a — mondjuk négy- 
Zetes értelemben — legjobb illesztést, standard lineáris regressziót használva (lásd 20. 
fejezet). 

Megerősítéses tanulás esetén jobbnak tűnik online tanulást alkalmazni, amely minden 
egyes kísérlet után frissíti a paramétereket, Tegyük fel, hogy lefuttatunk egy kísérletet, 
És a teljes jutalom (1, 1)-ből indulva 0,4. Ez arra utal, hogy az ÚJ.) —0.8 jelenlegi 


Tudjuk, hogy az igazi hasznosságföggvény reprezentálható egy- vagy kétoldalnyi Lisp, Java vagy Cs-t kőd- 
dat. Azaz reprezentálható egy programmal, ami pontosan oldja meg a játékot, valahányszor meghívjuk. Mi csak 
olyan függvényapproximátorokban vagyunk érdekeltek, amelyek ésszerű számítási mennyiséget végeznek. 
Valójában jobb lehet, ha egy nagyon egyszerű függvényapproximátort tanulunk meg, és kombináljuk valamilyen 
lépésszámú előretekintő kereséssel. A szükséges kompromisszumok mindamellett egyelőre nem jól ismertek. 
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érték túl nagy, és csökkenteni kell. Hogyan kell a paramétereket módosítani, hogy ezt 
elérjük? Éppúgy, mint a neurális háló tanulásnál, egy hibafüggvényt írunk fel, és felír- 
juk a paraméterekre vonatkozó gradiensét. Ha 145) a j-edik kísérlet során az s állapot- 
ból kiindulva gyűjtött teljes megfigyelt jutalom, akkor a hibát a jósolt és a tényleges tel- 
jes jutalom négyzetének különbségeként (tulajdonképpen annak feleként) definiálják: 
E; ús (Úg (9) — uj(s))7/2. Az egyes 8; paraméterek változásának hatására a hiba vál- 
tozásának sebességét a ÖE;/08; adja meg. Így, ha a paramétert abban az irányba akar- 
juk változtatni, hogy a hibát csökkentse, akkor azt akarjuk, hogy: 





ÖE; p 9) ú 
ösözá ajka (upl)— Út) 6 21.10) 
i (d 


Ezt Widrow-Hoff-szabálynak (Widrow-Hoff rule) vagy delta-szabálynak (delta rule) 
nevezzük, és az online legkisebb négyzetes hibára vonatkozik. A (21.9) egyenletben felírt 
lineáris függvényapproximátorra a következő három egyszerű frissítési szabályt kapjuk: 

89 — 89 a (wj(5—Út5) ) 

81 — 8) 4 (e (5)— Út s) )x 

02 — 85 A a (u (5)—Úg (5) )y 
Alkalmazhatjuk ezeket a szabályokat arra az esetre, amikor U(1,1) — 08 és ut, b 
— 04. Ekkor 89, 8 és 0 mindegyike 0,4a-val csökken, ami mind csökkenti az (1, 1)- 
beli hibát, Vegyük észre, hogy a 9/-k változtatása az összes többi állapotra is megvál- 
toztatja Ua értékét! Ezt értettük azon, amit mondtunk: a függvényapproximáció lehető- 
vé teszi a megerősítéses tanulást végzőnek, hogy általánosítson a tapasztalataiból. 

Azt várjuk, hogy az ágens gyorsabban fog tanulni, ha függvényapproximátort hasz- 
nál, feltéve, hogy a hipotézistér nem túl nagy, de van benne néhány olyan függvény, 
amely kielégítően illeszkedik az igazi hasznosságfüggvényre. A 21.7. feladatban azt 
várjuk az olvasótól, hogy értékelje a közvetlen hasznosságbecslést mind a függvény- 
approximáció felhasználásával, mind anélkül. A 4 x 3-as világban a javulás érzékel- 
hető, de nem drámai, mivel nagyon kicsi az állapottér, amivel dolgozni kell. A javulás 
sokkal nagyobb a 10 x 10-es világban, ha --1 jutalom van a (10, 10) mezőn. Ez a világ 
jól illeszthető a lineáris hasznosságfüggvényhez, mivel az igazi hasznosságfüggvény 
síma és közel lineáris (lásd 21.10. feladat). Ha a jutalmat az (5, 5) mezőre tesszük, 
akkor az igazi hasznosságfüggvény piramis jellegű, és a (21.9) egyenletben felvett 
függvényapproximátor szánalmas kudarcot vall. Mindamellett nem veszett el minden! 
Emlékezzünk vissza, hogy a lineáris függvényapproximációnál az számít, hogy a 
függvény paramétereiben legyen lineáris — a használt tulajdonságok önmagukban az 
állapotváltozók tetszőleges nemlineáris függvényei lehetnek. Tehát használhatunk egy 
8 - [— xy? 4(y—y,)? típusú tagot, amely a céltól való távolságot méri. 

Ugyanilyen jól alkalmazhatjuk ezeket az elveket az időbeli különbség alapján tanu- 
lókra is. Mindössze annyit kell tennünk, hogy a paramétereket úgy módosítjuk, hogy az 
egymásra következő állapotok időbeli különbségét csökkenteni próbáljuk. A (21.3) és 
£21.8) IK- és 0-tanulási egyenleteink új változata: 


8; — B, Falk adot) geg á GL1D) 
a 
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a hasznosságfüggvényre, és 


8; — B-t a] R(5)-- max Óra, 5)—Ógta, 5) 90925) (21.12) 





a 0-értékekre. Megmutatható, hogy ezek a frissítési szabályok a páramáletéiben lineá- 
ris függvényapproximátor esetén az igazi függvény lehető legközelebbi" approximáció- 
jához konvergálnak. Szerencsétlen módon mindez nem áll meg, ha nemlineáris függvé- 
nyeket használunk — mint amilyenek például a neurális hálók. Nagyon egyszerű példák 
találhatók, amelyeknél a paraméterek a végtelenhez tartanak, pedig jó megoldások talál- 
hatók a hipotézistérben. Vannak kifinomultabb algoritmusok, amelyek elkerülik ezeket 
a problémákat, de napjainkban a megerősítéses tanulás általános függvényeket használó 
függvényapproximátorral — megmaradt a magas művészet szintjén. 

A függvényapproximáció a környezet modelljének tanulásában is nagyon hasznos 
lehet. Emlékezzünk rá, hogy egy megfigyelhető környezet modelljének tanulása ellen- 
őrzött tanulási feladat, mivel a következő észlelés megadja a kívánt kimeneti állapotot. 
A 18. fejezetben ismertetett bármely ellenőrzött tanulási módszer használható, megfe- 
lelő módosításokkal. Ugyanis itt nem egy logikai változó vagy egyetlen valós érték 
predikciójáról van szó, hanem komplett állapotleírásokéról. Ha például az állapot n 
logikai változóval adható meg. akkor n logikai függvényt kell megtanulnunk, hogy az 
összes változót megjósolhassuk. Sokkal nehezebb a tanulási probléma részlegesen meg- 
figyelhető környezet esetén. Ha tudjuk, hogy melyek a rejtett változók, és tudjuk, hogy 
milyen oksági viszonyban állnak egymással és a megfigyelhető változókkal, akkor a 20. 
fejezetben leírtak szerint rögzíthetünk egy megfelelő Bayes-hálóstruktúrát, és használ- 
hatjuk az EM-algoritmust a paraméterek tanulására. A rejtett változók bevezetése, illetve 
a modellstruktúra tanulása jelenleg megoldatlan problémák. 

Nézzük most a megerősítéses tanulás komolyabb alkalmazásait. Látni fogjuk, hogy 
azokban az esetekben, amelyekben a hasznosságfüggvényt (és ezzel együtt a modellt) 
használjuk, ott feltételezzük, hogy a modell adott. Például az ostáblajáték kiértékelő 
függvényének tanulása során általában feltesszük, hogy a legális lépések és azok hatá- 
sa előzetesen ismert. 


Alkalmazások a játékok területén 


A megerősítéses tanulás első fontos alkalmazása Arthur Samuel dámajáték programja 
volt (Samuel, 1959; 1967) - egyben ez volt a tanuló programok összes válfaja közt is 
az első jelentősebb. Samuel először egy legfeljebb 16 tagú súlyozott lineáris álláskiérté- 
kelő függvényt használt. A (21.11) egyenlet egy variánsát alkalmazta frissítési szabály- 
ként. Mindamellett volt néhány lényeges eltérés az ő programja és a jelenleg használt 
módszerek közt. Az első az, hogy ő a jelen állapot és a keresési fában végrehajtott teljes 
előretekintéses keresés által adott érték közti különbség alapján frissítette a súlyokat. Ez 
nagyon jól működik, mert ahhoz vezet, hogy az állapotteret különböző felbontással 
lássuk. A második különbség, hogy a programja nem használt semmilyen megfigyelt 


5 A hasznosságfüggvények közti távolság definíciója csak technikai kérdés, lásd (Tsitsiklis és Van Roy, 
1997). 
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jutalmat! Tehát a végállapot értékét figyelmen kívül hagyta. Ez azt jelenti, hogy köny- 
nyen elképzelhető, hogy Samuel programja nem konvergál, vagy ha konvergál, akkor 
a nyerő helyett a vesztő stratégiához tart. Samuel ezt oly módon kerülte el, hogy ragasz- 
kodott ahhoz, hogy az anyagi előnyhöz tartozó súly pozitív legyen. Érdekes módon ez 
elegendő volt ahhoz, hogy programját a súlyok terének olyan részébe irányítsa. amely 
jó dámajátékot eredményezett. 

Gerry Tesauro TD-Gammon rendszere (Tesauro, 1992) jól mutatja a megerősítéses 
tanulási technikák erejét. Korábbi munkájában (Tesauro és Sejnowski, 1989) Tesauro 
megkísérelte a 0(a, s) függvény neurális reprezentációjának tanulását közvetlenül hu- 
mán szakemberek által relatív értékekkel címkézett lépések alapján. Ez a megközelítés 
nagyon fárasztó volt a szakembereknek. Az eredményül kapott NEUROGAMMON nevű 
program a számítógépes programok közt erős játékos volt ugyan, de nem volt verseny- 
képes a humán szakemberekkel. A TD-Gammon projekt az önmagában való tanulás egy 
kísérlete volt. A TD-Gammon csupán az egyes játszmák végén adott egyetlen jutalom- 
jelet. A kiértékelő függvény reprezentációját egy teljesen összekötött, egyetlen — 40 
elemből álló — rejtett réteggel felépített neuronhálóval oldotta meg. A (21.11) egyenlet 
szimpla ismételt alkalmazásával a TD-Gammon lényegesen jobban megtanult játszani, 
mint a NEUROGAMMON annak ellenére, hogy a bemeneti reprezentáció a számított tulaj- 
donságok nélküli nyers táblaállás volt. Ez körülbelül 200 000 játékot és két hét számí- 
tógépes futást igényelt. Bár ez hatalmas mennyiségű játéknak tűnhet, de valójában az 
állapottérnek csak egy elhanyagolhatóan kis részét fedi le. Amikor a bemeneti repre- 
zentációt számított tulajdonságokkal bővítették, akkor egy 80 rejtett rétegbeli elemmel 
felépített neurális háló 300 000 tanító játszma után képes volt olyan szinten játszani, 
mint a világ három legerősebb játékosa. Kit Woolsey, az egyik élvonalbeli játékos és 
szakíró azt nyilatkozta: , Kétségtelen, hogy a pozíciómegítélésben sokkal jobb nálam." 


Robotirányítási alkalmazások 


A híres rúd-egyensúlyozási (cart-pole) feladat, amelyet inverz ingának (inverted 
Ppendulum) is neveznek, a 21.9. ábrán látható. A feladat a kocsi x pozíciójának vezér- 
lése úgy, hogy a rúd nagyjából fölfelé álljon (8 sz 1r/2), miközben a kocsi a pálya kije- 
lölt határai között marad. A megerősítéses tanulás és a szabályozáselmélet területén 
több mint 2000 cikket publikáltak erről a látszólag egyszerű feladatról. A rúd-egyensú- 
lyozási probléma annyiban különbözik az eddigiekben tárgyaltaktól, hogy az állapot- 
változói x, 8. 3 , Ő folytonosak. A cselekvés általában diszkrét: lökés jobbra vagy lökés 
balra, az úgynevezett bang-bang szabályozás (bang-bang control). 

Az első — ezen probléma tanulását célzó — munkát Michie és Chambers végezte 
(Michie és Chambers, 1968). Az ő BoxEs nevű algoritmusuk mindössze 30 próbálkozás 
után képes volt a rudat több mint egy óráig egyensúlyban tartani. Ráadásul, sok későb- 
bi rendszertől eltérően, a BOxES egy valódi kocsit és rudat használt, nem szimulációt. 
Az algoritmus először is kvantálta, azaz tartományokra (, dobozokra") bontotta a négy- 
dimenziós állapotteret, innen jött az algoritmus neve is. Ezek után addig végeztek egy- 
egy kísérletet, amíg a rúd leesett vagy a kocsi elérte a pálya végét. Negatív megerősítést 
rendeltek az utolsó állapottér-tartományban az utolsó cselekvéshez, és ezt terjesztették 
vissza a megelőző szekvenciára. Azt találták, hogy a kvantálás akkor okoz bizonyos 
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21.9. ábra. A mozgó kocsi tetején álló hosszú rúd egyensúlyozásának vizsgálatára szolgáló berendezés. 
A kocsit az x, €, í, Ő állapotváltozókat megfigyelő szabályzó jobbra vagy balra lökheti. 





problémákat, ha a berendezést más pozícióból indították, mint amiket a tanítás során 
használtak, ami arra utal, hogy az általánosítás nem volt tökéletes. Jobb általánosító- 
képesség és gyorsabb tanulás érhető el, ha egy olyan algoritmust használunk, amely 
adaptívan osztja részekre az állapotteret, a jutalom megfigyelt változásainak megfele- 
lően. Manapság egy háromszoros invertált inga egyensúlyozása közönséges feladatnak 
számít — ez már a legtöbb ember ügyességét messze meghaladja. 


21.5. STRATÉGIAKERESÉS 


A megerősítéses tanulással kapcsolatos, utolsó általunk tárgyalt megközelítés straté- 
giakeresés (policy search) néven ismert. Bizonyos értelemben a stratégiakeresés a leg- 
egyszerűbb a fejezet összes módszere közt. Az alapötlet annyi, hogy engedjük változni 
a stratégiát, amíg javul, és utána állítsuk le a változást. 

A vizsgálatot kezdjük magával a stratégiával. Emlékezzünk vissza, hogy a 77 straté- 
gia egy olyan függvény, amely állapotokat képez le cselekvésekre. Mi elsősorban olyan 
paramérterezett nm stratégiák vizsgálatában vagyunk érdekeltek, amelyeknek sokkal 
kevesebb paramétere van, mint ahány állapot található az állapottérben (éppúgy, mint 
az előző alfejezetben). Például paraméterezett 0-függvényekkel reprezentálhatjuk a 7 
stratégiát, egy-egy 0-függvényt rendelve minden cselekvéshez, és azt a cselekvést vá- 
lasztjuk, amely a legnagyobb jósolt értéket adja: 


T(s) - ia 05(a,5) (21.13) 


Minden egyes 0-függvény lehet a ? paraméterek lineáris függvénye, mint a (21.9) 
egyenletben, vagy lehet nemlineáris függvény, mint például egy neurális háló. A stratégia- 
keresés ezek után a 0 paramétereket változtatja oly módon, hogy javítsa a stratégiát. 
"Vegyük észre, hogy ha a stratégiát 0-függvényekkel reprezentáljuk, akkor a stratégia- 
keresés egy 0-függvény tanulási eljárást eredményez. Ez a folyamat azonban nem azo- 
nos a 0-tanulással! A függvényapproximációt használó 0-tanulásban az algoritmus 
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egy olyan 6-t keres, amelyre a Óa , közel" van 07-hoz, az optimális 0-függvényhez. 
A stratégiakeresés ezzel szemben olyan 6-t keres, amely jó működést eredményez, az 
eredményül kapott értékek alapvetően eltérhetnek. Egy másik nyilvánvaló példa a két 
dolog különbségére az az eset, amikor a 75) stratégiát úgy számítjuk, hogy 10 lépés 
mélységben előretekintő keresést végzünk egy közelítő Úg hasznosságfüggvény alap- 
ján. A jó eredményt adó 8 messze lehet attól, amely az Úg-t az igazi hasznosságfügg- 
vényhez hasonlóvá teszi. 

A (21.13) egyenletben bemutatott stratégiareprezentáció egyik problémája, hogy 
diszkrét cselekvések esetén a stratégia a paraméterek nemfolytonos függvénye." Azaz 
lesznek olyan 8 értékek, amelyeknél végtelen kis változás a 4-ban azt eredményezi, 
hogy a stratégia egyik cselekvésről a másikra vált. Ez azt is jelenti, hogy a stratégia érté- 
ke is változhat nemfolytonos módon, ami nehézzé teszi a gradiensalapú eljárások alkal- 
mazását. Emiatt a stratégiakeresési eljárások gyakran használják a 7ro(s, a) sztochasz- 
tikus stratégia (stochastic policy) reprezentációt, amely az s állapotban az a cselekvés 
választásának valószínűségét specifikálja. Egy népszerű reprezentáció a szoftmax 
függvény (softmax function): 


mp(s.a) — exp (Ópta.5) yXep (Ós(at.5) ) 
a 


A szoftmax függvény közel determinisztikussá válik, ha az egyik cselekvés sokkal 
jobb, mint a többi, de mindig differenciálható 9 szerint; így a stratégia értéke (amely 
folytonos módon függ a cselekvésválasztási valószínűségtől) differenciálható függvé- 
nye lesz 8-nak. 

Nézzünk most módszereket a stratégia javítására. Kezdjük a legegyszerűbb esettel: 
determinisztikus stratégia, determinisztikus környezetben. Ebben az esetben a stratégia 
értékelése triviális: egyszerűen végrehajtjuk a stratégiát, és megfigyeljük az összegyűj- 
tött jutalmat, ez adja számunkra a stratégia értékét (policy value), p(6)-t. A stratégia 
javítása ezek után egy standard optimalizációs probléma, ilyeneket a 4. fejezetben tár- 
gyaltunk. Követhetjük a stratégiagradiens (policy gradient) vektort, V, p(0)-t, feltéve, 
hogy P(8) differenciálható. Másik lehetőség, ha az empirikus gradienst (empirical 
gradient) követjük hegymászó módszerrel - azaz kiértékeljük a stratégiát minden 
egyes paraméter kis megváltozása esetére. A szokásos feltételek esetén ez a stratégia- 
tér egy lokális optimumához fog konvergálni. 

Ha a környezet (vagy a stratégia) sztochasztikus, akkor a helyzet nehezebbé válik. 
Tegyük fel, hogy hegymászó módszert próbálunk alkalmazni, ami azt kívánja, hogy 
összehasonlítsuk (0)-t (8 -t- A9)-val valamilyen kis A€ esetén. Az a probléma, hogy 
a teljes jutalom nagyon nagyokat változhat kísérletről kísérletre, így a kisszámú kísér- 
letből számított stratégiaérték nagyon megbízhatatlan lesz — két ilyen becslés össze- 
hasonlítása pedig még megbízhatatlanabb. Egy lehetséges megoldás, ha egyszerűen sok 
kísérletet futtatunk le, és a minta variancájával mérjük, hogy elegendő kísérletet futtat- 
tunk-e már ahhoz, hogy megbízhatóan jelezni tudjuk a ,(€) javításának irányát. Sajná- 
latos módon ez sok valós probléma esetén nem praktikus, mert az egyes kísérletek drá- 
gák, időigényesek és esetleg veszélyesek lehetnek. 


§ Triviális, hogy a Öp(a,5) — 0"(a.5410 közelítő 0-függvény optimális teljesítményt ad, bár egyáltalán 
nincs közel 07-hoz. 
Folytonos cselekvési terekre a stratégia a paraméterek sima függvénye lehet. 
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A 7e(s, a) sztochasztikus stratégia esetén lehetőségünk van arra, hogy a §-ban vég- 
rehajtott kísérletek eredményei alapján a Va p(€) gradiens torzítatlan becslését állítsuk 
elő 8-ban. Az egyszerűség kedvéért a becslést arra az egyszerű esetre vezetjük le, ami- 
kor nem szekvenciális környezetben közvetlenül az sg startállapotbeli cselekvés után 
megkapjuk a jutalmat. Ebben az esetben a stratégiaérték egyszerűen a jutalom várható 
értéke, tehát: 


Vop(9— Vg resp. a)R(a) — )(Veretso, a) ) Ra) 


a a 
Most egy egyszerű trükköt alkalmazunk, hogy ezt az összegzést approximálni tudjuk a 
ap(s, a) által meghatározott valószínűség-eloszlásból generált mintákkal. Tegyük fel, 
hogy összesen N kísérletünk van, és a j-edik kísérletben az a; cselekvést választottuk. 
Ekkor 





(Voros a) Ra 1 (Vezelsosa;) ) Raj) 


me(50.a) NA 7e(s0.aj) 


Tehát a stratégia igazi gradiensét egy szummával közelítettük, ahol a tagok az egyes 
kísérletek cselekvésválasztási valószínűségeinek gradiensét tartalmazzák. A szekvenciá- 
lis esetre ez a következőképp általánosítható: 
N 
1 Vere(s ap) )Rj(5) 
Vop(0) sz 155 Verolsaj)Rj6) 
N J-I Te(s,aj) 


minden egyes bejárt s állapotra. Itt a; a j-edik kísérlet során az s állapotban választott 
cselekvés, és R/(s) a j-edik kísérlet során az s állapotból kiindulva gyűjtött összes juta- 
lom. Az eredményül kapott algoritmust REINFORCE-nak nevezték el (Williams, 1992). 
Rendszerint sokkal hatékonyabb, mint a minden egyes $-ban sok kísérletet használó 
hegymászó eljárás. Viszont sajnos még mindig sokkal lassabb annál, mint amire szük- 
ségünk lenne. 

Vizsgáljuk a következő feladatot: adott két biackjackő program, döntsük el, hogy 
melyik a jobb! Egyik lehetőség, ha egy közös , bank" ellen játszatjuk őket egy adott szá- 
mú kártyaleosztásban, és megnézzük, hogy melyik nyert többet. Ezzel az a probléma — 
mint láttuk -, hogy mindegyik program nyereségei nagy fluktuációt fognak mutatni an- 
nak függvényében, hogy milyen lapokat kapott. Egy kézenfekvő megoldás erre, ha előre 
generálunk egy sor leosztást, egy leosztáshalmazt. Ezzel elkerüljük a különböző kártya- 
leosztások okozta mérési hibát. Ez a PEGASUS algoritmus ötletének alapja (Ng és Jordan, 
2000). Az algoritmus olyan területeken alkalmazható, ahol rendelkezésünkre áll egy 
szimulátor, ezáltal a , véletlen" kísérlet kimenetelek megismételhetővé válnak. Az algo- 
ritmus N véletlen számsorozatot generál előre, mindegyik felhasználható arra, hogy egy 
tetszőleges stratégia alapján kísérletet futtassunk vele. A stratégiakeresést úgy hajtjuk 
végre, hogy mindegyik stratégiajelöltet az alapján értékelünk, hogy ugyanazt a véletlen 
sorozat halmazt használja a kísérletek kimeneti értékeinek meghatározásához. Megmu- 
tatható, hogy az összes stratégia értékének jó becsléséhez szükséges véletlen sorozatok 
száma csak a stratégiatér komplexitásától függ, és egyáltalán nem függ a mögöttes terü- 
let komplexitásától. A PEGAsuS algoritmussal számos területen (például az autonóm 
helikoptervezetés területén) több hatékony stratégiát fejlesztettek ki (lásd 21.10. ábra). 


VoP(9)— 2 Te(s0.a)- 
a 


8 7 es játékként is ismert. 
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21.10. ábra. Időben eltolt képek egymásra másolása útján kapott eredő kép, amelyen egy nagyon bonyo- 
tult .körberepülés orral a kör középpontja fele" manővert hajtanak végre. A helikoptert egy PEGASUS 
stratégiakereső algoritmussal fejlesztett stratégiával vezérlik. Egy szimulátormodelk fejlesztettek a valós 
helikopter egyes vezérlési beavatkozásokra adott válaszainak vizsgálatára. Ezek után egész éjszaka fut- 
tatták az algoritmust a szimulátoron. Egy sor vezérlőt fejlesztettek ki különböző manőverekre. Minden 
esetben, amikor távirányítást használtak, messze jobb volt az eredmény, mint a képzett humán pilótáké. 
(A képet Andrew Ng engedélyével közöljük.) 


21.6. ÖSSZEFOGLALÁS 


Ebben a fejezetben a megerősítéses tanulással foglalkoztunk: azzal, hogy egy ismeret- 
len környezetben működő ágens hogyan válhat gyakorlottá pusztán megfigyelései, 
valamint az esetenként kapott jutalmak felhasználásával. A megerősítéses tanulás a teljes 
MI-témakör mikrovilágának is tekinthető, amelyet azonban az előrehaladás érdekében 


egy sor egyszerűsítő feltétel mellett tárgyaltunk. A következő fontosabb megállapításo- 
kat tettük: 


s Az ágens teljes felépítése határozza meg azt, hogy milyen információt kell megta- 
nulni. A tárgyalt három fő felépítési lehetőség: egyrészt a modellalapú, amely a T 
modellt és az U hasznosságfüggvényt használja; másrészt a modell nélküli felépítés, 
amely a 0 cselekvésérték-függvényt használja, és a reflexszerű, amely a 7 stratégiát 
használja. 

s A hasznosságértékek háromféle megközelítés alapján tanulhatók: 


1. A közvetlen hasznosságbecslés (direct utility estimation), amely a megfigyelt 
hátralévő jutalmat használja egy-egy állapot esetén, mint a hasznosság tanulásá- 
nak közvetlen jellemzőjét. 

2. Az adaptív dinamikus programozás (ADP) (adaptive dynamic programming) 
megfigyelései alapján egy modellt és egy jutalomfüggvényt tanul, ezek után érték- 
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vagy stratégiaiterációt használ ahhoz, hogy az állapotok hasznosságbecsléséhez 
vagy az optimális stratégiához eljusson. Az ADP optimálisan használja fel a kör- 
nyezetnek a szomszédos állapotokra vonatkozó struktúrájából adódó lokális kény- 
szereket. 

3. Az időbeli különbség (IK) (temporal-difference, TD) megközelítés úgy mó- 
dosítja a hasznosságbecsléseket, hogy megfeleljenek az adott állapotot követő 
állapotokra vonatkozó becsléseknek. Tekinthetjük egyszerűen az ADP meg- 
közelítés olyan approximációjának is, amely a tanuláshoz nem igényel modellt. 
Mindamellett, ha a megtanult modellt pszeudotapasztalatok generálására hasz- 
náljuk, gyorsabb tanuláshoz juthatunk. 


s A cselekvésérték-függvények vagy 0-függvények ADP- vagy IK-megközelítéssel 
tanulhatók. IK esetén a 0-tanulás sem a tanulás, sem a cselekvés kiválasztásának 
fázisában nem igényli modell használatát. Ez egyszerűsíti a tanulási feladatot, de po- 
tenciálisan korlátozhatja a bonyolult környezetben való tanulási képességet, mivel 
az ágens nem képes szimulálni a lehetséges cselekvéssorozatok eredményét. 

s Ha a tanuló ágens a tanulás során a cselekvések kiválasztásáért is felelős, akkor 
kompromisszumot kell kötnie a választott cselekvés jelenlegi hasznossága és hasz- 
nos új információ tanulásának lehetősége között. A felfedezési probléma egzakt 
megoldása kezelhetetlen, de néhány egyszerű heurisztika elég jó megoldásra vezet. 

" Nagy állapotterek esetén a megerősítéses tanuló algoritmusnak közelítőfüggvény- 
reprezentációt kell használnia az állapotok feletti általánosítóképesség érdekében. 
Az időbeli különbség jel közvetlenül felhasználható a neurális háló jellegű reprezen- 
tációk paramétereinek frissítésére. 

s A stratégiakeresési módszerek közvetlenül a stratégia reprezentációját használják, a 
megfigyelt teljesítmény alapján próbálva meg javulást elérni. Súlyos problémát okoz 
sztochasztikus területeken a teljesítményben mutatkozó nagy variancia. Szimulációval 
vizsgálható területeken ez megoldható úgy, hogy előre rögzítjük a véletlen hatásokat. 


A vezérlési stratégiát biztosító program kézi kódolásának elkerülhetősége miatt a megerő- 
sítéses tanulás a gépi tanulás egyik legaktívabban művelt területe. A robotikai alkalmazá- 
sok különösen értékesnek ígérkeznek, de ezek folytonos, sokdimenziós, csak részlegesen 
megfigyelhető környezetek kezelésére képes módszereket igényelnek, ráadásul a sikeres 
működéshez több ezer vagy akár millió elemi cselekvésre ís szükség lehet. 


Irodalmi és történeti megjegyzések 


Turing javasolta a megerősítéses tanulás megközelítést. bár nem volt teljesen meggyő- 
ződve annak hatékonyságáról (Turing, 1948; 1950). Azt írta: , A büntetés és jutalmazás 
legjobb esetben is csak egy része lehet a tanítási folyamatnak." Arthur Samuel munkája 
volt valószínűleg az első sikeres kutatás a gépi tanulás területén (Samuel, 1959). Bár 
munkája nem volt formálisan megfogalmazva, és számos hiányossága volt, mégis a meg- 
erősítéses tanulás legtöbb modern gondolatát tartalmazta, beleértve az időbeli különb- 
ségképzést és a függvényekkel történő approximációt. Körülbelül ugyanebben az időben 
az adaptív szabályozások területével foglalkozó kutatók (Widrow és Hoff, 1960), Hebb 
munkájára építve (Hebb, 1949), egyszerű hálókat tanítottak a delta-szabály segítségével. 
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(A neurális hálók és a megerősítéses tanulás ezen korai kapcsolata vezethetett ahhoz 
a félreértéshez, hogy ez utóbbi az előbbinek részterülete.) Michie és Chambers rúd- 
egyensúlyozás-vezérlési kutatása szintén egy függvényapproximációval történő meg- 
erősítéses tanulási módszernek tekinthető (Michie és Chambers, 1968). A megerősíté- 
ses tanulással foglalkozó pszichológiai irodalom sokkal régebbi, Hilgard és Bower jó 
áttekintést adnak erről (Hilgard és Bower, 1975). A méhek nektárgyűjtési szokásainak 
kutatása közvetlen bizonyítékokat szolgáltatott a megerősítéses tanulás működésére 
állatoknál. Nyilvánvaló neurális kapcsolat van a jutalomjellel. Ennek formája egy nagy 
neurális leképezés a nektár bevitelét érzékelő szenzoroktól a motoros kéregig (Montague 
és társai, 1995). A sejtszintű emlékezéssel kapcsolatban folytatott kutatások azt sugall- 
ják, hogy a főemlősök agyában a dopamin rendszer valami olyasmit valósít meg, ami 
a függvénytanulásra emlékeztet (Schultz és társai, 1997). 

A megerősítéses tanulás és a Markov döntési folyamatok közti kapcsolatra először 
Werbos mutatott rá (Werbos, 1977), de a megerősítéses tanulás MI-n belüli fejlesztése 
a University of Massachusetts falain belül kezdődött az 1980-as évek elején (Barto és 
társai, 1981). Sutton írása jó történeti áttekintést ad (Sutton, 1988). Ennek a fejezetnek 
a (21.3) egyenlete egy speciális, a A — 0 melletti esete Sutton általános IK(A) algorit- 
musának. Az IK(A) egy sorozat összes állapotának értékét frissíti oly módon, hogy 
a múltban r időlépés távolságra lévő átmenetekhez egy A!" szerint csökkenő faktor vezet. 
Az IK(1) azonos a Widrow-Hoff- vagy delta-szabállyal. Bradtke és Barto érvelésére 
(Bradtke és Barto, 1996) építve Boyan azt állítja, hogy az IK(A) és a hozzá kapcsolható 
algoritmusok nem használják ki hatékonyan a tapasztalatokat (Boyan, 2002). Szerinte 
ezek lényegében online regressziós algoritmusok, amelyek sokkal lassabban konvergál- 
nak, mint az offline regresszió. Az ő LSTD(A) algoritmusa egy olyan online regresz- 
szió, ami az offline regresszióval azonos eredményt ad. 

Az időbeli különbség tanulásnak és a szimulációs tapasztalatok modellbázisú generálá- 
sának kombinálását Sutton a DYNA architektúrában javasolta (Sutton, 1990). A prioritásos 
végigsöprés ötletét egymástól függetlenül Moore és Atkeson (Moore és Atkeson, 1993), 
illetve Peng és Williams (Peng és Williams, 1993) vetették fel. A 0-tanulást Watkins dol- 
gozta ki PhD-disszertációjában (Watkins, 1989). 

A rabló problematikát, amely a nemszekvenciális döntések területén történő felfede- 
zést modellezi, részletesen Berry és Fristedt tanulmányozták (Berry és Fristedt, 1985). 
Számos helyzetben optimális felfedezési stratégia nyerhető a Gittins-index segítségé- 
vel (Gittins, 1989). Barto és munkatársai a szekvenciális döntési problémákban alkal- 
mazott felfedezési módszerek számos változatát tárgyalják (Barto és társai, 1995). Kearns 
és Singh, valamint Brafman és Tennenholtz olyan algoritmusokat írnak le (Kearns és 
Singh, 1998; Brafman és Tennenholtz, 2000), amelyek ismeretlen környezet felfedezé- 
sét végzik, és bizonyított, hogy polinomiális idő alatt konvergálnak közel-optimális 
stratégiákhoz. 

A megerősítéses tanulás területén a függvényapproximáció alkalmazása Samuel mun- 
kájáig vezethető vissza, aki mind lineáris, mind nemlineáris kiértékelő függvényeket 
alkalmazott, továbbá a tulajdonságok terének csökkentésére tulajdonságszelekciós 
algorítmusokat is használt. A későbbiekben bevezetett módszerek közé tartozik a CMAC 
(Cerebellar Model Articulation Controller) (Albus, 1975), amely lényegében átlapoló- 
dó lokális kernelfüggvények összegéből, és a Barto és társai által bevezetett asszocia- 
tív neurális hálókból áll (Barto és társai, 1983). Napjainkban a neurális hálók a legnép- 
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szerűbb függvényapproximátorok. A legismertebb alkalmazás az ebben a fejezetben 
bemutatott TD-Gammon (Tesauro. 1992. 1995). A neurális hálókkal megvalósított IK- 
tanulóknak súlyos problémája az, hogy hajlamosak elfelejteni korábbi tapasztalataikat. 
Ez különösen igaz azokra térrészekre, amelyeket a szakértelmük megszerzése után 
elkerülnek. Ez katasztrofális következményekkel járhat, ha helyzetek újra jelentkeznek. 
A példányalapú tanulás (instance-based learning) alkalmazásával ez a probléma 
elkerülhető (Ormoneit és Sen, 2002; Forbes, 2002). 

A fügvényapproximációt használó megerősítéses tanulás konvergenciája kimondot- 
tan technikai kérdés. Lineáris approximáló függvények alkalmazása esetén az IK tanu- 
lási eredmények folyamatosan javulnak (Sutton, 1988; Dayan, 1992; Tsitsiklis és Van 
Roy, 1997), de nemlineáris függvények esetén számos divergenciát mutató példát talál- 
tak (a jelenség tárgyalását lásd a (Tsitsiklis és Van Roy, 1997)-ben). Papavassiliou és 
Russell a megerősítéses tanulás új formáját adták (Papavassiliou és Russell, 1999), 
amely tetszőleges struktúrájú függvényapproximátor esetén konvergál, feltéve, hogy 
található a megfigyelt adatokra egy legjobban illeszkedő approximáció. 

A stratégiakeresésre Williams hívta fel a figyelmet (Williams, 1992), ő volt az, aki 
kifejlesztette a REINFORCE algorítmuscsaládot. A későbbi munkák megerősítették és 
általánosították a stratégiakeresés konvergenciájára vonatkozó eredményeket: (Marbach 
és Tsitsiklis, 1998; Sutton és társai, 2000; Baxter és Bartlett, 2000). Ng és Jordan (2000) 
alkották meg a PEGASUS algoritmust (Ng és Jordan, 2000), bár hasonló technikák már 
Van Roy PhD-disszertációjában is megtalálhatók (Van Roy, 1998). Mint a fejezetben 
említettük, a sztochasztikus stratégiák teljesítménye a paramétereik folytonos függvé- 
nye, ami elősegíti a gradiensalapú technikák alkalmazhatóságát. Nem ez az egyetlen 
előnyük: Jaakkola és társai amellett érvelnek, hogy részlegesen megfigyelhető környe- 
zetben a sztochasztikus stratégiák jobban működnek, mint a determinisztikusok, ha 
mindkét stratégia esetén a cselekvés pusztán a jelenlegi észlelésen alapul (Jaakkola és 
társai, 1995). (Ennek egyik oka, hogy a sztochasztikus algoritmusok kevésbé hajlamosak 
, beragadni", ha valamilyen eddig még nem látott akadály jelentkezik.) A 17. fejezetben 
rámutattunk, hogy részlegesen megfigyelhető MDF-ekben az optimális stratégiák inkább 
a hiedelemállapot determinisztikus függvényei, mint az aktuális megfigyeléseké. Ennek 
megfelelően még jobb eredményeket várnánk, ha a 15. fejezetben tárgyalt szűrési (fil- 
tering) módszerekkel nyomon követnénk a hiedelemállapot alakulását. Sajnálatos módon 
a hiedelemállapot-terek sokdimenziósak és folytonosak, és az eddigiekben nem sikerült 
hatékony módszereket kifejleszteni a hiedelemállapotok megerősítéses tanulására. 

A valós környezetekre az is jellemző, hogy gyakran rengeteg elemi cselekvési lépés- 
re van szükség ahhoz, hogy jelentős jutalomhoz jussunk. Például ha egy robot focizik. 
akkor százezer elemi lábmozdulatot is tehet, mielőtt gólt lő. Egy szokásos módszer erre 
a jutalomalakítás (reward shaping), melyet eredetileg az állatok tanításánál alkalmaz- 
tak. Ennek része, hogy további jutalmakat adunk az ágensnek, ha az , haladást ér el". 
A foci esetén például jutalmat adhatunk, ha hozzáér a labdához vagy a kapu felé lő. Eze- 
ket a jutalmakat rendszerint nagyon egyszerű kialakítani, és rendkívül felgyorsíthatják 
a tanulást, de megvan az a veszélye, hogy az ágens a tanulás során a , pszeudojutalmak " 
maximálását végzi el, nem az igazi jutalmakét. A foci tanulása esetén például a labdá- 
hoz való közelség és a labdával való sok-sok érintkezés, a , vibrálás", lehet ennek az 
eredménye, Ng és társai megmutatták, hogy az ágens így is megtanulja az optimális 
stratégiát, ha az F(s, a, 57) pszeudojutalom kielégíti az F(s, a, 5) — 9 B(s") — (s) 
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egyenletet, ahol $ az állapot tetszőleges függvénye (Ng és társai, 1999). A $-t úgy 
alkothatjuk meg, hogy az állapot valamely kívánatos vonásait tükrözze, például vala- 
milyen részcél elérését vagy a célállapottól való távolságot. 

Az összetett viselkedés kialakítását hierarchikus megerősítéses tanulási 
(hierarchical reinforcement learning) módszerekkel segíthetjük elő, amelyek több 
absztrakciós szinten igyekeznek megoldani a problémát, a 12. fejezetben ismertetett 
HFH-tervkészítéshez (HTN ptanning) hasonlóan. Például a , góllövés" szétbontható 
aulabdaszerzés", ..a kapu felé cselezés" és , lövés" részekre, és ezek mind tovább bont- 
hatók alacsonyabb szintű mozgásokra. Ezen a területen Forestier és Varaiya értek el 
alapvető eredményt (Forestier és Varaiya, 1978). Bebizonyították, hogy tetszőleges bo- 
nyolultságú alsóbb szintű viselkedés egyszerűen elemi cselekvésnek tekinthető az őt ki- 
váltó magasabb szintű viselkedés szempontjából (bár az alsóbb szintű viselkedés által 
megvalósított cselekvések eltérő időt vehetnek igénybe). Parr és Russell, Dietterich, 
Sutton és társai, valamint Andre és Russell jelen kutatásaikban erre az eredményre épí- 
tettek: olyan módszereket fejlesztettek, amelyek részprogrammal (partial program) 
látják el az ágenst, ezzel viselkedését valamilyen speciális hierarchikus struktúrába szo- 
rítva (Parr és Russell, 1998; Dietterich, 2000; Sutton és társai, 2000; Andre és Russell, 
2002). A megerősítéses tanulást ezek után arra használják, hogy a részprogrammal 
konzisztens legjobb viselkedést tanítsák. A függvényapproximáció, a jutalomalakítás 
és a hierarchikus megerősítéses tanulás összekombinálása lehetővé teheti, hogy nagy 
bonyolultságú problémák megoldását kíséreljük meg a siker reményében. 

Az irodalom áttekintéséhez jó kiindulópontot ad Kaelbling tanulmánya (Kaelbling és 
társai, 1996). A terület két úttörőjénk, Suttonnak és Bartónak a publikációja az archi- 
tektúrákra és algoritmusokra koncentrál. megmutatva, hogy a megerősítéses tanulás 
összeköti a tanulás, a tervezés és a cselekvés elveit (Sutton és Barto, 1998). Bertsekas 
és Tsitsiklis inkább technikai részletekkel foglalkozó munkája a dinamikus programo- 
zás és a sztochasztikus konvergencia elméletének precíz megalapozását nyújtja 
(Bertsekas és Tsitsiklis, 1996). A Machine Learning, illetve a Journal of Machine 
Learning Research folyóiratok, továbbá az International Conferences on Machine 
Learning és a Neural Information Processing Systems rendezvények kiadványai közöl- 
nek gyakran megerősítéses tanulással foglalkozó cikkeket. 





Feladatok 


21.1. Egy-—a4 x 3-as világhoz hasonló — egyszerű környezetben valósítson meg egy 

(HT passzív tanuló ágenst! Hasonlítsa össze a közvetlen hasznosságbecslést, az IK-t és 
az ADP-t előzetesen nem ismert környezeti modellek esetén! Végezze el az össze- 
hasonlítást az optimális stratégiára és több. véletlen módon generált stratégiára! 
Melyikre konvergálnak gyorsabban a hasznosságbecslések? Mi történik. ha növe- 
li a környezet méretét? (Vizsgáljon pályákat akadályokkal és azok nélkül!) 


21.2. A 17. fejezetben úgy definiáltuk az MDF számára megfelelő stratégiát (proper 
Policy), mint ami biztosan eléri a végállapotot. Mutassa meg, hogy egy passzív 
ADP-ágens képes egy olyan állapotátmenet-modell megtanulására, amelyre néz- 
ve 7 stratégiája nem megfelelő, még ha r megfelelő is az igazi MDF-re; az ilyen 


21.3. 


21.4. 


21.5. 


21.6. 


21.7. 


21.8. 


21.9. 
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modellekkel y — I esetben az értékmeghatározási lépés meghiúsulhat! Mutassa 
meg, hogy ez a probléma nem jelentkezik, ha az értékmeghatározást csak a kí- 
sérlet végeztével alkalmazzuk a megtanult modellre. 


Induljon ki egy passzív ADP-ágensből, és módosítsa úgy, hogy a fejezetben le- 

írt közelítő ADP-algoritmust kapja! Két lépésben oldja meg a feladatot: 

(a). Építsen fel egy prioritássort a hasznosságbecslések módosítására! Valahány- 
szor állapotmódosításra kerül, az őt megelőző állapotok is potenciálisan 
módosítandók, tehát be kell állítani őket a sorba. A sor inicializálását annak 
az állapotnak a felhasználásával végezzük, amelyből a legutolsó átmenet 
történt. Csak rögzített számú módosítást engedjen meg! 

(b) Kísérletezzen a prioritássor rendezésének különböző heurisztikáival, vizsgál- 
ja meg a tanulás sebességére és a számítási időre gyakorolt hatásukat! 


A 21.2. alfejezetben bemutatott közvetlen hasznosságbecslési módszerek elkülö- 
nített végállapotokat használtak a kísérlet végének jelzésére. Hogyan módosítha- 
tók végállapottal nem rendelkező, leértékelt jutalmakat használó környezetekre? 


Hogyan használható az értékmeghatározási algoritmus úgy, hogy egy U hasz- 
nosságbecslés-halmazt és egy M becsült modellt használó ágensnek a helyes ér- 
tékeket használó ágenshez képesti várható veszteségét számítsa? 


Adaptálja a 2. fejezetben bemutatott porszívóvilágot megerősítéses tanulásra! 
Az ágens kapjon jutalmat minden felszívott szemétért, a helyére való visszaérés- 
kor és kikapcsoláskor! Megfelelő észlelésekkel tegye megfigyelhetővé a világot! 
Kísérletezzen különböző megerősítéses tanulást végző ágensekkel! Szükség van-e 
függvényapproximációra a siker érdekében? Milyen approximátor működik erre 
az alkalmazásra? 


Valósítson meg egy felfedező megerősítéses tanuló ágenst, amely közvetlen 

hasznosságbecslést végez. Készítsen két változatot, az egyik táblázatos repre- 

zentációt használjon, a másik a (21.9) egyenlet függvényapproximátorát. Ha- 

sonlítsa össze teljesítményüket az alábbi három különböző környezetben: 

(a) A fejezetben leírt 4 x 3-as világ. 

(b) Egy 10 x 10-es világ, amelyben nincsenek akadályok, és a (10, 10) mezőn 
van -H1 jutalom. 

(c) Egy 10 x 10-es világ, amelyben nincsenek akadályok, és az (5, 5) mezőn 
van -HI jutalom. 


Írja fel az IK-tanulás paraméterfrissítési egyenletét a következő esetre: 


Út 89 14Bjx 1 8gy 1-Bzf(x—xg)? Hy — ye)? 


Találjon ki megfelelő jellemzőket a sztochasztikus négyzetrácsvilágra (a 4. x 3-as 
világ általánosítása), amely világ több akadályt és több (-H1, illetve —1 jutalommal 
jellemezhető) végállapotot tartalmaz! 
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21.10. Számítsa ki a valós hasznosságfüggvényt és az x, y függvényében felírható leg- 


jobb lineáris approximációt (éppúgy, mint a (21.9) egyenletben tettük) a követ- 
kező környezetekre: 

(a) Egy 10 x 10-es világ, amelyben a (10, 10) az egyetlen 3-1 végállapot mező. 
(b) Mint (a), de a (10, 1)-en van egy további -I végállapot. 

(c) Mint (b), de tegyen 10 véletlen módon választott mezőre akadályt. 

(d) Mint (b), de vegyen fel egy falat (5, 2)-től (5, 99-ig. 

(e) Mint (a), de a végállapot legyen az (5, 5). 

A cselekvések a négy lehetséges irányba való determinisztikus lépések. Minden 
esetben háromdimenziós ábrákat használva végezze el az összehasonlítást! 
Mindegyik környezetben adjon javaslatot további olyan tulajdonságokra (x-en 
és v-on túl), amelyek javíthatják az approximációt, majd ábrázolja az eredmé- 
nyeket! 


21.11. Terjessze ki a standard játékkörnyezetet (6. fejezet) úgy, hogy tartalmazzon 


jutalomjelet is! Helyezzen két ágenst ebbe a környezetbe (természetesen OSZtOZ- 
hatnak az ágensprogramon), és játszassa egymás ellen őket! Alkalmazza az 
általánosított IK frissítési szabályt (21.11 egyenlet) a kiértékelő függvény frissí- 
tésére. Lehet, hogy érdemes egy egyszerű súlyozott lineáris kiértékelő függ- 
vénnyel kezdeni, és egy egyszerű játékkal, mint a 3 x 3-as amőba (tic-tac-toe). 


21.12. Valósítsa meg a REINFORCE és PEGASUS algoritmusokat a 4 x 3-as világra, és 
fiwip. alkalmazza egy saját maga által választott stratégiacsaládra! Értékelje az ered- 


ményeket! 


21.13. Vizsgálja meg a megerősítéses tanulás elveinek humán. illetve állati viselkedésre 





] való alkalmazását! 


21.14. Alkalmas absztrakt modellje-e az evolúciónak a megerősítéses tanulás? Milyen 
i] Hi kapcsolat van — ha van egyáltalán — a beépített jutalomjelek és az evolúciós 


rátermettség közt? 


VII. RÉSZ 
KOMMUNIKÁCIÓ, 
ÉSZLELÉS ÉS 
CSELEKVÉS 





22. KOMMUNIKÁCIÓ 


Ebben a fejezetben meglátjuk, hogy az ágensek miért akarhatnak információt tartalma- 
zó üzeneteket küldeni egymásnak, illetve azt, hogy ezt hogyan tehetik meg. 


Alkonyodik az Amboseli Nemzeti Park szavannás erdőségében, közel a Kilimandzsáró 
tövéhez. A fehérbarkójú cerkófmajom vagy grivet (Cercopithecus aethiops — a ford.) 
egy csoportja épp élelem után kutat, amikor az egyik grivet hangos kiáltó hívást hallat. 
A csoport többi tagja felismeri, hogy ez egy leopárdra figyelmeztető felhívás (amely 
különbözik a sasra figyelmeztető rövid köhintéstől vagy a kígyókra vonatkozó szisze- 
géstől), és a fákra sietnek. A grivet sikeresen kommunikált a csoporttal. 

A kommunikáció (communication) az információ szándékolt átadása közös jel- 
rendszerből választott jel létrehozása és észlelése által. Az állatok többsége használ 
jelzéseket fontos üzenetek kifejezésére: itt van élelem, ragadozó a közelben, gyere 
közelebb, vonulj vissza, párosodjunk. Egy részlegesen megfigyelhető világban a kom- 
munikáció segít az ágenseknek sikeresnek lenni, mivel megfigyelhetnek mások által 
észlelt vagy kikövetkeztetett információt. 

Az embereket a nyelvként (language) ismert, strukturált üzenetekből álló összetett 
rendszer különbözteti meg más élőlényektől, amely lehetővé teszi számunkra, hogy a 
világról szóló ismereteink nagy részét átadhassuk egymásnak. Bár a csimpánzok, delfi- 
nek és más emlősök több száz jeles szókinccsel rendelkeznek, és van valamiféle hajla- 
muk ezek összekapcsolására, az ember az egyedüli faj, amely minőségileg különböző 
üzenetek korlátlan számát képes megbízhatóan átadni. 

Természetesen vannak más tulajdonságok, amelyek egyedülállóan emberiek: egyet- 
len más faj sem visel ruhát, készít művészeti alkotásokat vagy néz naponta három órán 
át televíziót. Azonban amikor Turing a tesztjét javasolta (lásd 1.1. alfejezet), a nyelvre 
alapozta azt, mivel a nyelv bensőséges kapcsolatban áll a gondolkodással. Ebben a feje- 
zetben elmagyarázzuk, hogyan működik egy kommunikáló ágens, és bemutatjuk az 
angol nyelv egy egyszerűsített részletét. 


22.1. A KOMMUNIKÁCIÓ MINT CSELEKVÉS 


Egy ágens számára a beszéd létrehozása lehetséges cselekvéseinek egyike. Ezt szólás- 
aktusnak (speech act) nevezzük. A , beszédet" olyan értelemben használjuk, mint 
, szabad közlést", nem mint , beszélgetést", így az elektronikus levelezés, a mutogatás 
és a jelbeszéd használata mind szólásaktusnak számít. Az angol nyelvben nincs általá- 
nos szó a beszédet létrehozó ágensre, amely beszél, ír vagy másképp fejezi ki magát. 
A beszélő (speaker), a hallgató (listener) és a megnyilatkozás (utterance) kifejezése- 


ket használjuk a kommunikáció bármilyen módjának általános leírására. A szó (word) 
kifejezést használjuk mindenféle szokásos kommunikációs jelre. 

Miért foglalkozna egy ágens szólásaktus létrehozásával, amikor , hagyományos" 
cselekvést is végrehajthat? A 12. fejezetben láttuk, hogy többágenses környezetekben 
az ágensek használhatják a kommunikációt annak érdekében, hogy közös tervet alakít- 
sanak ki. Például a wumpus világot felfedező ágensek egy csoportja együtt (egyéni 
vagy csoportos) előnyhöz jut, ha képes a következőket megtenni: 


s  Megkérdezik (guery) egymást a világ különféle területeiről. Ezt tipikusan kérdések 
feltevésével végzik: Érezted a wumpus bűzét valahol? 

.  Értesítik (inform) egymást a világról. Ezt kijelentésekkel teszik meg: Szellő van itt, 
a [3, 4]-en. Egy kérdés megválaszolása egy másik fajta értesítés. 

s Kérnek (reguest) más ágenseket cselekvések végrehajtására: Kérlek segíts az ara- 
nyat vinni! Néha egy indirekt szólásaktus (indirect speech act) (egy kijelentés 
vagy kérdés formájú kérés) udvariasabbnak számít: Használni tudnék egy kis segít- 
séget ennek a cipelésében. Egy fennhatósággal rendelkező ágens adhat parancsokat 
(Alfa jobbra menj; Bravo és Chartie balra), és egy hatalommal rendelkező ágens 
fenyegethet (Ide nekem az aranyat, vagy...). Ezen szólásaktusokat együtt direktí- 
váknak (directives) nevezik. 

s Tudomásul veszik (acknowledge) a kéréseket: Rendben. 

s  Megígérnek (promise) vagy hozzájárulnak egy tervhez: Én lelövöm a wumpust; 
te megragadod az aranyat. 


Minden szólásaktus befolyásolja a világot a levegőmolekulák rezgetésével (vagy ekvivalens 
hatással más médiumban), és ily módon megváltoztatja más ágensek mentális állapotát, 
valamint végső fokon a jövőbeli cselekedeteiket is. Bizonyos szólásaktusok információt jut- 
tatnak a hallgatóhoz, feltételezve, hogy a hallgató döntéshozatalát megfelelően befolyásol- 
ja az információ. Mások sokkal célzottabban késztetik a hallgatót valamilyen cselekvés 
véghezvitelére. A szólásaktusok további osztálya a deklaratív (declarative), amely sok- 
kal közvetlenebb hatást gyakorol a világra: férjnek és feleségnek nyilvánítom önöket vagy 
Harmadik találat, ön kiesett. Természetesen a hatást az érintett ágensek mentális állapotai 
komplex hálózatának létrehozása vagy tudomásulvétele éri el: házasnak lenni vagy kiesni, 
olyan állapotok, amelyeket megállapodások rögzítenek és nem a világ , fizikai" jellemzői. 

A kommunikáló ágens feladata annak eldöntése, hogy mikor van szükség egy szólás- 
aktusra, és hogy melyik a helyénvaló az összes lehetséges közül. A szólásaktusok meg- 
értésének problémája hasonlatos más megértési (understanding) problémákhoz, mint 
például a képek megértése vagy a betegségek diagnosztizálása. Kapunk egy halmazt 
többértelmű bemenetekkel, amikből visszafelé haladva azt kell eldöntenünk, hogy a 
világ mely állapota hozhatta létre őket. Azonban mivel a beszéd tervezett cselekvés, 
a megértés magában foglalja a tervfelismerést is. 


A nyelv alapjai 
A formális nyelvet (formal language) karakterfüzérek (Strings) (lehetséges, hogy 


végtelen) halmazaként definiáljuk. Minden egyes füzér az úgynevezett záró (vagy ter- 
minális) szimbólumok (terminal symbols) — amelyeket néha szavaknak hívunk — ösz- 
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szekapcsolt sorozata. Például az elsőrendű logikában a záró szimbólumok között van a 
A és a P, és egy tipikus füzér a ,P A 97. A ,P 0 A" füzér nem része a nyelvnek. 
A formális nyelvek, mint például az elsőrendű logika vagy a Java, szigorú matematikai 
definíciókkal rendelkeznek. Ezzel ellentétben a természetes nyelvek (natural 
languages), mint pékdául a kínai, a dán és az angol, nem rendelkeznek szigorú definí- 
cióval, hanem beszélők egy közössége használja. Ebben a fejezetben a természetes 
nyelveket megpróbáljuk formális nyelveknek tekinteni, bár tisztában vagyunk azzal, 
hogy az illeszkedés nem lesz tökéletes. 

A nyelvtan (grammar) a nyelvet meghatározó szabályok véges halmaza. A formá- 
lis nyelveknek mindig van egy hivatalos nyelvtana, amelyet kezelési útmutatókban 
vagy könyvekben határoznak meg. A természetes nyelveknek nincs hivatalos nyelvta- 
na; bár a nyelvészek törekszenek a nyelv tulajdonságainak felfedezésére tudományos 
vizsgálatokkal, majd ezen felfedezések rögzítésére egy nyelvtanban. Eddig egyetlen 
nyelvész sem járt teljes sikerrel. Figyeljük meg, hogy a nyelvészek tudósok, akik a 
nyelvet úgy próbálják definiálni, ahogy az létezik. Vannak olyan előíró nyelvészek is, 
akik megpróbálják diktálni, hogy a nyelvnek milyennek kellene lennie. Olyan szabályo- 
kat alkotnak, mint például a , használd az ikes ragozást", amelyeket néha megjelentet- 
nek stílusútmutatókban, de kevés valódi hatásuk van a beszélt nyelvre. 

Mind a formális, mind a természetes nyelvek jelentést, avagy szemantikát (semantics) 
rendelnek minden egyes érvényes füzérhez. Például az aritmetika nyelvén lenne egy sza- 
bályunk, hogy ha ,X" és ,Y" kifejezések, akkor ,X -- Y" szintén kifejezés, amelynek 
a szemantikája X és Y összege. Természetes nyelvekben hasonlóan fontos a füzérek 
pragmatikáját (pragmatics) is megérteni: a füzér aktuális jelentését, ahogy az elhang- 
zik egy adott szituációban. A jelentés nemcsak a szavakban rejlik, hanem a szavak ín 
situ értelmezésében. 

A legtöbb nyelvtani szabály formalizmus a kifejezésstruktúra (phrase structure) 
ötletére épül — azaz arra, hogy a füzérek kifejezéseknek (phrases) nevezett, különböző 
kategóriából származó részfüzérekből állnak össze. Például , a wumpus", ,a király" és 
,A sarokban levő ágens"! kifejezések mind az úgynevezett főnévi kifejezés (noun 
phrase) (vagy röviden NP) kategória példái. Két ok létezik arra, hogy a kifejezéseket 
ilyen módon megkülönböztessük. Az egyik, hogy a kifejezések általában természetes 
szemantikus elemeknek felelnek meg, amelyekből a kijelentés jelentése megalkotható; 
például a főnévi kifejezések a világ objektumaira vonatkoznak. A másik, hogy a kife- 
jezések kategorizálása segít a nyelv megengedett füzéreinek leírásában. Azt mondhatjuk, 
hogy a főnévi kifejezések bármelyike kombinálható egy igei kifejezéssel (verb phrase) 
(VP), mint például ,is dead" (halott), hogy közösen egy olyan kifejezést fomáljanak, 
amelyik a mondat (sentence) (5) kategóriába tartozik. A főnévi és igei kifejezés köz- 

a 

! A fejezetben hozott példák fordításakor a következőképpen jártunk el: az olyan angol kifejezéseket, 
amelyek magyarul is szemléletesek az adott mondanivaló szempontjából, magyar fordításban adjuk meg. 
A kifejezések és részletesebb példák többségénél ez nem követhető, mivel a szerző az angol nyelv sajá- 
tosságaihoz illeszti a fejezet ismeretanyagának és példáinak megfogalmazását, így a fordítás lényegi vál- 
tozást hozott volna a fejezet tartalmában is. Ezeken a részeken a magyar változatban is meghagyjuk az ere- 
deti angol kifejezéseket, szükség esetén rövid magyar fordításukkal kiegészítve. A szerzők létrehozzák az 
angol nyelv egy formális részhalmazát, amin bemutatják a fejezetben ismertetett módszerek alkalmazását. 
Ezt is változatlan formában helyezzük át a magyar nyelvű kiadásba. Ezen részek magyar fordítását sem 
készítjük el, mivel a fordítás a mondanivaló szempontjából lényegtelen. (A ford.) 
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Generálóképesség 


A nyelvtani formalizmusok osztályozhatók generálóképességük (generatíve capacity) szerint: 
azoknak a nyelveknek a halmaza szerint, amelyeket képesek reprezentálni. Chomsky a nyelvtani 
formalizmusok négy osztályát írta le, amelyek csak az átíró szabályok formájában különböznek 
(Chomsky, 1957). Az osztályok hierarchiába rendezhetők, ahol minden osztály felhasználható az 
összes olyan nyelv leírására, ami leírható egy nála gyengébb osztállyal, és még néhány további 
nyelvre ís. Itt most felsoroljuk a hierarchiát, a legerősebbel kezdve. 

A rekurzívan felsorolható nyelvtanok (recursívely enumerable grammars) korlátozás nélküli 
szabályokat használnak: az átíró szabályok mindkét oldala tetszőleges számú záró és nem záró 
szimbólumot tartalmazhat, mint például az A B — C szabály. Ezen nyelvtanok kifejezőereje meg- 
egyezik a Turing-gépével. 

A környezetérzékeny nyelvtanok (context-sensitive grammars) csak olyan értelemben korlá- 
tozottak, hogy a jobb oldalnak legalább annyi szimbólumot kell tartalmaznia, mint a bal oldalnak. 
A környezetérzékeny (környezetfüggő) elnevezés abból a tényből ered, hogy egy A SB A XB 
szabály azt mondja, hogy egy S átírható X-re egy megelőző A és egy követő B környezetében. 
A környezetérzékeny nyelvtanok leírhatnak például olyan nyelvet, mint az db"! (a-k n hosszúsá- 
gú sorozata, amelyet ugyanannyi b és c követ). 

A környezetfüggetlen nyelvtanok (context-free grammars) (vagy CFG-k) esetében a bal oldal 
egyetlen nem záró szimbólumot tartalmaz. Így minden egyes szabály megengedi a nem záró szim- 
bólum átírását a jobb oldalra tetszőleges környezetben. A CFG-k népszerűek a természetes és prog- 
ramozási nyelvek nyelvtanai körében, bár ma már széles körben elfogadott, hogy létezik legalább 
néhány olyan természetes nyelv, mely tartalmaz olyan szerkezeteket, melyek nem írhatók le környe- 
zetfüggetlen nyelvtannal (Pullum, 1991). A környezetfüggetlen nyelvtanok képesek reprezentálni 
atta, de nem at"e"-t 

A reguláris nyelvtanok (regular grammars) a legkortátozottabb osztály. Minden szabálynak 
van egyetlen nem zárója a bal oldalán, és egy záró szimbólum a jobb oldalon, amit opcionálisan 
követhet egy nem záró, A reguláris nyelvtanok a véges automatával ekvivalens erejűek. Gyengén 
alkalmasak programozási nyelvek számára, például nem képesek nyitó és bezáró zárójelek egyen- 
súlyát leíró szerkezetek ábrázolására (az a"b" nyelv egy változata). Ehhez legközelebb a"b" repre- 
zentálásával juthatnak, amely tetszőleges számú a sorozatát követő tetszőleges számú b. 

A hierarchiában fentebb helyezkedő nyelvtanoknak nagyobb a kifejezőereje, de a kapcsolódó 
algoritmusok kevésbé hatékonyak. Az 1980-as évek közepéig a nyelvészek a környezetfüggetlen és 
környezetérzékeny nyelvtanokkal foglalkoztak. Azóta nagyobb hangsúlyt fektetnek reguláris nyelv- 
tanokra, amelyeket az elektronikusan elérhető szövegek mega- és gigabájtjainak gyors, még a 
kevésbé teljes analízis árán is történő feldolgozási igénye hívott életre. Ahogy Fernando Pereira 
mondta: , Minél öregebb leszek, annál lentebb megyek a Chomsky-hierarchián." Hogy lássuk, mit 
értett ezen, vesse össze (Pereira és Warren, 1980, Mohri, Pereira és Riley, 2002) 





bülső fogalma nélkül sokkal bonyolultabb lenne elmagyarázni, hogy miért jó mondat 
a ,the wumpus is dead" és miért nem a , wumpus the dead is". 

Az NP, a VP és az S kategóriák úgynevezett nem záró szimbólumok (nonterminal 
symbols). A nyelvtanok átíró szabályok (rewrite rules) segítségével definiálják a 
nem záró szimbólumokat. Az átíró szabályok leírására a Backus-Naur-formát (BNF) 
fogjuk átvenni, amelyet a B) függelékben írunk le az 1112. oldalon. Ezen jelölés 
szerint egy 


§ c NPVP 


szabály jelentése az, hogy egy S egy tetszőleges NP kategóriájú kifejezésből és az azt 
követő tetszőleges VP kategóriájú kifejezésből áll. 
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A kommunikációt alkotó lépések 


Egy tipikus kommunikációs epizód, amikor S beszélő P állítást szeretné átadni /f hall- 
gatónak W szavakkal, hét folyamatból áll: 

Szándék (intention). S beszélő valahogy eldönti, hogy van egy P propozíció, amit 
érdemes elmondani A! hallgatónak. A példánkban a beszélőnek az a szándéka, hogy a 
hallgató tudomására hozza, hogy a wumpus már nem él. 

Létrehozás (generation). A beszélő megtervezi, hogy P propozíciót hogyan alakít- 
sa át olyan kijelentéssé, amely valószínűvé teszi, hogy a hallgató, fogadva a kijelentést 
a jelenlegi szítuációban, kikövetkeztetheti P jelentést (vagy egy hozzá közelit). Tételez- 
zük fel, hogy a beszélő képes a következő szavakat létrehozni: , The wumpus is dead" 
(A wumpous halott), és jelöljük ezt W-vel. 

Szintézis (synthesis). A beszélő létrehozza W szavak fizikai realizációját, W-t. Ezt 
teheti tintával papíron, rezgésekkel levegőben vagy valamilyen más médiumon. 
A 22.1. ábrán egy olyan ágenst mutatunk, amely a 661. oldalon definiált fonetikus ábé- 
cével leírt W" hangfüzér szintézisét végzi: , (thaxwahmpaxsihzdehd]". A szavak egybe- 
folytak, ami tipikus a gyorsan beszélt nyelv esetében. 

Észlelés (perception). / észleli a W" fizikai megvalósulást, mint W4-t, és Wa szavak- 
ként dekódolja. Amikor a médium a beszéd, az észlelési lépést beszédfelismerésnek 
(speech recognition) nevezzük; amikor az írás, akkor optikai karakter felismerésének 
(optical character recognition). Mindkettő elmozdult az elvont léttől a mindennapi elő- 
fordulás irányába a kilencvenes években, főként az asztali számítógépek jelentős mér- 
tékben növekvő teljesítményének köszönhetően. 

Analízis (analysis). H kikövetkezteti, hogy W2-nek P), ..., P,, lehetséges jelentése 
van. Az analízist három fő részre osztjuk: szintaktikai elemzésre (parsing), szemantikai 


Szándék: 
Knov(H,.AlívelWurmpus, Sz)) 


Észlelés: Analízis 
(Elemzés): 
The wumpus ís dead NP vp 


Article Noun Verb Adjective 
1 1 1 [j 
The — wumpus is —— dead 


(Szemantikai JAlivelWiumpus, Now)! TELIAKB, 
értelmezés): TiredtWumpus, Now) -AlivelWumpusa, $3)9 
(Pragmatikus cAlivelWumpusi, $z) 

értelmezés): TiredíWumpusa, 53) 





22.1. ábra. A kommunikációban részt vevő hét folyamat, a The wumpus is dead" mondat felhasználásával 
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értelmezésre és pragmatikus értelmezésre. Az elemzés (parsing) egy bemeneti füzérhez 
tartozó elemzési, más szóval levezetési fa (parse tree) építésének a folyamata, ahogy a 
22.1. ábrán látható. Az elemzési fa belső csomópontjai kifejezéseket reprezentálnak, míg 
a levelek szavakat jelképeznek. A szemantikus értelmezés (semantic interpretation) 
az a folyamat, amelynek során kinyerjük egy kijelentés jelentéstartalmát valamilyen rep- 
rezentációs nyelven. A 22.1. ábrán két lehetséges szemantikai értelmezést mutatunk be: 
azt, hogy a wumpus nem él, és azt, hogy fáradt (a dead egy köznyelvi jelentése). A több 
lehetséges értelmezéssel rendelkező kijelentéseket többértelműnek (ambiguous) mond- 
juk. A pragmatikus értelmezés (pragmatic interpretation) figyelembe veszi azt a 
tényt, hogy ugyanazon szavaknak más jelentése lehet eltérő helyzetekben. Míg a szin- 
taktikai értelmezés egy egy argumentummal, a füzérrel rendelkező függvény, addig a 
pragmatikus értelmezés a kijelentést és annak környezetét vagy szituációját figyelembe 
vevő függvény. A példában a pragmatikus elemzés két dolgot tesz: a Now konstans ér- 
téket kicseréli az Sz konstanssal, ami a jelenlegi szituációt jelenti, illetve a Wumpus-t 
kicseréli Wurnpus-re, ami arra az egyetlen Wumpusra utal, amelyről tudott, hogy a bar- 
langban van. Általánosságban a pragmatikus elemzés a kijelentés végső értelmezéséhez 
sokkal többel járulhat hozzá; gondoljunk csak például arra, amikor a , A gyémántra 
nézek" elhangzik egy ékszerész, illetve egy baseballjátékos szájából.? A 22.7. alfejezet- 
ben látni fogjuk, hogy a pragmatikus elemzés segít értelmezi az ,.It is dead" kijelentést 
úgy, hogy a wumpus halott, ha egy olyan szituációban vagyunk, amikor a wumpus áll 
a figyelem középpontjában. 

A többértelműség feloldása (disambiguation). F kikövetkezteti, hogy S P,-t szán- 
dékozott közölni (ahol ideális esetben P; — P). A beszélők többsége nem szándékosan 
többértelmű, de a legtöbb kijelentésnek több megengedett értelmezése van. A kommu- 
nikáció azért működik, mivel a hallgató elvégzi azt a munkát, hogy rájöjjön, hogy me- 
lyik az az értelmezés, amit a beszélő valószínűleg közölni akart. Vegyük észre, hogy ez 
Az első alkalom, amikor a valószínűleg szót használtuk, és a többértelműség feloldása 
az első eljárás, ami erőteljesen valószínűségi következtetésen alapul. Az analízis lehet- 
séges értelmezéseket állít elő; ha egynél több értelmezést talál, akkor a többértelműség 
feloldása választja ki a legjobbat. 

Beépítés (incorporation). / eldönti, hogy elhiszi P,-t (vagy nem). Egy teljesen naiv 
ágens mindent elhihet, amit hall, de egy kifinomultabb ágens úgy kezeli a szólásaktust, 
mint egy P;-t alátámasztó tényt, és nem mint annak a megerősítését. 

Mindezeket összerakva a 22.2. ábrán látható ágensprogramot kapjuk. Itt az ágens ro- 
botszolgaként működik, amit egy gazda irányíthat. A szolga minden lépésben megvá- 
laszolja a gazda kérdését, illetve végrehajtja a parancsát, és a szolga minden, a gazda 
által kijelentett állítást elhisz. Ezenkívül megállapítást tesz az aktuális szituációra (csak 
egyszer), ha nincs más tennivalója, és megtervezi saját akcióját, ha magára hagyják. 
Íme, egy tipikus párbeszéd: 


ROBOTSZOLGA GAZDA 
Szellőt érzek. Menj I, 2-re! 
Semmi sincs ítt. Menj északnak! 


Szellőt és bűzt érzek, valamint csillogást látok. . Ragadd meg az aranyat! 


2 A basebalipálya angol elnevezése diamond. mivel alakjával a gyémántra hasonlít. (A ford.) 
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function NAIv-KOMMUNIKÁLÓ-ÁGENS[észlelés) returns cselekvés 
static: 7B, egy tudásbázis 
állapot, a környezet jelenlegi állapota 
cselekvés, a legutóbbi cselekvés, kezdetben semmi 


állapot — ÁLLApor-Feissírés(állapot, cselekvés, észlelés) 

szavak — BESZÉD-RÉsz( észlelés) 

szemantika — EGYÉRTELMŰSÍT(PRAGMATIKUS-ÉRTELMEZÉS(SZEMANTIKA(ELEMZÉS(szavak)))) 

4 szavak — Üres and cselekvés nem MOND then /? írd te az állapotot! §/ 
return MONDXLEÍRÁS-KÉszírésláttapot)) 

else íf TípPus( szemantika] — Utasítás then /t Hajtsd végre az utasítást! "/ 
return TARTALOM szemantika] 

else if Típus(szemantika] — Kérdés then /t Válaszold meg a kérdést! "/ 
válasz — KÉRDEZ(TB, szemantika) 
return MOND(LEÍRÁS-KÉszírÉS( válasz) 

else if Típus(szemantika) — Állítás then /? Hidd el az állítást! "/ 
MOND(TB, TARTALOM[szemantika]) 

/" Ha idáig eljutunk, akkor a , hagyományos" cselekvést hajtsd végre! "/ 

return ELSŐ(TERVEZÉS(7B, állapot) 











22.2. ábra. Egy kommunikáló ágens, amely elfogad parancsokat, kérdéseket és állításokat. Az ágens 
leírhatja az aktuális állapotot, valamint végrehajthat , hagyományos", nem szólásaktus cselekvést is, ha 
nincs mit mondania. 


22.2. FORMÁLIS NYELVTAN AZ ANGOL NYELV 
EGY TÖREDÉKÉRE 


Ebben a fejezetben definiálunk egy nyelvtant az angol nyelv egy kis töredékére, ami 
megfelelő a wumpus világról szóló kijelentésekhez. Ezt a nyelvet €p-nak nevezzük. 
A későbbi részek javítani fognak az £9-n, hogy valamelyest jobban hasonlítson a be- 
szélt angolra. Igen valószínűtlen, hogy valaha is megszerkesztjük az angol nyelv teljes 
nyelvtanát, már csak azért sem, mível nincs két ember, aki teljesen megegyezne abban, 
mit is tekint érvényes angolnak. 


Az €, szókincse 


Először definiáljuk a szókincset (lexicon), azaz a megengedett szavak listáját. A szava- 
kat a szótárhasználók számára ismerős módon csoportosítjuk kategóriákba, avagy 
beszédrészekbe: főnevek, névmások és nevek dolgok elnevezésére, igék események je- 
lölésére, jelzők a főnevek módosítására és határozószók az igék módosítására. Egyes 
olvasók számára kevéssé ismertek lehetnek a következő kategóriák: névelők (articles) 
(például a he), elöljárószavak (prepositions) (például in) és kötőszók (conjunctions) 
(például and). A 22.3. ábra mutat egy kis szókincset. 

Minden egyes kategória ...-tal végződik annak jelzésére, hogy vannak más szavak is 
a kategóriában. Azt is meg kell jegyeznünk azonban, hogy két különálló ok van a sza- 
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Noun táj stench ] breeze ] glitter [ nothing 
I wumpes ( pit ) píts ) gold ) east ] ... 
Verb s is ) see ] smell ] shoot / feel ] stinks 


1g0 [grab ] carry ( kill [tura ] ... 








Adjective a right [ left ] east dead ( back ] smelly ) .... 
Adverb a here ] there ] nearby ] ahead 

I right [ left cast [ south ] back ) .... 
Pronoun ék melyonulK[ it]... 
Name sé; John [ Mary I Boston ! Aristotle ) .... 
Article tn thelalan] ... 
Preposition s tolínl on] near [ ... 
Conjunction s and] or] but [ ... 
Digit a 0111213141516171819 





22.3. ábra. £g szókincse 


vak hiányára. A főnevek, az igék, a jelzők és a névmások esetében elméletileg sem 
lehetséges az összes felsorolása. Nemcsak azért, mert minden osztálynak ezernyi vagy 
tízezernyi tagja lehet, hanem azért is, mive! folyamatosan hozzáadódnak újak, mint pél- 
dául az MP3 vagy az anime. Ezt a négy kategóriát nyitott osztályoknak (open classes) 
nevezzük. A többi kategóriát (névmások, névelők, elöljáró- és kötőszók) lezárt osztá- 
lyoknak (closed classes) hívjuk. Mindegyikben kevés számú szó van (néhánytól pár 
tucatig), amelyek elméletileg teljesen felsorolhatók. A lezárt osztályok évszázadok 
folyamán változnak, nem hónapok alatt. Például a thee" és a ,thou" a 17. században 
elterjedt névmások voltak, hanyatlóban voltak a 19. században, és manapság csak ver- 
sekben és egyes régiók dialektusában lehet találkozni velük. 


Az €9 nyelvtana 


A következő lépés a szavak kifejezésekké történő kombinálása. Öt nem záró szimbó- 
lumot fogunk használni a különböző típusú kifejezések definiálására: mondat (5), 
főnévi kifejezés (NP), igei kifejezés (VP), elöljárói kifejezés (PP) és relatív klóz 
(RelClause).? A 22.4. ábra €o számára mutat egy nyelvtant, minden egyes átíró 
szabályra példát adva. Az £9 jó angol mondatokat generált, mint amilyenek például a 
következők: 








John is in the pit 
The wumpus that stinks is in 2 2 
Mary is in Boston and John stinks 


Sajnálatos módon a nyelvtan túlgenerál (overgenerates) — előállít olyan mondatokat, 
amelyek nyelvtanilag helytelenek -, mint például a , Me go Boston?" és az , 1 smell pit 


3 Egy relatív klóz főnévi kifejezést követ és módosít. (A klóz a nyelvészetben egy alárendelt mellék- 
mondat — a ford.) Egy relatív névmásból (mint a , who" és a that") és egy azt követő igei kifejezésből 
ll. (Egy másik típusú relatív klóz a 22.12. feladatban szerepel.) Példa egy relatív klózra a that stínks a 
The wumpus that stinks is im 2 27 mondatban. 
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s a NP VP 14- feel a breeze 
§ Conjunction § I feel a breeze 3- and -- I smell a wumpus 
NP a Pronoun I 
Name John 
Noun pits 
Article Noun the 4 wumpus 
Digit Digit 34 
NP PP the wumpus -k to the east 
NP RelClause the wumpous -k that is smelly 
vp a Verb stínks 
VP NP feel -4- a breeze 
VP Adjective ís -- smelly 
VEEE turn -t- to the cast 
VP Adverb 20 4 ahead 
PP ség Preposítion NP 10 4- the east 
RelClause szi that VP that 4 is smelly 








224. ábra. Az € nyelvtana, minden egyes szabályra példa kifejezést adva 


gold wumpus nothing east". Alul is generál (undergenerates): sok olyan angol mondat 
van, amit elutasít, mint például a ,,I think the wumpus is smelly". (Egy másik hátránya, 
hogy a nyelvtan nem nagybetűvel kezdi a mondatokat, és nem rak pontot a végükre. Ez 
azért van, mivel elsősorban beszédre tervezték, és nem írásra.) 


22.3. SZINTAKTIKAI ANALÍZIS (ELEMZÉS) 


Már definiáltuk az elemzést (parsing) mint az adott bemeneti füzérhez tartozó leveze- 
tési fa megtalálásának folyamatát. Azaz a PARSE függvény meghívása, mint például a 


PARSE(, the wumpus is dead", €o, 5) 


olyan fát kell visszaadnia, amelynek gyökerében S áll, levelei a , the wumpus is dead" 
és belső csomópontjai az £g nyelvtan nem záró szimbólumai, A 22.1. ábrán láthattunk 
egy ilyen fát. Folytonos szövegként a következőképpen írhatjuk: 


IS:  INP: [Article: the) [Voun: wumpus)]]) 
[VP: (Verb: is] [Adjective: deadji1 


Az elemzés tekinthető egy levezetési fa megkeresésének folyamataként. A keresési tér 1 
meghatározásának két szélsőséges (és sok közbülső) módja van. Az egyik szerint 
kiindulhatunk az S szimbólumból, és kereshetünk egy olyan fát, amely leveleiben tar- 
talmazza a szavakat. Ez az úgynevezett fentről lefelé elemzés (top-down parsing) 
(mivel §-et a fa tetejére helyezzük). Másrészt kiindulhatunk a szavakból, és kereshe- 
tünk egy fát, ahol S a gyökércsomópont. Ez a lentről felfelé elemzés (bottom-up 
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parsing).! A fentről lefelé történő elemzés pontosan definiálható a következő keresési 
problémaként: 


s A kezdeti állapot (initial state) egy elemzési fa, amelynek S a gyökércsomópontja, 
és egy ismeretlen gyerekcsomópontja van: (S: ?)]. Általánosságban a keresési térben 
minden állapot egy levezetési fa. 

s. Az állapotátmenet-függvény (successor function) kiválasztja azt a legszélső csomó- 
pontot bal oldalon a fában, amelynek ismeretlen gyereke van. Ezek után a nyelvtan- 
ban olyan szabályokat keres, amelyek ezt a csomópontot tartalmazzák gyökérelem- 
ként. Minden ilyen szabályra generál egy következő állapotot, ahol a ? szimbólumot 
felcseréli a szabály jobb oldalának megfelelő listával. Például az €g nyelvtanban két 
szabály van 5-re, így az (S: ?] fát a következő két származtatottal cseréli le: 


(S: (S: ?) [Conjunction: ?] (S: ?11 
IS: (WP: ?] (VP: 7] 


A másodiknak hét származtatottja lesz, minden NP átírási szabályhoz egy. 
§ A célteszt (goal test) ellenőrzi, hogy a levezetési fa levelei pontosan megfelelnek-e 
a bemeneti füzérnek, nincsenek-e ismeretlenek és lefedetlen bemenetek. 


A fentről lefelé történő elemzés egyik nagy problémája az úgynevezett bal-rekurzív 
szabályok (left-recursive rules) kezelése, melyek X — X ... alakúak. Mélységi kere- 
séssel egy ilyen szabály végtelen ciklusban X-et [X: X ...]-ra cserélné. Szélességi kere- 
sés esetén sikeresen megtaláljuk az érvényes mondatok elemzéseit, de érvénytelen 
mondatok esetében egy végtelen keresési térben ragadnánk le. 

A lentről felfelé történő elemzés keresésként történő formalizálása a következő: 


. A kezdeti állapot (initial state) a bemeneti füzérben található szavak listája, mind- 
egyiket egy olyan levezetési faként ábrázolva, melynek csak egy levele van, példá- 
ul: (the, wumpous, is, dead]. Általánosságban a keresés minden állapota levezetési 
fák egy listája. 

. Az állapotátmenet-függvény (successor function) megvizsgál minden i pozíciót a 
fák listájában a nyelvtan szabályainak minden lehetséges jobb oldalán. Ha a lista / 
pozíciójában kezdődő részsorozata illeszkedik a jobb oldalra, akkor a részsorozatot 
lecseréli egy új fára, amelynek kategóriája a szabály bal oldala, és amelynek gyere- 
kei a részsorozat. , Illeszkedés" alatt azt értjük, hogy a csomópont kategóriája meg- 
egyezik a jobb oldal elemének kategóriájával. Például az Article — the szabály 
illeszkedik a [the, wumpus, is, dead) első csomópontjából álló részsorozatra, így 
a következő állapot az [[Article: the), wumpus, is, dead) lenne. 

s A célteszt (goal test) egy olyan állapotot keres, ahol egyetlen fa van, melynek gyö- 
kere az S. 


A 22.5. ábra bemutat egy példát a lentről felfelé történő elemzésre. 


A lentről felfelé és a fentről lefelé történő elemzés is lehet kevéssé hatékony azon 
módok számossága miatt, ahogy különböző kifejezésekhez többféle elemzés rendelhető. 


A Észrevehető, hogy a fentről lefelé és a lentről felfelé történő elemzés hasonló az előre-, illetve hátrafe- 
1é következtetéshez, amiket a 7. fejezetben írtunk le. Hamarosan látni fogjuk, hogy ez az analógia pontos. 
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lépés csomópontok listája részsorozat szabály 

KEZD the wumpus is dead the Article — the 

2 Article wampus ís dead "wumpus Noun — wumpus 
3 Article Noun is dead Article Noun NP — Article Noun 
4 NP is dead is Verb — is 

5 NP Verb dead dezd Adjective — dead 
6 NP Verb Adjectíve Verb VP — Verb 

7 NP VP Adjective VP Adjective VP — VP Adjective 
8 NP VP NP VP § c NPVP 

Cén S 











22.5. ábra. A , the wumpus is dead" lentről felfelé történő elemzési lépései. A szavakat tartalmazó cso- 
mópontok listájával kezdünk. Ezek után egy szabály jobb oldalára illeszkedő részsorozatokat felcseré- 
lünk egy új csomóponttal, amelynek gyökere a szabály bal oldala. Például a harmadik sorban az Article 
és Noun csomópontokat lecseréljük egy NP csomópontra, amelynek e két csomópont lesz a gyereke. 
A fentről lefelé elemzés hasonló lépéseket eredményezne, de épp a fordított irányban. 


Mindkettő elpazarolhatja az időt a keresési tér irreleváns részeinek vizsgálatával. 
A fentről lefelé keresés generálhat olyan közbülső csomópontokat, amelyek sosem zár- 
hatók le szavakkal, és a lentről felfelé keresés generálhat olyan részleges elemzéseket 
a szavakhoz, amelyek nem fordulhatnak elő egy 5-ben sem. 

Még ha lenne is egy tökéletes heurisztikánk, amely lehetővé tenné az irreleváns ki- 
térők nélküli keresést, ezek az algoritmusok akkor sem lennének hatékonyak, mivel 
bizonyos mondatoknak exponenciálisan sok levezetési fája van. A következő alfejezet 
megmutatja, hogy mit kezdhetünk ezzel a problémával. 


Hatékony elemzés 


Vizsgáljuk meg a következő két mondatot: 


Have the students in section 2 of Computer Science 101 take the exam. 
Have the students in section 2 of Computer Science 101 taken the exam? 


Bár az első 10 szavuk közös, teljesen különböző levezetésük van, mivel az első egy 
felszólítás, a második egy kérdés. Egy balról jobbra elemző algoritmusnak tippelnie 
kellene, hogy az első szó egy felszólítás vagy egy kérdés része-e, és nem tudná meg- 
mondani, hogy a tipp helyes-e egészen a tizenegyedik szóig: take vagy taken. Ha az 
algoritmus rosszul tippelt, egészen az első szóig kellene visszalépnie. Az ilyen típusú 
visszalépés elkerülhetetlen, de ha azt szeretnénk, hogy az algoritmusunk hatékony 
legyen, akkor el kell kerülnie a , the students in section 2 of Computer Science 101" 
NP-ként történő újraelemzését minden alkalommal, amikor visszalép. 

Ebben a részben egy olyan algoritmust alakítunk ki, amely ezt a hatékonysági prob- 
lémát kezelni tudja. Az alapötlet a dinamikus programozás (dynamic programming) 
egy példája: minden alkalommal, amikor egy részfüzért elemzünk, tárold az eredményt, 
így később majd nem kell újraelemeznünk. Példáui ha egyszer rájöttünk, hogy a ,.the 
studenis in section 2 of Computer Science 101" egy NP, ezt eltárolhatjuk egy diagramnak 
(chart) nevezett adatstruktúrában. Az így működő algoritmusokat diagramelemzőknek 
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(chart parsers) nevezik. Mivel környezetfüggetlen nyelvtanokkal fogtalkozunk, a keresé- 
si tér egy ágának kontextusában talált tetszőleges kifejezés éppúgy szerepelhet a keresési 
tér bármilyen más ágában is. 

Egy n szóból álló mondat diagramja n -- 1 csomópontból (vertex) és számos, eze- 
ket összekötő élből (edges) áll. A 22.6. ábrán láthatunk egy diagramot hat csomópont- 
tal (körök) és három éllel (vonalak). Például a 


IO, 5, S 6 NP VP e] 


címkéjű él azt jelenti, hogy egy NP-t egy VP követ, és együtt alkotnak egy 5-et, mely a 0- 
tól 5-ig terjedő karaktersorozatot fedi le. Egy élben található " jel elválasztja a már megta- 
láltat a még keresettől. A " jellel záródó éleket teljes éleknek (complete edges) nevezik. A 


(0, 2, 5 — NP e VP] 


él szerint egy NP lefedi a 0-tól 2-ig terjedő karaktersorozatot (az első két szó), és ha tudunk 
találni egy ezt követő VP-t, akkor lenne egy 5-ünk. Az ilyen élek, ahol a pont a végük előtt 
van, úgynevezett befejezetlen (nem teljes) élek, és azt mondjuk, hogy az él egy VP-t vár. 


(0,5 586 NP VPe] 










(0,2§— NP e VPJ (2, 5 VP — Verb NP) 


22.6. ábra. A , The agent feels a breeze" mondat diagramjának egy részlete. Mind a hat csomópont lát- 
ható, de csak három él szerepel azok közül, melyek teljes elemzést eredményeznének. 


A 22.7. ábra a diagramelemző algoritmust szemlélteti. A lényege a fentről lefelé és a 
lentről felfelé legjobb tulajdonságainak ötvözése. A JÓSLÓ eljárás fentről lefelé műkö- 
dik: olyan bejegyzéseket helyez el a diagramban, amelyek megmondják, hogy milyen 
szimbólumok milyen helyszínen elvártak. A SZKENNER egy lentről felfelé eljárás, amely 
a szavakból indul ki, de egy szót csak egy meglevő diagrambejegyzés kiegészítésére 
használ fel. Hasonlóképpen a KITERJESZTŐ a komponenseket lentről felfelé építi, de 
csak egy meglevő diagrambejegyzést egészít ki. 

Egy trükköt alkalmaztunk a teljes algoritmus elindításához: hozzáadtunk egy 
(0, 0, S" — " 5] élet a diagramhoz, ahol S a nyelvtan kezdeti szimbóluma, 5" pedig egy 
általunk most kitalált új szimbólum. AZ ÉL-HOZZÁAD meghívása azt eredményezi, 
hogy a JóSLÓ éleket ad az olyan szabályokhoz, melyek 5-t eredményezhetnek, azaz 
(S - NP VPJ. Ezek után megvizsgáljuk ezen szabály első alkotóelemét, NP-t, és min- 
denféle módon olyan szabályokat adunk hozzá, melyek NP-t eredményeznek, Végső 
soron a JÓSLÓ fentről lefelé módon minden lehetséges élt hozzáad, ami felhasználható 
a végső S megalkotásában. 


5 A s miatt nevezik az éleket néha pontozott szabályoknak (dotted rules). 
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function DIAGRAMELEMZŐ(szavak, nyelvtan) returns diagram 


diagram — a (0... Hossz(szavak)) üres listák elrendezése 
ÉL-Hozzáa[0, 0, 5" — " 5]) 
for í — from 0 to Hossz(szavak) do 
SZKENNER(i, szavakl[íi)) 
return diagram 


procedure ÉL-HozzáaD( él) 
/ Adj hozzá egy élt a diagramhoz, és vizsgáld meg, hogy kiterjeszt, vagy jósol-e más élt! "/ 
if él nincs a diagrami VÉGE(él)]-ben then 
hozzáfűz él a diagram VÉGE(éPl-hez 
if él-nek nincs része a pont után then KITERJESZTŐ[él) 
else JósLó(él) 


procedure SZKENNER(j, szó) 
79 Minden egyes élt terjessz ki, amely a megadott kategóriájú szót várja! 
for each (i, j, A — a " B B) in diagramlj) do 
íf szó B kategórájából való then 
ÉL-Hozzáar([£ jt 1.4 a8B":8b 


procedure JÓSLÓ([í, j. A 0 a" B8D 
S?" Minden olyan B-re vonatkozó szabályt adj a diagramhoz, ami segíthet ezen élt kiterjeszteni! §/ 
for each (B — 9) im ÁTÍR(B, nyelvtan) do 
ÉL-Hozzáanílj, j, B— ea) 


Procedure KITERJESZTŐK([/, k, BO. 9") 
I" Nézd meg, mely élek terjeszthetők ki ezzel az éltet! "/ 
€p — ezen eljárás bemeneteként kapott él 
for each [í, j, A — a " B" A 1 in diagram) do 
it B — B" then 
ÉL-HOZZÁAIÁ[í, k, A — a eg" b) 











22.7. ábra, A diagramelemző algoritmus. S a kezdő szimbólum és S" egy új nem záró szimbólum, 
diagramíj] pedig azon élek listája, melyek a j csomópontban végződnek. A görög ábécé betűi nulla vagy 
több szimbólumból álló füzérekre illeszkednek. 


Amikor §" jóslója készen van, belépünk egy ciklusba, amely meghívja a SZKENNER-t 
a mondat minden egyes szavára. Ha a j pozícióban álló szó egy B kategória tagja, amit 
valamelyik él keres a j pozícióban, akkor kiterjesztjük azt az élet megjelölve a szót, 
mint B egy példányát. Vegyük észre, hogy a SZKENNER minden egyes meghívása vég- 
ződhet a JÓSLÓ és a KITERJESZTŐ rekurzív meghívásával, ily módon ötvözve a fentről 
lefelé és a lentről felfelé feldolgozást. 

A másik lentről felfelé komponens, a KITERJESZTŐT vesz egy teljes élt, amelynek 
bal oldalán B van, és felhasználja a diagramban levő bármely nem teljes szabály ki- 
terjesztésére, amely ott végződik, ahol a teljes él kezdődik, ha a nem teljes szabály 
egy B-re vár. 


§ A KITERJESZTŐ eljárásunkat tradicionálisan TELJESSÉ-TEVŐ-nek hívták. Ez a név félrevezető, mivel 
az eljárás nem fejez be éleket: bemenetként vesz egy teljes élt, és kiterjeszt nem teljes éleket. 
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A 22.8. és 22.9. ábrák mutatják az ,,I feel it" mondat (amely a , Do you feel a 
breeze?" kérdésre adott válasz) diagramját és elemzési lépéseit. Tizenhárom él (a-m 
jelekkel ellátva) szerepel a diagramon, melyek közül öt teljes (a diagram verticei 
csomópontjai felett) és nyolc befejezetlen (alattuk). Vegyük észre a JÓSLÓ, SZKENNER 
és KITERJESZTŐ akciók ciklusát. Például a JÓSLÓ felhasználja azt a tényt, hogy az ,a" 
él egy S-t vár ahhoz, hogy megelőlegezze egy NP (, b" él) és egy Pronoun (, c" él) jós- 
latát. Ezek után a SZKENNER felismeri, hogy van egy Pronoun a megfelelő helyen (, d" 
él), és a KITERJESZTŐ kombinálja a ,, b" nem teljes élt a , d" teljes éllel, így előállítva 
egy új élt, , e7-t. 


ms 





a:5/8 fVPWNerb Jj:NP/Pronoun 
b:§/NP VP 8:VP/AVP NP 
c:NP/Pronoun 


228. ábra. Az gr feel 2 it 3" mondat diagramelemzése. Az m:S jelölés azt jelenti, hogy az mi élnek 
egy 5 áll a jobb oldalán, míg az f:VP/Verb azt, hogy az félnek VP van a bal oldalán, de egy Verb-et vár. 
Ör teljes él van a csomópontok felett, és nyolc hiányos alattuk. 


A diagramelemző algoritmus elkerüli az élek nagy halmazának építését, amit az egy- 
szerű lentről felfelé eljárás végigvizsgált volna. Vegyük a ,,The ride the horse gave was 
wild" mondatot. Egy lentről felfelé elemzés megjelölné a , ride the horse"-t mint egy 
VP-t, majd elvetné az elemzési fát, amint rájönne, hogy nem illeszkedik egy nagyobb 
5-be. Azonban az €g nem engedi meg, hogy egy VP a ,the"-t kövesse, így a diagram- 
elemző algoritmus sosem jósol VP-t ezen a ponton, így elkerüli ott a VP szerkezet idő- 
pocsékoló építését. Azokat az algoritmusokat, melyek balról jobbra működnek, és el- 
kerülik ezen lehetetlen szerkezetek felépítését, balsarok-elemzőknek (left-corner 
parsers) nevezzük, mivel egy olyan elemzési fát építenek fel, amely a nyelvtan kezdő 
szimbólumával indul, és a mondat legszélén balra (a bal sarokban) álló szó felé terjesz- 
kednek. Egy élt csak akkor adnak a diagramhoz, ha ezen elemzési fa kiterjesztését szol- 
gálhatja (példaként lásd 22.10. ábra). 
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ÉI Eljárás Származtatás 

a INICIALIZÁLÁS [0.08 95) 

b JÓSLÓ(a) [0,0,5— 9 NPVPI 

c JósLÓ(b) (0, 0, NP —. 6 Pronoun ] 
d SZKENNER(C) IO, 1, NP — Pronoun " ) 
e KrregJEszTrő(b, d) IO, 1,§ c NPsVPI 

f JÓSLÓ(e) II, 1, VP. 6 Verb] 

g JÓSLÓ(e) [L.1.VP 6 eVPNPJ 
h SZKENNER(f) [1.2.VP G Verb"] 

i KiTERJESZTŐ(g, h) [1,2,VP 6 VPeNP] 
j JósLÓ(g) [2.2.NP — 9 Pronoun] 
k SZKENNER(h) [2,3, NP CG Pronown 9] 
1 KITERJESZTŐ, k) [1,3.VPo VPNP"] 
m KITERJESZTŐKe, 1) [0,3.§— NPVP e) 











22.9. ábra. Az ,.o I , feel 2 it 3." elemzési lépései. Az a-m élek mindegyikére megmutatjuk azt az eljá- 
rást, amít az él más, a diagramon már szereplő élekből történő származtatására használtunk. Bizonyos 
éleket a rövidség érdekében elhagytunk. 


S 
SZEREL 
NP VP 
ls 
NP RelClause 
POS SESZAÜlRo 
The ride the horse gave was wild 


22.10, ábra. Egy balsarok-elemző algoritmussal elkerülhető a , ride" szóval kezdődő VP jóslása, de jó- 
solni fog egy , was" szóval kezdődő VP-t, mivel a nyelvtan egy NP-t követő VP-t vár. A athe horse gave" 
feletti háromszög azt jelenti, hogy a szavaknak van egy RefCawse elemzésük, amihez azonban közvetle- 
nül további részek kapcsolódnak, amik nem láthatók. 





A diagramelemző csak polinomiális idő- és tárigényű. 0(kn?) helyet igényel az élek 
tárolására, ahol n a mondatban levő szavak száma és k egy, a nyelvtantól függő kons- 
tans. Amikor már nem tud több élt építeni, megáll, így tudjuk, hogy az algoritmus befe- 
jeződött (még akkor is, ha vannak bal-rekurzív szabályok). Valójában O(n") időt igényel 
legrosszabb esetben, ami a legjobb, amit elérhetünk környezetfüggetlen nyelvtanokra. 
A DIAGRAMELEMZŐ szűk keresztmetszete a KITERJESZTŐ, amelynek meg kell próbálnia 
kiterjeszteni a j-ben végződő 0(n) nem teljes él mindegyikét az ugyanott kezdődő 0(n) 
teljes él mindegyikével, j lehetséges n -- 1 különböző értékére. Ezeket összeszorozva 
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kapjuk O(r?)-at. Ez egyfajta paradoxont ad a számunkra: hogyan tud egy 0(12) algorit- 
mus visszaadni egy választ, amely exponenciális számosságú elemzési fát tartalmaz- 
hat? Vegyünk egy példát: a 


a Falt leaves fali and spring leaves spring" 


mondat többértelmű, mivel minden egyes szó (az , and" kivételével) lehet főnév és ige is, 
valamint a , fall" és a , spring" lehet melléknév is. Ennek a mondatnak mindösszesen négy 
elemzése van: 


(S: (S: (NP: Fall leaves] fall) and [S: (NP: spring leaves) spring] 
(S: (S: INP: Fall leaves] fall) and [S: spring (VP: leaves spring]] 
IS: (S: Fall (VP: Fall leaves) fall) and [S: (NP: spring leaves] spring] 
(S: (S: Fatl (VP: Fall teaves] fall and [S: spring (VP: leaves spring]] 


Ha n többértelmű összekapcsolt részmondatunk lett volna, akkor 27 módon választhat- 
nánk elemzést a részmondatokra.§ Hogyan kerüli el a diagramelemző az exponenciális 
feldolgozási időt? Két választ is adhatunk a kérdésre. Először is, a DIAGRAMELEMZŐ al- 
goritmus maga valójában egy felismerő, nem egy elemző. Ha van egy [0, n, S — a "] 
alakú teljes él a diagramon, akkor felismertünk egy S-t. Az elemzési fa előállítását ebből 
az élből nem tekintjük a DIAGRAMELEMZŐ feladatának, de elvégezhető. Vegyük észre, 
hogy a KIBŐvíTŐ utolsó sorában a-t élek ep listájaként építjük fel, nemcsak kategória 
nevek listájaként. Így egy él elemzési fává történő átalakításához egyszerűen az összete- 
vő éleket kell rekurzív módon végignézni, minden egyes [i, j, X — a") élt egy [X : a] 
fává átalakítva. Ez egyenes/közvetlen módszer, de csak egy elemzési fát ad. 

A második válasz szerint ha minden lehetséges elemzést szeretnénk, akkor mélyebbre 
kell ásnunk a diagramban. Miközben az [i, j, X — a") élt egy [X : a ] fává átalakítjuk, azt 
is megvizsgáljuk, hogy van-e másik, [i, j, X — 8") alakú él. Amennyiben van, ezek az élek 
további elemzési fákat generálnak. Így kapjuk azt a választási lehetőséget, hogy mit is 
kezdjünk velük. Fetsorolhatjuk az összes lehetőséget, ami azt jelenti, hogy a paradoxont 
feloldanánk, és exponenciálisan sok időre lenne szükségünk az összes elemzés felsorolá- 
sához. Vagy továbbvihetjük a rejtélyt egy kicsit és az elemzéseket egy tömörített erdő 
(packed forest) nevű struktúrával reprezentálhatjuk, amely a következőképpen néz ki: 

S; IS [NP: Fall leaves) ÍVP: Tari és 18: ÍV. spring leaves (VP: spring] 

(5: í ar Fatt) IVP: leaves fait) 1 és ÍS: WP: spring [VP: leaves sovinelj] 

A lényeg az, hogy minden csomópont lehet egy hagyományos elemzési fa csomó- 
pont, illetve csomópontok egy halmaza is. Ez lehetővé teszi számunkra, hogy exponen- 
ciális számú elemzést reprezentáljunk polinomiális időben és tárhelyen. Természetesen 
n :z 2 esetén nincs sok különbség 2" és Zn között, de nagy n-ekre egy ilyen reprezentáció 
jelentős megtakarítást eredményez. Sajnálatos módon ez az egyszerű tömörített erdő 
megközelítés nem kezeli az összes 0(r!) lehetőséget a kapcsolódások összerendelésére. 
Maxwell és Kaplan (1995) megmutatja, hogy egy, az igazság-karbantartó rendszerek 
alapelveire épülő, összetettebb reprezentáció ezeket a fákat még jobban összetömörítheti. 


7 Az CS: Falt (VP: leaves falljj elemzés megegyezik az , Autumn abandons autumn?" mondattal. 
Fmellett a komponensek összekapcsolódásának O(r17) számú értelmezése lenne — például (X és (F és Z)), 
illetve ((X és Y) és 2). De ez már egy másik történet, amelyet Church és Patil (1982) igen jól mesél el. 
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22.4. KITERJESZTETT NYELVTANOK 


A 22.2. alfejezetben láttuk, hogy az €p egyszerű nyelvtana előállítja az angol nyelv , I smell 
a stench" és sok más mondatát. Sajnos azonban sok nem megengedett mondatot is előál- 
lít, mint például a , Me smeli a stench". Ezen probléma elkerülése érdekében a nyelvta- 
nunknak tudnia kellene, hogy a , me" nem érvényes NP akkor, amikor a mondat alanya. 
A nyelvészek azt mondják, hogy az , !" névmás alanyesetű, míg a , me" tárgyesetű.? Ha 
figyelembe vesszük az eseteket, akkor rájövünk, hogy az €p nem környezetfüggetlen: 
nem igaz az, hogy minden NP minden mással egyenértékű, függetlenül a környezeté- 
től. A probléma megoldására bevezethetünk olyan új kategóriákat, mint az NPsés NPg 
a tárgyas és alanyi főnévi kifejezésekre. Ezenkívül ketté kellene bontanunk a Pronoun 
kategóriát a Pronouns-re (amelyik tartalmazza az , I-t) és Pronoung-ra (amelyik tar- 
talmazza a , me"-t). A 22.11. ábra felső része megmutatja az esetegyeztetés teljes BNF 
nyelvtanát; az így kapott nyelvet €j-nek nevezzük. Vegyük észre, hogy az összes NP 
szabályt meg kell kettőznünk, egyszer az NPs, másszor az NPg esetre. 

Sajnos az €j még mindig túlgenerál. Az angol és sok más nyelv megköveteli az alany 
és a mondat fő igéjének egyeztetését (agreement). Például ha , I" az alany, akkor az 
a] smell" nyelvtanilag helyes, míg az ,.I smells" nem. Ha , it" az alany, akkor fordítva 
igaz. Az angolban az egyeztetésből származó különbségek minimálisak: a legtöbb igének 
egy alakja van egyes szám harmadik személyű alanyokra (he, she vagy it), és egy másik 
alakja az egyes és többes szám és a személyek minden más kombinációjára. Egy kivétel 
van: az , I am / you are / he ís" három formával rendelkezik, Ha kombináljuk ezt a három 








s tek NPS VP... 
NPg a Pronouns ] Name ] Noun ... 

NPo a Pronouno ] Name ] Noun ... 

VP a VP NPgL -. 

PP a Preposition NPo 

Pronouny 2 Klyon[ hej she [át [ ... 

Pronoung a me [ you ] him [ her [ it 

s a NP(Subjective) VP... 
NP(eset) - Pronounteset) ] Name ] Noun .... 
VP Ét VP NP(Objective) ] ... 

PFP. a Preposition NP(Objective) 
PronountSubjective) a Klyoul hej she [it [ ... 


Pronoun(Objective) mej you ] him [ her [ it  ... 


1 











22.11. ábra, Felül: Az £) egy BNF nyelvtana, amely kezeli az alanyi és a tárgyas esetet a főnévi kifeje- 
zésekben, és ezért annyira nem is generál túl. Az €) nyelvtanával megegyező részeket elhagytuk. Lent: 
Az €/ egy definit klóz nyelvtana (DCG). 


9 Az angolban az alanyesetre a , subjectíve case" mellett alkalmanként a , nominative case" kifejezést 
is használják. Hasonlóképpen a tárgyesetre az objective case" mellett az , accusative case" is használatos 
esetenként. Sok nyelvnek van részes esete is az indirekt tárgy pozícióban álló szavakra. 
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különbségtételt az NPs és NPg különbségtétellel, akkor NP hat alakját kapjuk. Ahogy 
további különbözőségeket fedezünk fel, végül egy exponenciális sokaságot kapunk. 

Az altermatív megközelítés a nyelvtan létező szabályainak kiterjesztése (augmen- 
ting) új szabályok bevezetése helyett. Először megmutatjuk egy példán keresztül, 
hogy hogyan szeretnénk, hogy a kiterjesztett szabályok kinézzenek (a 22.11. ábra alsó 
fele), azután formálisan megadjuk, hogyan kell ilyen szabályokat értelmezni. A kiter- 
jesztett szabályok nem záró kategóriák esetében megengedik paraméterek alkalmazását. 
A 22.11. ábra megmutatja, hogyan írhatjuk le az €, nyelvtant kiterjesztett szabályok- 
kal. Az NP és Pronoun kategóriák rendelkeznek egy olyan paraméterrel, amely leírja 
az esetüket. (A főnevek nem rendelkeznek esettel az angolban, bár sok más nyelvben 
igen.) Az 5-re vonatkozó szabályban az NP-nek alanyi esetűnek kell lennie, míg a VP 
és PP szabályokban tárgyasnak. Az NP szabály egy változót fogad paraméterként, az 
eset-et. A szándék az, hogy az NP tetszőleges esetű lehet, de ha átírjuk Pronoun-ra, 
akkor ugyanolyan esetűnek kell lennie. Egy változó ilyen használata — elkerülve a 
döntést, amikor a különbségtétel nem fontos — visszatartja a szabályhalmaz méretének 
a tulajdonságok számával arányosan exponenciális növekedését. 

A kiterjesztés ezen formalizmusát definit klóz nyelvtannak (definite clause grammar) 
vagy DCG-nek hívjuk, mivel minden nyelvtani szabály értelmezhető a Horn-logikában 
szereplő definit klózként.!" Elsőként azt mutatjuk meg, hogy egy normális, kiterjesztés 
nélküli szabály hogyan értelmezhető definit klózként. Minden kategóriajelet karakter- 
sorozatra vonatkozó predikátumnak tekintünk, így az NP(5) igaz, ha az s karaktersoro- 
zat egy NP-t formál. Az 


§- NPVP 
CFG-szabály a következő definit klóz rövidítése: 
NP(sp) A VP(s2) 5 §(sy - 52) 


Itt sj -- 52 két karaktersorozat összefűzését jelenti, így ez a szabály azt mondja, hogy 
ha van egy s4 füzér, ami egy NP és egy s2 füzér, ami egy VP, akkor az összekapcsolá- 
sukkal keletkező füzér egy S, ami pontosan megegyezik azzal, ahogy a CFG-szabályt 
korábban értelmeztük. Fontos észrevennünk, hogy a DCG-k lehetővé teszik számunkra, 
hogy az elemzésről mint logikai következtetésről beszéljünk. Ez lehetővé teszi, hogy 
nyelvek és karaktersorozatok felett sok különböző módon következtessünk. Például ez 
azt jelenti, hogy egy lentről felfelé elemzést előrefelé következtetéssel, egy fentről lefe- 
lé elemzést pedig hátrafelé következtetéssel végezhetünk el. Azt is látni fogjuk, hogy ez 
azt is jelenti, hogy ugyanazt a nyelvtant elemzésre és generálásra is használhatjuk. 

A DCG-megközelítés igazi haszna az, hogy kiterjeszthetjük a kategóriaszimbólumo- 
kat a karakterfüzéreken kívül további argumentumokkal. Például a 


NP(eset) — Pronoun(eset) 
szabály a következő definit klóz rövidítése: 
Pronourkeset, sp) 5 NP(eset, sp) 
10 gézze fel, hogy a definit klóz, amit ha implikációs formában írunk, pontosan egy atomot tartal- 


maz a következmény részében, és nulla vagy több atom konjunkcióját a feltétel részében. Két példa az 
AABA 5 C€, illetve önmagában a C. 
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Eszerint ha az s füzér az eset változó által meghatározott esetű Pronoun, akkor sz egy 
ugyanolyan esetű NP is. Általánosságban egy kategóriaszimbólumot tetszőleges számú 
argumentummal kiterjeszthetünk, és az argumentumok egyben paraméterek, amelyek a 
szokásos Hom-klóz következtetés egyesítésének tárgyai. 

Van ára is ennek a kényelemnek: a nyelvtan íróját ellátjuk a tételbizonyítók teljes ere- 
jével, így feladjuk a szintaktikai elemzők által garantált O(rr)-at; a kiterjesztésekkel ki- 
egészített elemzés lehet NP-teljes, vagy akár eldönthetetlen, a kiterjesztésektől függően. 

Néhány további trükk szükséges ahhoz, hogy a DOG működjön; például szükségünk van 
egy módszerre, hogy záró szimbólumokat adhassunk meg, és kényelmes egy olyan mód- 
szert is alkalmaznunk, amely nem engedi az automatikus karaktersorozat-argumentum hoz- 
záadását. Mindent összerakva, a definit klóz nyelvtant a következőképpen definiálhatjuk: 


. AzXGYZ... jelölés fordítása Y(sp) A Z(52) A ... 2 X(sp.4 524...) 

s AZXGYIZI... jelölés fordítása Y(5) V Z(5) V ... 5 X(5) 

s Mindkét megelőző szabályban bármelyik Y nem záró szimbólum egy vagy több 
argumentummal kiterjeszthető. Bármely argumentum lehet változó, konstans vagy 
argumentumok függvénye. A fordításban ezen argumentumok megelőzik a karakter- 
füzér argumentumot (például az NP(eset) fordítása NP(eset, 51)). 

s A (Pxt...)) jelölés szerepelhet egy szabály jobb oldalán, és változás nélkül átalakul 
P(...)-vé. Ez lehetővé teszi a nyelvtan írója számára, hogy egy PK(...)-re vonatkozó 
tesztet anélkül elhelyezzen, hogy ahhoz automatikusan hozzáadódjon a karakterfüzér- 
argumentum. 

§ AzX word jelölés fordítása X([word)]). 


Az alany—ige egyeztetése szintén kezelhető kiterjesztéssel, de ezt a 22.2. feladatra halaszt- 
juk. Helyette egy nehezebb problémával foglalkozunk: az igék alkategóriákba osztásával. 


Igék alkategóriákba osztása 


Az €/ nyelv fejlettebb az £9-hoz képest, de még ez is túlgenerál. Az egyik probléma 
abban a módban rejlik, ahogy az igei kifejezéseket összefűzi. El akarjuk fogadni a , give 
me the gold" és a , go to 1,2" jellegű igés kifejezéseket. Ezek mindegyike létezik az 
€)-ben, de sajnos éppígy létezik a , go me the gold" és a , give to 1,2" is. Az €, nyelv 
megszünteti ezeket a VP-ket úgy, hogy egyértelműen megadja, melyik igét melyik kife- 
jezés követheti. Ezt az igék alkategória (subcategorization) listájának hívjuk. Az el- 
képzelés az, hogy a Verb kategóriát alkategóriákra bontjuk — egy a tárggyal nem ren- 
delkezők igék számára, egy az egyetlen tárggyal rendelkezőkre és így tovább. 

Az ötlet megvalósításához minden egyes igéhez rendelünk egy alkategória-listát (sub- 
categorization list), amely a kiegészítőit (complements) tartalmazza. A kiegészítő olyan 
kötelező kifejezés, amely az igei kifejezésen belül követi az igét. Azaz a , give the gold to 
me"-ben az NP a , the gold" és a ,to me" PP a , give" kiegészítője. ! Ezt leírhatjuk így: 


Verb(INP, PPI) — give hand ) ... 
11 Ez a kiegészítő (complement) egyik definíciója, de vannak más terminológiát használó szerzők is. 


Egyesek szerint az íge alanya is egy kiegészítő. Mások szerint csak az elöljárói kifejezés kiegészítő, és a 
főnévi kifejezést egy érvelésnek (argument) kell hívni. 
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Lehetséges, hogy egy igéhez több, különböző alkategóriára bontás létezik, csakúgy, 
mint ahogy egy szó számára is lehetséges, hogy több, különböző kategóriába tartozzon. 
Valójában a , give" rendelkezik az (NP, NPJ alkategória-listával is, mint a , Give me the 
gold" mondatban. Ezt ugyanúgy kezelhetjük, mint minden más többértelműséget. A 22.12. 
ábra ad pár példát igékre és alkategória-listáikra (angolul röviden subcat). 





























Ige Alkategóriák Példa igei kifejezés 

give (WP, PP) give the gold in 3 3 to me 
(NP, NPI give me the gold 

smell (WP) smell a wumpus 
IAdjective) smell awful 
(PP) smell like a wumpus 

is [Adjective] is smelly 
IPPJ isin22 
INPI is a pit 

died a died 

believe CS] believe the wumpus is dead 








22.12. ábra. Példák igékre az alkategória-listáikkal együtt 


Három dolgot teszünk az igei alkategóriák nyelvtanba illesztéséhez. Az első lépés 
a VP kategória kiterjesztése egy alkategória-argumentummal, VP(subcar), amely felso- 
rolja azokat a komponenseket, amikkel teljes VP formálható. Például a , give" teljes 
VP-vé tehető [NP, PP) hozzáadásával, , give the gold" teljessé tehető (PP] hozzáadásá- 
val, és a , give the gold to me" már teljes; alkategória-listája üres, []. Ez a következő 
szabályokat adja VP-re: 


VP(subcat) c VerlXsubcat) 
! VP(subcat -- (NPJ) NP(Objective) 
l VP(subcat -- [Adjective]) Adjective 
I VP(subcat 3- (PPJ) PP. 


Az utolsó sor így olvasható: , Adott subcat alkategória-listával rendelkező VP formál- 
ható egy beágyazott VP-ből, amit egy PP követ, akkor, ha a beágyazott VP rendelkezik 
egy olyan alkategória-listával, ami a subcat lista elemeivel kezdődik és PP-vel folyta- 
tódik." Például egy VP((D)-t egy VP((PP)) és az azt követő PP alkot. Az első sor szerint 
egy VP, amely subcat alkategória-listával rendelkezik, formálható egy ugyanolyan 
alkategória-listával rendelkező Verb segítségével. Például a VP(INPJ) létrehozható egy 
VerbXINPJ) által. Egy példa ilyen igére a , grab", tehát a grab the gold" egy VP(IJ). 

A második lépés az §-re vonatkozó szabály megváltoztatása úgy, hogy szükségessé 
tegyen egy igei kifejezést, melynek összes kiegészítése megvan, és így (] alkategória- 
listája van. Ez azt jelenti, hogy az , 1 grab the gold" érvényes mondat, de a , You give" 
nem az. Az új szabály, 


§ — NP(Subjective) VP([I) 
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VPCD 


NP VPCINPD 


e 


VPCINPNPD NP NP 


I b. ZS 


Pronoun VertXINP.NPI)  Pronoun Article Noun 


You give me the gold 


22.13. ábra. A , You gíve me the gold (Ideadod nekem az aranyat)" elemzési fája, amely bemutatja az 
ige és az igei kifejezés alkategóriáit 


a következőképpen olvasható: , Egy mondatot összeállíthatunk egy alanyi esetben álló 
NP-ből és az azt követő, üres alkategória-listájú VP-ből." A 22.13. ábra bemutat egy 
elemzési fát, amelyik ezt a nyelvtant használja. 

A harmadik lépésben gondolunk arra, hogy a kiegészítések mellett az igei (és egyéb) 
kifejezések segédszavakat (adjuncts) is kaphatnak, melyek nem egy igéhez kötődő 
kifejezések, hanem mindenféle igei kifejezésben feltűnhetnek. Az időt és helyet jelké- 
pező kifejezések segédszavak, mivel szinte minden cselekvés vagy esemény rendelkez- 
het időponttal és helyszínnel. Például a , now" határozószó az ,,I smell a wumpus now" 
mondatban és az , on Tuesday" PP a , give me the gold on Tuesday"-ban segédszavak. 
Íme, két szabály a segédszavak megengedéséhez: 


VP(subca) c VP(subcat) PP. 
! VP(subcat) Adverb 


Kiterjesztett nyelvtanok generálóképessége 


Minden kiterjesztett szabály egy szabályséma (rule schema), mely a szabályok egy 
olyan halmazát jelenti, amit a kiterjesztett alkotórészek értékeinek minden lehetséges 
kombinációjával állítunk elő. A kiterjesztett nyelvtanok generálóképessége a kombiná- 
ciók számától függ. Ha véges számú van, akkor a kiterjesztett nyelvtan ekvivalens egy 
környezetfüggetlen nyelvtannal: a szabályséma felcserélhető egyedi környezetfügget- 
len szabályokkal. Azonban ha végtelen számú van, akkor a kiterjesztett nyelvtanok nem 
környezetfüggetlen nyelveket is leírhatnak. Például az dt"c" környezetfüggő nyelv 
leírható a következő kiterjesztett nyelvtannal: 
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$(n) — A(n) Brn) Cín) 

AD—ca — A(ntD aA 
BI-—b — Bín4DobBín) 
C)-c  Cn41DcC(n) 


22.5. SZEMANTIKAI ÉRTELMEZÉS 


Eddig csak a nyelv szintaktikai analízisét vizsgáltuk. Ebben a fejezetben rátérünk a sze- 
mantikára (semantics) — a megnyilatkozás (utterance) jelentésének kinyerésére. Ebben 
a fejezetben az elsőrendű logikát használjuk reprezentációs nyelvként, így a szemantikai 
értelmezés egy FOL kifejezés és egy nyelvi kifejezés összerendelésének a folyamata. In- 
tuitív módon közelítve, a , the wumpus" kifejezés jelentése az a nagy, szőrös szörnyeteg, 
amit a logikában a Wwwnpusy logikai kifejezéssel jelzünk, és a , the wumpus is dead" 
jelentése a Dead(Wumpus1) logikai állítás. Ez a fejezet ezt az intuíciót pontosítja. Egy 
egyszerű példával kezdünk: a négyzetháló helyszíneit leíró szabállyal: 


NP — Digit Digit 


Kiterjesztjük a szabályt úgy, hogy minden összetevőhöz egy argumentumot illesztünk, 
amely az összetevő szemantikáját reprezentálja. A következőt kapjuk: 


NP((x, y]) — Digit(a9 Digitty) 


E szerint egy karaktersorozat, amely egy x szemantikájú számjegyből és egy azt köve- 
tő y szemantikájú számjegyből áll, egy [x, y] szemantikával rendelkező NP-t formál, 
amely a háló egy négyzetére alkalmazott jelölésünk. 

Vegyük észre, hogy a teljes NP szemantikája nagymértékben az összetevőinek sze- 
mantikáján alapszik. Már láttuk a kompozíciós szemantika (compositional semantics) 
ezen ötletét korábban: a logikában a P A 0 jelentését P, 0 és A határozzák meg; az arit- 
metikában az x - y jelentését x, y és a -- határozzák meg. A 22.14. ábra megmutatja, 
hogy a DCG jelölésrendszer hogyan használható egy aritmetikai kifejezéseket leíró 
nyelvtan szemantikával történő kiterjesztésére, és a 22.15. ábra mutatja a 3 -k (4 —- 2) 
ezen nyelvtan alapján kapott elemzési fáját. Az elemzési fa gyökere Exp(5), egy kifeje- 
zés, melynek szemantikai értelmezése 5. 





Exp(x) — Exp(xw) Operatortop) Exp(x2) (x — Apply(op, xy, x2)h 
Exp(x) — (Exp(x) 

Exp(x) - Number(i) 

Numbertx) — Digit(x) 

Number(x) — Numbertx) Digix;) (x— 10 x xy -k x2) 
Digi(9y ma x(0£xc9 

Operatortx) vm x (x E (t.— 2, xj) 








22.14. ábra. Szemantikával kibővített nyelvtan az aritmetikai kifejezésekre. Minden x; változó egy ösz- 
szetevő szemantikáját reprezentálja. Vegye észre, hogy a (teszt) jelölést használjuk olyan logikai predi- 
kátumok definiálására, amelyeket ki kell elégíteni, de nem összetevők! 
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Ep) 








Exp(3) ExpO) 


Number(3) 


Digit(3) — Operator(a) ] Digi4) Operatort:) Digit(2) 


3 4 ( 4 4 2 ) 
22.45. ábra. A ,3 - (4 — 29 füzér elemzési fája szemantikai értelmezésekkel 


Number(2) 


Az angol nyelv egy részletének szemantikája 


Most már készen állunk arra, hogy az angol nyelv egy kis részhalmazára megírjuk 
a szemantikai kibővítést. Első lépésként azzal kezdünk, hogy melyik kifejezéshez mi- 
lyen szemantikai értelmezéseket akarunk rendelni. A , John loves Mary" egyszerű mon- 
datot fogjuk vizsgálni. A , John" NP szemantikus értelmezése a John logikai term kell 
legyen, és a mondatnak, mint egésznek, a Loves(John, Mary) logikai állítás kell a sze- 
mantikai értelmezése legyen. Ennyi világosnak látszik. A bonyolultabb rész a , loves 
Mary" VP. Ezen kifejezés szemantikai értelmezése se nem logikai term, se nem teljes 
logikai mondat. Intuitív módon kezelhetjük úgy, hogy a , loves Mary" egy leírás, ami 
lehet, hogy egy adott személyre vonatkozik, de lehet, hogy nem. (Jelen esetben Johnra 
vonatkozik.) Ez azt jelenti, hogy a , loves Mary" egy predikátum (predicate), amit ha 
egy személyt reprezentáló termmel kombinálunk (a személy, aki szeret), akkor egy 
teljes logikai mondatot állít elő. A A jelölésrendszert használva (lásd 7.2. alfejezet) a 
sloves Mary"-t a következő predikátumként reprezentálhatjuk: 


Ax Lovesíx, Mary) 


Ezután szükségünk van egy szabályra, amely szerint , egy obj szemantikájú NP, melyet 
egy rel szemantikájú VP követ, együtt egy olyan mondatot eredményez, amelynek sze- 
mantikája a rel alkalmazása az obj-ra: 


S(rel(obj)) — NP(obj) VP(rel) 

A szabály szerint a , John loves Mary" szemantikai értelmezése 
(Ax Lovesíx, Mary) (John) 

ami megfelel a Loves(John, Mary)-nek. 
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S(rel(obj)) — NP(obj) VP(rel) 
VP(rekobj)) — Vertírel) NP(obj) 
NP(obj) 2 Name(obj) 


Name(John) — John 
Name(Mary) — Mary 
Verb(Ay Ax Loves(x, y)) — loves 











22.16. ábra. Egy nyelvtan, amely képes egy elemzési fa és szemantikai értelmezés levezetésére a , John 
toves Mary" (és három másik) mondat számára 


S(Loves(John Mary)) 


VPOx Lovestx,Mary)) 
NP(John) NP(tary) 


Name(John) VerbíXy Ax Loves(x,y))  NametMary) 


John loves Mary 
22.17. ábra. A , John loves Mary" füzér elemzési fája szemantikai értelmezésekkel 


A szemantika hátralevő része az eddigi választásainkból egyenesen következik. Mi- 
vel a VP-ket predikátumként reprezentáljuk, jó ötlet konzisztens módon az igéket is 
predikátumként ábrázolni. A , loves" ige reprezentációja Ay Ax Loves(x, y) predikátum, 
ami például egy Mary argumentum esetén Ax Loves(x, Mary) predikátummal tér vissza. 

A VP — Verb NP szabály alkalmazza az ige szemantikai értelmezéséből kapott pre- 
dikátumot az NP (szemantikai) értelmezéséből kapott objektumra a teljes VP szemanti- 
kai értelmezésének kinyerésére. Végül a 22.16. ábrán látható nyelvtant és a 22.17. ábrán 
található elemzési fát kapjuk. 


Idő és igeidő 


Most tegyük fel, hogy a , John loves Mary" és a , John loved Mary" közötti különbsé- 
get szeretnénk reprezentálni. Az angol időket (past [múlt], present (jelen] és future 
(jövől) használ egy esemény relatív idejének jelzésére. Egy jó választás az események 
idejének reprezentálására a 10.3. alfejezet eseménykalkulus jelölésrendszere. Az ese- 
ménykalkulussal a két mondatunk a következőképpen értelmezhető: 


e € Loves(John, Mary) A During(Now, e) 
e € LovesíJohn, Mary) A After(Now, e) 
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Eszerint a , loves" és , loved" szavakra vonatkozó két lexikai szabályunk a következő 
lehet: 


VerbíAy Ax e € LovesíJohn, Mary) A During(Now, e)) — loves 
Verb(Ay Ax e € Loves(x, y) A After(Now, e)) — loved 


E változástól eltekintve a nyelvtannal kapcsolatban minden más változatlan marad, ami 
ösztönző hír; azt sugallja, hogy helyes úton járunk, ha ilyen könnyedén bonyolíthatjuk 
például az igeidővel (bár csak érintettük az időre és igeidőre vonatkozó teljes nyelvtan 
felszínét). E bemelegítésként elért sikerrel készen állunk egy sokkal nehezebb reprezen- 
tációs probléma kezelésére. 


Kvantifikálás 


Nézzük a következő példát: , Every agent smells a wumpus." A mondat valójában több- 
értelmű: a javasolt értelmezés szerint az ágensek különböző wumpusokat észlelhetnek, 
de egy alternatív jelentés szerint csak egy wumpus van, akit mindenki érez.!? A két in- 
terpretációt a következő módon ábrázolhatjuk: 


Va a € Agents 5 ]w w € Wumpuses A Je e € Smelka, w) A During(Now, e) 
I3w w € Wumpuses Va a € Agents — Je e € Smellla, w) A During(Now, e) 


A többértelműség problémáját elhalasztjuk későbbre, most csak az első értelmezést 
vizsgáljuk. Megpróbáljuk az összetevői szerint elemezni, NP és VP komponensekre 
bontva: 


Everyagent  NP(Va a € Agents 5 P) 
smells a  wumpus  VP(Aw w € Wumpuses A Je (e € Smell(a, w) A During(Now, e)) 


Máris két nehézség támadt. Először is, a teljes mondat szemantikája, úgy tűnik, meg- 
egyezik az NP szemantikájával, melyben a VP tölti ki a P rész szemantikáját. Ez azt jelen- 
ti, hogy a mondat szemantikáját nem formálhatjuk rel(obj) segítségével. Megtehetjük 
obj(rel) által, ami (legalábbis első ránézésre) kicsit különösnek tűnik. A második problé- 
ma az, hogy az a változót a Smell reláció argumentumaként kell megkapnunk. Más sza- 
vakkal, a mondat szemantikája a VP szemantikájának megfelelő NP argumentumrekeszbe 
való illesztésével adódik, miközben az NP-ben található a változót is betesszük a VP 
szemantika megfelelő argumentumrekeszébe. Úgy tűnik, mintha két funkcionális kom- 
pozíciónk lenne, és ez azt sugallja, hogy meglehetősen könnyű lesz összezavarodni. 
A bonyolultság abból a tényből ered, hogy a szemantikai struktúra nagyon különböző 
a szintaktikaitól. 

Hogy elkerüljék ezt a zűrzavart, sok modern nyelvtan más módszert választ. Defi- 
niálnak egy közbülső formát (intermediate form) a szintaxis és a szemantika közötti 
közvetítésre. A közbülső formának két kulcstulajdonsága van. Egyrészt strukturálisan 
hasonló a mondat szintaxisához, így könnyen előállítható kompozíciós eszközökkel. 
Másrészt elég információt tartalmaz, és így lefordítható egy reguláris elsőrendű logikai 





12 Ha ez az értelmezés valószínűtlennek tűnik, akkor vizsgálja meg az , Every Protestant believes in 
a just God" mondatot. 
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mondattá. Mivel a szintaktikai és a logikai alak között helyezkedik el, néha kvázilogi- 
kai formának (guasi-logical form)? nevezik. A fejezetben egy kvázilogikai formát 
használunk, mely a teljes elsőrendű logikát tartalmazza, lambdakifejezéssekkel és egy 
új konstrukcióval kiegészítve, amit kvantifikált termnek (guantified term) nevezünk. 
Az , every agent" szemantikai értelmezését jelentő kvantifikált term a következőképpen 
írható: 

(Va a € Agents] 


Ez olyan, mint egy logikai mondat, de ugyanolyan módon használjuk, mint a logikai 
termeket. Az , Every agent smells a wumpus" kvázilogikai értelmezése: 


3e (e € Smelkfva a € Agents], [3w w € Wumpuses)]) A During(Now, e)) 


A kvázilogikai alak generálásához szabályaink közül sok változatlan marad. Az 5-re 
vonatkozó szabály S szemantikáját még mindig rel(obj) segítségével adja meg. Bizo- 
nyos szabályok változnak; az , a" szóra vonatkozó lexikai szabály a következő: 


Article(1) — a 
míg a névelő és főnév kombinációjának szabálya: 
NP(Ig x semx))) — Article(g) Nour(sem) 


E szerint az NP szemantikája egy kvantifikált term — ahol a kvantifikálást a névelő 
határozza meg - egy új x változóval és egy propozícióval, amely a főnév szemanti- 
káját az x változóra alkalmazza. Az NP-re vonatkozó további szabályok hasonlók. 
A 22.18. ábra mutatja be a szemantikai típusokat, és példát ad minden egyes szintak- 
tikai kategóriára a kvázilogikai ábrázolás szerint. A 22.19. ábra az , Every agent 
smells a wumpus"? e megközelítés szerinti elemzését mutatja, a 22.20. pedig a teljes 
nyelvtant. 

Ezek után át kell alakítanunk a kvázilogikai formát valódi elsőrendű logikaivá a 
kvantifikált termek igazi term-mé alakításával. Ezt egy egyszerű szabállyal tesszük 
meg: minden egyes OLF kvázilogika formán belüli (g x P(x)1 kvantifikált termet a cse- 
réljük ki x-re, és cseréljük a OLF-et g x P(x) op OLF formára, ahol az op operátor 
— akkor, ha a g V, és A, amennyiben a g 3 vagy 3!. Például az , Every dog has a day 
(Minden kutyának van egy napja)" mondat a következő kvázilogikai formával rendel- 
kezik: 


3e(e€ Has((vd d € Dogsl, [3a a € Days1, Now)) 


Nem specifikáltuk, hogy a két kvantifikált term melyikét kell elsőként elővenni, így 
valójában két lehetséges értelmezés van: 


Vvd d € Dogs 5. Ja a € Days A 3e e € Has(d, a, Now) 
3a a € Days A Vd d € Dogs 5. 3e e € Hasíd, a, Now) 


13 Egyes kvázilogikai formákra jellemző az is, hogy olyan többértelműségek tömör kifejezésére is al- 
kalmasak, amelyeket logikai formában csak hosszú diszjunkciók segítségével lehetne kifejezni. 
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Kategória Típus Példa Kvázilogikai alak 
§ Sentence T sleep. 3e e € Sleep(Speaker) A During(Now, e) 
NP object adog (d Dogtd) 
PP object? — sentence ] in(2 2 Ax Int, [2.20 
RelClause object — sentence — ] thatsccs me ! Ax 3ee € Sees(x, Speaker) 
A During(Now, e) 
VP objecf" — sentence — ] sees me Ax Je e € Sees(x, Speaker) 
A During(Now, e) 
Adjective object — sentence] smelly Ax Smelly(x) 
Adverb event — sentence today Ae Duringte, Today) 
Articte guantifier the 3 
Conjunction ! sentence? — sentence [and Ap.9(pNg) 
Digit object 7 7 
Noun object — sentence Wwumpus Ax x € Wumpuses 
Preposition objec? — sentence [in Ax Aylnty) 
Pronoun object I Speaker 
Verb objecf — sentence] cats Ay Ax 3e e € Eatsíx, y) A During(Now, e) 








22.18. ábra. Minden szintaktikai kategória kvázilogikai formájú kifejezésének típusát mutató tábla, 
A t — r jelölés egy függvényt takar, amely egy f típusú argumentumot fogad, és r típusú eredménnyel tér 


vissza. Például a Preposition szemantikai típusa objec 


— sentence, ami azt jelenti, hogy az elöljárószó 


szemantikája egy függvény, amelyet ha két logikai objektumra alkalmazunk, akkor egy logikai monda- 


tot eredményez. 


S(e e € Smelk(Va Agent(a)], [3w Wumpus(w)) 





NPXIva Agenka) b) 


A During(Now,e) 


VP(Ax 3e e € Smelk(Vva Agent(a)), (3w Wumpus(w))) 


A During(Now,e) 


NPIJ3w Wumpus(w))) 


Verb(2y Ax 3e e E Smellxy) 


Article) Noun(Ageni) 


Every agent 





smelis 


A During(Now,e) 


Articte(13) Noun(Wumpus) 


a wumpus 


22.19. ábra. Az , Every agent smells a wumpus" mondat elemzési fája, amely mind a szintaktikai strak- 
túrát, mind a szemantikai értelmezéseket mutatja 
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S(relobj)) — NP(obj) VP(rel) 
S(conjsem, sem2)) — S(senr) Conjunctiontconj) S(lsemm) 


NP(sem) — Pronour(sem) 

NP(sem) — Nametsem) 

NP(Ig x sem) — Artictelg) Noun(sem) 

NP(Ig x obj A reltxyh) — NP(Ig x objl) PPtreh) 

NP((g x obj A relax) — NPUg x obj]) RelClauselrel) 
NPtlsem, semo)) — Digit(semy) Digitsem2) 


VP(sem) — Verb(sem) 
VPtreltobj)) — VP(rel NP(obj) 

VP(semj (sem))) — VPisemi) Adjectivetsem?) 
VpP(sem; (sem) — VPlsem) PP(sem) 
RelClauselsem) — that VP(sem) 


PPOx reltx, obj)) — Preposition(rel) NP(obj) 











22.20. ábra. Szemantikával ellátott nyelvtan kvázilogikai formában 


Az első szerint minden kutyának megvan a maga napja, míg a második szerint van egy 
különleges nap, ami minden kutyára ugyanaz. A kettő közötti választás a többértelműség 
feloldásának feladata. A kvantifikált termek balról jobbra sorrendje gyakran illeszkedik 
a kvantifikálók balról jobbra sorrendjére, de más tényezők is számítanak. A kvázilogikai 
alak előnye az, hogy tömören reprezentálja az összes lehetőséget. A hátránya pedig az, 
hogy nem segíti a választást közöttük; amihez szükségünk van a többértelműség felol- 
dásának teljes erejére az összes tényt felhasználva. 


Pragmatikus értelmezés 


Megmutattuk, hogy egy ágens hogyan képes észlelni egy szófüzért, és hogyan képes 
egy nyelvtant használni a lehetséges szemantikai értelmezések halmazának előállításá- 
ra. Most annak a problémáját vizsgáljuk, hogy az értelmezés hogyan tehető teljessé az 
egyes jelöltek értelmezéshez az adott szituációt leíró kontextusfüggő információk hoz- 
záadásával. 

A gyakorlati információra legnyilvánvalóbban a referenciális indexek (indexicals) 
feloldásához van szükség, amelyek közvetlenül az adott szituációra utaló kifejezések. 
Például az , I am in Boston today (Ma Bostonban vagyok)" mondatban az ,,[" és , today" 
referenciális indexek értelmezése attól függ, hogy ki és mikor ejtette ki a mondatot. A ref- 
erenciális indexeket , konstansokkal" (mint például a Speaker) reprezentáljuk, amelyek 
valójában változó dolgok (fluents) — azaz a szituációtól függnek. A hallgatónak, aki 
észleli a szólásaktust, azt is észlelnie kell, hogy ki a beszélő, és felhasználja ezt az infor- 
mációt a referenciális indexek feloldására. Például a hallgató tudhatja, hogy T((Speaker 
— Agentp), Now). 
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Egy felszólítás, mint például a ,.go to 2, 2" implicit módon a hallgatóra vonatkozik. 
Eddig az S nyelvtanunk csak deklaratív mondatokat írt le. Könnyen kiterjeszthetjük fel- 
szólítások kezelésére." 

A felszólítást olyan VP segítségével formálhatjuk, ahol az alany implicit módon a 
hallgató. Meg kell különböztetnünk a felszólításokat az állításoktól, ezért megváltoztat- 
juk az §-re vonatkozó szabályokat a szólásaktus típusának beillesztésével a kvázilogi- 
kai formába: 


S(Statementi( Speaker, rel(obj))) — NP(obj) VP(rel) 
S(CommandíSpeaker, rekHearer))) — VP(re) 


Így a ..go to 2, 2" kvázilogikai alakja:!5 
Command(3e e € Go(Hearer, (2, 20) 


Nyelv generálása DCG-kkel 


Eddig egy nyelv elemzésével foglalkoztunk, nem a generálásával. A generálás hason- 
lóan gazdag téma. A megfelelő megnyilatkozás kiválasztása egy állítás kifejezésére sok 
hasonló választást von maga után, mint egy megnyilatkozás elemzése. 

Emlékezzünk vissza, hogy a DCG egy logikai programozási rendszer, amely kénysze- 
reket határoz meg egy karaktersorozat és annak elemzése között. Tudjuk, hogy az Append 
predikátum logikai programozási definíciója felhasználható annak közlésére is, hogy az 
Append(1, 2], (3], x) esetében x — (1, 2, 3], és arra is, hogy felsoroljuk azon x és y értéke- 
ket, melyek az Append(x, y, [1, 2. 3]) kifejezést igazzá teszik. Hasonlóképpen írhatunk egy 
definíciót 5-re, amely kétféleképpen használható: az elemzéshez megkérdezzük, hogy 
S(sem, [John, Loves, Mary]), és azt kapjuk vissza, hogy sem — Loves(John, Mary); a ge- 
neráláshoz azt kérdezzük, hogy S(Loves(John, Mary), words), és azt kapjuk vissza, hogy 
words — [John, Loves, Mary]. Tesztelhetünk egy nyelvtant az S(sem, words) kérdéssel, 
visszakapva azokat a [sem, words) párok sorozatát válaszként, melyeket a nyelvtan generált. 

Ez a módszer a fejezetben bemutatott egyszerű nyelvtanokra működik, de nagyobb 
nyelvtanokra történő felskálázás során lehetnek problémák. A logikai következtető gép 
által használt keresési stratégia nagyon fontos; a mélységi keresési stratégiák végtelen 
ciklusokhoz vezethetnek. Figyelmet kell fordítani a szemantikai alak pontos részleteire is. 


M Egy teljes kommunikáló ágens megvalósításához szükségünk lenne a kérdések nyelvtanára is. 
A kérdések kezelése kívül esik e könyv területén, mivel összetevők közötti hosszú távú függőségeket 
(long-distance dependecies) vonzanak magukkal. Például a , Whom did the agent tell you to give the 
gold 109" mondatban a záró , to" elemzésének hiányzó NP-jű PP-nek kell lennie; a hiányzó NP-t a mondat 
első szava, a , who" helyettesíti, Kiterjesztések egy komplex rendszere biztosítja, hogy a hiányzó NP-k 
összeillesztődjenek a helyettesítő szavakkal. 
Vegyük észre, hogy egy felszólítás kvázilogikai formája nem foglalja magában az esemény idejét 
(azaz a During(Now, e)-t)! Ez azért van, mert a , go" valójában a szó igeidő nélküli változata, nem a jelen 
idejű. Nem lehet megállapítani a különbséget a , g0" esetében, de figyelje meg a , Be good!" felszólítás 
helyes alakját (a ,be" igeidő nélküli alakját használva), amely nem , Are good!". Annak biztosítására, 
hogy a helyes igeidőt használjuk, kiegészíthetnénk a VP-ket egy igeidő kiterjesztéssel, és a felszólítások 
szabályának jobb oldalára ezt írhatnánk: V.P(rel, untensed). 
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Előfordulhat, hogy egy adott nyelvtan nem tudja kifejezni az X A F logikai alakot az 
X és Y bizonyos értékeire, de ki tudja fejezni Y A X-et; ez azt sugallja, hogy szükségünk 
lesz valamilyen módszerre a szemantikai alakok kanonizálására, vagy ki kell terjeszte- 
nünk az egyesítő eljárást úgy, hogy az X A Y és az F A X egyesíthető legyen. 

Komolyabb generálási feladatok bonyolultabb modelleket használnak, melyek kü- 
lönböznek az elemzés nyelvtanától, és pontosabban szabályozzák, hogy a szemantikai 
komponenseket pontosan hogyan fejezzük ki. A szisztematikus nyelvtan egy olyan 
megközelítés, amely könnyűvé teszi, hogy a szemantikai alak legfontosabb részeire 
nagyobb hangsúlyt helyezzünk. 


22.6. TÖBBÉRTELMŰSÉG ÉS FELOLDÁSA 


Bizonyos esetekben a hallgatók tudatában vannak egy megnyilatkozás többértelműsé- 
gének. Íme, néhány példa a napilapok szalagcímeiből: 


Sguad heips dog bite victim. 

Helicopter powered by human flies. 

Once-sagging cloth diaper industry saved by full dumps. 
Portable toilet bombed; police have nothing to go on. 
British left waffles on Falkland Islands. 

Teacher strikes idle kids. 

Milk drinkers are turning to powder. 

Drunk gets nine months in violin case. 


(A mondatok fordítását és értelmezését az olvasóra hagyjuk — a ford.) 

Azonban legtöbb esetben a beszéd, amit hallunk, egyértelműnek tűnik. Ezért amikor a 
kutatók először kezdtek a nyelv elemzésére számítógépeket használni a hatvanas évek- 
ben, igen meglepődve tapasztalták, hogy majdnem minden megnyilatkozás erősen 
többértelmű, bár az alternatív értelmezések egy anyanyelvi beszélő számára lehet, 
hogy nem nyilvánvalók. Egy nagy nyelvtannal és szókinccsel rendelkező rendszer ér- 
telmezések ezreit találhatja egy teljesen átlagos mondatra. Vegyük például a ,,The 
batter hit the ball" mondatot, amelynek látszólag egy egyértelmű értelmezése van, 
miszerint a baseballjátékos megüt egy baseball-labdát. De különböző értelmezést 
kapunk, ha az ezt megelőző mondat ez: ,The mad scientist unleashed a tidal wave of 
cake mix towards the ballroom." Ez a példa a lexikális többértelműségen (lexical 
ambiguity) alapszik, amikor egy szónak egynél több jelentése van. A lexikális több- 
értelműség igen gyakori: a , back" lehet határozószó (go back), melléknév (back door), 
főnév (the back of the room) és ige (back up your files). A , Jack" lehet név, főnév 
(kártya, hatszögű fém játékdarab, hajózási zászló, hal, hím szamár, dugasz vagy nehéz 
objektumok emelésére szolgáló eszköz), illetve lehet ige (felemelni egy autót, fénnyel 
vadászni vagy erősen megütni a baseball-labdát). 

A szintaktikai többértelműség (syntactic ambiguity) (avagy strukturális több- 
értelműség (structural ambiguity)) a lexikális többértelműséggel együtt vagy nélkü- 
le is előfordulhat. Például az ,.I smelled a wumpus in 2,2" füzérnek két értelmezése 
lehet: az egyikben az , in 2,2" prepozíciós kifejezés a főnevet módosítja, a másikban 


az igét. A szintaktikai többértelműség szemantikai többértelműséghez (semantic 
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ambiguíty) vezet, mivel az egyik értelmezés szerint a wumpus a 2,2-n van, a másik 
szerint a szaga van a 2,2-n. Ebben az esetben a rossz értelmezés halálos tévedés lehet. 

A szemantikai többértelműség még olyan kifejezésekben is feltűnhet, ahol nincs lexi- 
kális vagy szintaktikai többértelműség. Például a , cat person" főnévi kifejezés takarhat 
olyasvalakit, aki szereti a macskaféléket, vagy az Attack of the Cat People (A macska- 
emberek támadása) c. film szalagcímét is. Egy , coast road" lehet olyan út, ami a part- 
vonalat követi, és olyan, amelyik a partra vezet. 

Végezetül lehet többértelműség a szó szerinti és az átvitt értelmű jelentések között. 
A jelképes beszéd fontos a költészetben, de meglepően gyakori a mindennapi beszédben 
is. A metonímia (metonymy) egy olyan jelképes beszéd, amikor az egyik objektum 
helyére egy másikat állítunk. Amikor azt halljuk, hogy , Chrysler announced a new 
model", nem értelmezzük akként, hogy a cégek beszélni tudnak; inkább azt értjük ez- 
alatt, hogy a céget képviselő szóvivő tette a bejelentést. A metonímia gyakori, és az em- 
beri hallgatók gyakran észrevétlenül interpretálják. Sajnálatos módon a nyelvtanunk abban 
a formában, ahogy leírtuk, nem ennyire rugalmas. Ahhoz, hogy a metonímia szemantiká- 
ját megfelelően kezelni tudjuk, a többértelműség teljesen új szintjét kell bevezetnünk. Ezt 
úgy tesszük meg, hogy két objektumot használunk a mondat minden kifejezésének sze- 
mantikai értelmezésénél: egyet arra az objektumra, amelyre a kifejezés szó szerint vonat- 
kozik (Chrysler), míg egy másikkal utalunk a fogalomcserére (szóvivő). Ezek után meg 
kell mondanunk, hogy összefüggés van a kettő között. Jelenlegi nyelvtanunkban a 
Chrysler announced" értelmezése a következő: 


3xe x— Chrysler A e E Announce(x) A Afier(Now, e) 
Ezt a következőre kell megváltoztatnunk: 

Am, x,e x 7 Chrysler N e E Announce(lm) A Afier(Now, e) A Metonymy(m, x) 
E szerint van egy olyan x entitás, amely azonos a Chryslerrel, és van egy másik m enti- 
tás, amelyik a bejelentést tette, és a kettő metonímiai relációban áll egymással. A követke- 
ző lépés annak meghatározása, hogy milyen metonímiarelációk fordulhatnak elő. A leg- 


egyszerűbb eset az, amikor nincs semmilyen metonímia — az x szó szerinti objektum és az 
m metonímiai objektum azonos: 


Vm,x (m — x) 5 Metonymyím, x) 
A Chrysler példánál helyénvaló általánosítás az, hogy egy vállalat állhat a szóvivője helyén: 


Vin, x x E Organizations A Spokespersorím, x) — Metonymyím, x) 


További fogalomcserék lehetnek a szerző a munkákra (I read Shakespeare), vagy álta- 
lában a létrehozó az alkotásra (I drive a Honda) és a rész az egészre (The Red Sox need 
a strong arm). A metonímia egyes példái, mint a , The ham sandwich on Table 4 wants 
another beer" újszerűbbek, és az adott szituációnak megfelelően értelmezik őket. 

Az itt vázolt szabályok lehetővé teszik a számunkra, hogy a , Chrysler announced a 
new model" mondat magyarázatát elkészítsük, de a magyarázat nem logikai következ- 
tetés útján jön létre. Valószínűségi vagy nemmonoton következtetést kell használnunk 
ahhoz, hogy magyarázatjelöltekkel álljunk elő. 

Egy metafora (metaphor) olyan jelképes beszéd, amikor egy adott szó szerinti 
jelentéssel bíró kifejezést használunk egy másik jelentés sugalmazására analógia segít- 
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ségével. A legtöbb ember úgy gondol a metaforára, mint a költők eszközére, mely nem 
játszik nagy szerepet a mindennapi szövegekben. Mindazonáltal nagyon sok alapvető 
metaforát olyan gyakran használunk, hogy még azt sem vesszük észre, hogy azok meta- 
forák. Egy ilyen metafora annak a gondolata, hogy a ,több felfelé van". Ez a metafora 
lehetővé teszi számunkra annak közlését, hogy az árak emelkedtek, felmásztak vagy 
rakéta módjára szárnyalnak, hogy a hőmérséklet csökken vagy esik, hogy a bizalom 
valakiben csökken, illetve hogy egy sztár népszerűsége megugrott vagy szárnyal. 

Az ilyen metaforák megközelítésének két módja lehetséges. AZ egyik az, hogy a meta- 
fora teljes tudását beépítjük a szótárba — új jelentéseket adunk az emelkedik, esik, mászik 
stb. szavakhoz, melyek úgy írják le őket, hogy mindenféle mértékre vonatkozhatnak, nem 
csak a magasságra. Ez a módszer sok alkalmazás számára elegendő, de nem ragadja meg 
a metafora azon generálóképességét, amely az emberek számára lehetővé teszi új kifeje- 
zések használatát — mint például az , alábukik" vagy a , kirobbantja a tetőt" — anélkül hogy 
félreértéstől tartanának. A másik módszer a gyakori metaforákról explicit tudást illeszt be 
a rendszerbe, és ezeket használja az új kifejezések olvasás közbeni megértéséhez. Például 
tegyük fel, hogy egy rendszer ismeri a , több felfelé van" metaforáját. Azaz tudja, hogy 
az olyan logikai kifejezések, melyek egy függőleges skálán értelmezett pontra vonatkoz- 
nak, értelmezhetők egy mennyiségi skála megfelelő pontjaira vonatkozóként. Ezek után 
az , eladások magasak" kifejezéshez tartozna egy Alritude( Sales, High) szó szerinti értel- 
mezés, amit metafora segítségével Ouantity(Sales, Much)-ként értelmezhetünk. 


A többértelműség feloldása 


Ahogy korábban mondtuk, a többértelműség feloldása diagnózis kérdése. A beszélő szán- 
déka a kommunikációra a megnyilatkozásban szereplő szavak nem megfigyelt oka, és a 
hallgató dolga, hogy a szavakból és a szítuációról való tudásából kiindulva visszafelé előál- 
Jítsa a beszélő legvalószínűbb szándékát. Más szavakkal, a hallgató a következőt oldja meg: 
argmax Likelihood(intent words, situation) 
intent 

ahol a Likelihood lehet valószínűség vagy a preferenciák bármilyen számszerű mértéke. 
Valamilyen preferenciára szükség van, mivel a szintaktikai és szemantikai értelmezési 
szabályok önmagukban nem tudnak a kifejezéshez vagy mondathoz egyetlen helyes ér- 
telmezést meghatározni. Ezért részekre bontjuk a munkát: a szintaktikai és szemantikai 
értelmezés felelős a lehetséges értelmezések halmazának előállításáért, a többértelműség 
feloldásának folyamata pedig kiválasztja a legjobbat. 

Vegyük észre, hogy a szólásaktus szándékáról, és nem csak a beszélő által kimondott ak- 
tuális kijelentésről beszélünk. Például ha azt halljuk egy politikustól, hogy ,,( am not a crook", 
akkor lehet, hogy csak 5099 valószínűséget adunk annak, hogy a politikus nem bűnöző, 
ugyanakkor 99.9999--ot annak, hogy a beszélő nem egy kampós pásztorbot (a crook másik 
jelentése — a ford.). Mégis nagyobb valószínűséget rendelünk ahhoz az értelmezéshez, hogy 


Assert(Speaker, ASpeaker € Criminals) 


mivel ez a valószínűbb dolog, amit mond. 
Vizsgáljuk ismét az , I smelled a wumpus in 2,2." többértelmű példát! Egy preferen- 
ciaheurisztika a jobbra asszociáció (right association), amely szerint amikor el kell 
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döntenünk, hogy az , in 2,2" PP-t hova helyezzük el az elemzési fában, akkor azt pre- 
feráljuk, hogy a jobb szélen elhelyezkedő összetevőhöz csatoljuk, ami jelen esetben az 
sa wumpus" NP. Természetesen ez csak egy heurisztika; az ,,[ smelled a wumpus with 
ny nose" mondatra a heurisztikát felülbírálná az a tény, hogy az ,a wumpus with my 
nose" NP nem valószínű. 

A többértelműség feloldása a tények kombinálásával oldható meg, felhasználva a 
könyvben eddig látott tudásábrázolásra és bizonytalanság melletti következtetésre al- 
kalmas minden technikát. 

A tudást négy modellre bonthatjuk: 


. A világ modelt (world model): annak valószínűsége, hogy egy állítás előfordul a 
világban. 

2. A mentális modell (mental model): annak valószínűsége, hogy a beszélő létrehozza 
azt a szándékát, hogy egy adott tényt a hallgatóval közöljön, feltéve, hogy az bekövet- 
kezik. Ez annak modelljét kombinálja, amit a beszélő hisz azzal, amit a beszélő hisz 
arról, amit a hallgató hisz és így tovább. 

.. A nyelvi modell (language model): annak valószínűsége, hogy szavak egy bizonyos fü- 
zére lesz kiválasztva, azt feltételezve, hogy a beszélőben létezik egy adott tény elmon- 
dásának szándéka. A fejezetben ismertetett CFG- és DCG-modellek a valószínűségre 
logikai (igaz/hamis) modellt használnak: egy füzérnek vagy lehet egy adott értelmezé- 
se, vagy nem. A következő fejezetben a CFG olyan valószínűségi változatát látjuk 
majd, amely a többértelműség feloldására egy jobban informált nyelvi modellt készít. 

4. Az akusztikai modell (acoustic model): annak valószínűsége, hogy hangok egy 

adott sorozata keletkezik azt feltéve, hogy a beszélő szavak egy adott sorozatát vá- 

lasztotta, A beszédfelismerést a 15.6. alfejezet tárgyalta. 





u 


22.7. SZÖVEGÉRTÉS 


Egy szöveg (discourse) a nyelv tetszőleges karaktersorozata — tipikusan olyan, amelyik 
hosszabb, mint egy mondat. A jegyzetek, a regények, az időjárás-jelentések és a párbe- 
szédek mind szövegek. Eddig teljesen figyelmen kívül hagytuk a szövegek problémáit, 
a nyelv önálló mondatokra bontását helyeztük előtérbe, melyeket írt vitro tanulmányoz- 
hattunk. Ez a fejezet a mondatokat természetes környezetükben tanulmányozza. Két 
részproblémát fogunk vizsgálni: az utalásfeloldást és a koherenciát. 


Utalásfeloldás 


Az utalásfeloldás (reference resolution) egy olyan névmás vagy határozott főnévi ki- 
fejezés értelmezése, amely a világ egy objektumára utal."$ A feloldás a világról szóló 
tudáson és a szöveg korábbi részein alapszik. Vizsgáljuk a következő szakaszt: 


16 A nyelvészetben az utalást egy olyan dologra, ami már szerepelt, anaforának (anaphoric reference) 
nevezzük. Az utalást egy később szereplő dologra kataforának (cataphoric reference) nevezzük, mint pél- 
dául a ,he" névmás a , When he won his first toumament, Tiger was 20". 
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, John flagged down the waiter. He ordered a ham sandwich." 


Annak megértéséhez, hogy a , he" a második mondatban Johnra utal, meg kellett érte- 
nünk, hogy az első mondat két személyt említ, valamint azt, hogy John játssza a vendég 
szerepét, és ezért valószínűleg rendel, míg a pincér nem. Általában az utalásfeloldás egy 
hivatkozott kiválasztása a jelöltek listájáról, de néha magában foglalja új jelöltek létre- 
hozását is. Vegyük például a következő mondatot: 


sAfter John proposed to Marsha, they found a preacher and got married. For the 
honeymoon, they went to Hawaii. (Miután John megkérte Marshát, találtak egy papot, 
és összeházasodtak. Hawaiira mentek nászútra.)" 


Itt a , honeymoon" határozott főnévi kifejezés egy olyan dologra utal, amire csak impli- 
cit módon utal a , married" ige. A , they" névmás egy olyan csoportra utal, amit explicit 
módon nem említettek előtte: John és Marsha (de nem a pap). 

A legjobb hivatkozott dolog kiválasztása egy olyan többértelműség feloldási folya- 
mat, amely többféle szintaktikai, szemantikai és pragmatikus értelmezési információ 
kombinálásán alapszik. Bizonyos nyomravezetők kényszerek formájában adottak. Pél- 
dául a névmásoknak nemben és számosságban egyezniük kell a hivatkozottakkal: a 
she?" például utalhat Johnra, de nem Marshára; a , they" utalhat egy csoportra, de nem 
egyetlen személyre. A névmásoknak a reflexivitás szintaktikai kényszereinek is meg 
kell felelniük. Például a ,,he saw hím in the mirror" mondatban a két névmásnak két kü- 
lönböző emberre kell vonatkoznia, míg a , he saw himself" kifejezésben ugyanarra az 
emberre kell utalniuk. Vannak a szemantikai konzisztenciára vonatkozó kényszerek is. 
A , he ate it" kifejezésben a , he" névmásnak olyan dologra kell utalnia, ami eszik, míg 
az , it" olyanra, amit megehetnek. 

Bizonyos vezérfonalak olyan preferenciák, amik nem állnak mindig fenn. Például 
amikor egymás utáni mondatoknak párhuzamos struktúrája van, olyankor előnyös, ha 
a névmási utalások követik ezt a struktúrát. Így a 


s. Marsha flew to San Francisco from New York. John flew there from Boston." 


mondatokban azt preferáljuk, hogy a , there" San Franciscóra utal, mivel az ugyanazt 
a szintaktikai szerepet tölti be. Párhuzamos struktúra hiányában az alanyt preferáljuk a 
tárgy ellenében. Így a 


s .Marsha gave Sally the homework assignment. Then she left." 


szövegben , Marsha" az első mondat alanya, így ő a , she" preferált előzménye. Egy má- 
sik preferencia annak az entitásnak az előtérbe helyezése, amelynek a tárgyalása a leg- 
nyilvánvalóbb. Ha a következő mondatpárt önállóan vizsgáljuk 


. Dana dropped the cup on the plate. It broke." 


akkor felmerül egy probléma: nem világos, hogy az , it" a pohárra vagy a tányérra utal. 
Azonban egy nagyobb kontextusban a többértelműség feloldódik: 


Dana was guite fond of the blue cup. The cup had been a present from a close friend. 
Unfortunately, one day while setting the table, Dana dropped the cup on the plate. It 
broke." 
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Itt a pohár van a figyelem középpontjában, ezért ez a preferált hivatkozott dolog. 

Sokféle utalásfeloldó algoritmust találtak ki. Az egyik első (Hobbs, 1978) figyelem- 
re méltó, mivel egy olyan mértékű statisztikai ellenőrzést végeztek rajta, ami abban az 
időben szokatlan volt. Három különböző szövegfajtát használva Hobbs 929£-os pontos- 
ságot mutatott ki. A módszer azt feltételezte, hogy egy elemző egy helyes elemzést 
készített, ami azonban nem állt rendelkezésére, ezért Hobbs kézzel készítette el az 
elemzéseket. A Hobbs algoritmus keresésként működik: az aktuális mondattól indulva 
visszafelé keres a mondatokban. Ez a technika biztosítja, hogy a legutóbbi jelölteket 
vizsgálja először. Egy mondaton belül szélességi keresést végez, balról jobbra haladva. 
Ez azt biztosítja, hogy az alanyokat a tárgyak előtt vizsgálja. Az algoritmus kiválasztja 
az első jelöltet, amely a most vázolt kényszereknek eleget tesz. 


Egy koherens szöveg struktúrája 


Nyissa fel ezt a könyvet tízszer véletlenszerűen, és másolja le az első mondatot minden 
oldalról. Az eredmény szükségszerűen inkoherens lesz. Hasonlóképpen, ha veszünk 
egy koherens, tíz mondatból álló szöveget, majd permutáljuk a mondatokat, az ered- 
mény inkoherens lesz. Ez azt demonstrálja, hogy a természetes nyelvű szövegek mon- 
datai nagyon különböznek a logika állításaitól. A logikában, bármilyen sorrendben is 
KÖZÖLJÜK az A, B, és C állításokat egy tudásbázissal, az A A B A C konjukciót kapjuk. 
Természetes nyelvben a mondatok sorrendje számít; vegyük például a , Go two blocks. 
Turn right" és a , Turn right. Go two blocks" szövegek közötti különbséget. 

A szövegek mondatok feletti struktúrával rendelkeznek. Ezt a struktúrát a szöveg kö- 
vetkező nyelvtanának segítségével vizsgálhatjuk meg: 


Segmenttx) — S(x) 
Segment(CoherenceRelation(x, y)) — Segment(x) Segmentíy) 


E nyelvtan szerint a szöveg szegmensekből áll, ahol minden szegmens vagy egy mon- 
dat, vagy mondatok egy csoportja, és a szegmenseket koherenciarelációk (coherence 
relations) kötik össze. A , Go two blocks. Turn right" szövegben a koherenciareláció 
az, hogy az első mondat engedélyezi a másodikat: a hallgatónak akkor kell jobbra fordul- 
nia, miután ment két háztömbnyit. Különböző kutatók koherenciarelációk különböző 
készletét javasolták; a 22.21. ábra felsorol egy reprezentatív halmazt. Most vizsgáljuk 
meg a következő történetet: 


(1) A funny thing happened yesterday. 

(2) John went to a fancy restaurant, 

(3) He ordered the duck. 

(4) The bili came to $50. 

(5) John got a shock when he realized he had no money. 
(6) He had left his wallet at home. 

(7) The waiter said it was all right to pay later. 

(8) He was very embarrassed by his forgetfulness. 


Itt, az (1) mondat az Evaluation relációban áll a szöveg hátralevő részével; (1) a beszé- 
lő megjegyzése a szöveghez. A (2) mondat engedélyezi a (3)-at, és a (2-3) pár együtt 
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s Lehetővé teszi vagy okozza: S; előidéz egy olyan állapotváltozást (amely implicit is lehet), amely 
okozza, vagy lehetővé teszi §2-t. Példa: , Kimentem. Az iskolába vezettem." (A kimenetel implicit 
módon lehetővé teszi, hogy beüljünk az autóba.) 

" Magyarázat: a lehetővé tétel ellentettje: S, okozza vagy lehetővé teszi 5j-et, és így egy magya- 
rázat rá. Példa: , Elkéstem az iskolából. Elaludtam." 

s Háttér: S, leír egy szituációt vagy hátteret 52 számára. Példa: , Sötét és viharos éjszaka volt. A tör- 
ténet folytatódik..." 

" Kiértékelés: 57-ből következik, hogy S, része a beszélő azon tervének, hogy a szövegrészletet 
szólásaktusként végrehajtsa. Példa: , Egy mulatságos dolog történt. A történet folytatódik..." 

"  Szemléltetés: 52 az §1-ben levő általános dolog egy példája. Példa: , Ez az algoritmus megfordít 
egy listát, Az (A, B, C] bemenetet leképezi a [C, B, Al-ra" 

" Általánosítás: Sp az 52-ben levő általános dolog egy példája. Példa: , Az (A, B, CI bemenetet 
leképezi a (C, B, AJ-ra. Általánosságban ez az algoritmus megfordít egy listát." 

"  Elvárással ellentétes: 52-ből -P-t következteti ki, negálva az 54-ből szokásos P következtetést. 
Példa: , Ez a cikk gyenge. Másrészt viszont érdekes." 


















22.21. ábra. Koherenciarelációk listája (Hobbs, 1990) alapján. Mindegyik reláció két, egymást követő 
szövegrészlet, Sy és S2 között áll fenn. 


okozza (4)-et, azzal az implicit köztes állapottal, hogy János megette a kacsát. Ezek 
után (2-4) szolgál a szöveg hátralevő részének alapjául. A (6) mondat az (5) magyaráza- 
ta, és (5-6) engedélyezi (7)-et. Vegyük észre, hogy ez egy Enable, nem Cause, mivel a 
pincérnek lehetett volna más reakciója is. Az (5-7) együtt okozza (8)-at. A 22.13. feladat 
arra kéri majd, hogy rajzolja fel e szöveg elemzési fáját. 

A koherenciarelációk szolgálnak egy szöveg összekötésére. Vezetik a beszélőt an- 
nak eldöntésében, hogy mit mondjon és mit tekintsen magától értetődőnek, és segítik 
a ballgatót a beszélő szándékának megértésében. A koherenciarelációk a mondatok 
többértelműségének szűrőjeként szolgálhatnak: önállóan a mondatok lehetnek többér- 
telműek, de ezen többértelmű értelmezések többsége nem illeszthető össze egy kohe- 
rens szöveggé. 

Eddig az utalásfeloldást és a szövegstruktúrát külön vizsgáltuk. Azonban a kettő 
valójában összefügg. Grosz és Sidner (1986) elmélete például azzal foglalkozik, hogy 
a beszélő és hallgató figyelme mire koncentrál a szöveg során. Elméletük tartalmaz 
egy vermet, amely fókusztereket (focus spaces) tartalmaz. Bizonyos megnyilvánu- 
lások a fókusz elmozdulását okozzák egy elem verembe helyezésével vagy kivételé- 
vel. Például az éttermi történetben a , John went to a fancy restaurant" mondat új 
fókuszt helyez a verem tetejére. Ezen a fókuszon belül a beszélő egy határozott NP-t 
használhat a , the waiter"-re történő utalásra (az , a waiter" általános NP helyett). Ha 
a történet folytatódna egy , John went home" mondattal, akkor a fókuszteret kivenné 
a verem tetejéről, és a szöveg nem utalhatna tovább a pincérre a , the waiter" vagy a 
ahe" kifejezésekkel. 
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A nyelvtan indukciós (grammar induction) tanulása annak feladata, hogy adatokból 
nyelvtant tanuljunk. Nyilvánvaló, hogy meg kell kísérelni, hiszen bebizonyosodott, 
hogy nagyon nehéz egy nyelvtant kézzel elkészíteni, és az interneten mintaként használ- 
ható kijelentések milliárdjai állnak ingyenesen rendelkezésre. Ez egy nehéz feladat, 
mivel a lehetséges nyelvtanok tere végtelen, és azért is, mivel annak ellenőrzése, hogy 
egy adott nyelvtan generálja-e a mondatok egy adott halmazát, számításigényes feladat. 

Egy érdekes modell a SEOUITUR-rendszer (Nevill-Manning és Witten, 1997). Nincs 
szüksége más bemenetre, csak egy szövegre (amit nem szükséges előzetesen monda- 
tokra bontani). Egy nagyon specializált formátumú nyelvtant állít elő: egy olyan nyelv- 
tant, amely csak egy karakterfüzért generál, nevezetesen az eredeti szöveget. Másképp 
tekintve a SEOUITUR épp csak arra elegendő nyelvtant tanul, hogy a szöveget elemezze. 
Íme, itt van az a zárójelezés, amit egy nagyobb, híreket tartalmazó szövegben levő 
mondatra felfedezett: 


(Most Labour] fsentiment [[would still] [favor the) abolition]] ITof (the House)J] [of Lords]] 





Helyesen választott ki olyan összetevőket, mint például az , of the House of Lords" PP, 
bár a tradicionális elemzéssel ellentétesen dolgozik akkor például, amikor a ,.the"-t a 
megelőző igével és nem a követő főnévvel csoportosítja. 

A SEOUITUR azon az ötleten alapszik, hogy egy jó nyelvtan egyben tömör is. A kö- 
vetkező két kényszer betartása a legfontosabb: (1) Egymást követő szimbólumok egyet- 
len párja sem szerepelhet egynél többször a nyelvtanban. Ha az A B szimbólumpár több 
szabály jobb oldalán is szerepel, akkor ki kell cserélnünk a párt egy új, nem záró szim- 
bólummal, amit C-nek nevezünk, és egy új szabályt kell bevezetnünk, miszerint 
CG A B. (2) Minden szabályt legalább kétszer kell használni. Ha egy C nem záró, csak 
egyszer szerepel a nyelvtanban, akkor törölnünk kell a C-re vonatkozó szabályt, és fel 
kell cserélnünk egyetlen előfordulását a szabály jobb oldalával. Ezt a két kényszert egy 
mohó keresés alkalmazza, amely a beérkező szöveget balról jobbra végignézi, menet köz- 
ben inkrementálisan építi a nyelvtant, és alkalmazza a kényszereket, amint lehetséges. 
A 22.22. ábra mutatja az algoritmus működését az , abcdbcabcd" szövegen. Az algoritmus 
egy optimálisan tömör nyelvtant határoz meg a szöveghez. 

A következő fejezetben további nyelvtant tanuló algoritmusokat is látni fogunk, ame- 
lyek valószínűségi alapú, környezetfüggetlen nyelvtanokkal működnek. Most azonban 
egy olyan nyelvtan tanulásának problémáját vizsgáljuk meg, amelyet szemantikával 
terjesztettünk ki. Mivel egy kiterjesztett nyelvtan egyben Horn-klóz logikai program ís, 
ezért az induktív logikai programozás technikái megfelelők lesznek. A CHILL (Zelle és 
Mooney, 1996) egy induktív logikai programozás (ILP), amely példákból megtanul egy 
nyelvtant és egy arra specializált elemzőt. A célterület természetes nyelvű adatbázis- 
lekérdezések. A tanító példák szófüzérek, és a nekik megfelelő lekérdezések párjait tar- 
talmazzák — példáuk: 


What is the capital of the state with the largest population? 
Answerte, Capitaks, c) A Largestíp, State(s) A Population(s, p))) 


A CHILL feladata, hogy megtanuljon egy Parse(words, guery) predikátumot, amely 
konzisztens a példákkal, és remélhetőleg más példákra is jó! általánosít. Az ILP közvet- 
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Bemenet Nyelvtan 4 Megjegyzések 
1 a §-a 
2 ab § 6 ab 
3 abc §— abc 
4 abcd 5 — abcd 
r.) abcdb § — abcdb 
6 abcdbe 5 — abcdbc bc kétszer 
§ — aAdaA; A — be 
7 abcdbca §— aAdAa; A — be 
8 abcdbcab § — aAdAab; A 5 be 
9 abcdbcabc § — aAdAabc; A 6 be bc kétszer 
§ — aAdAgA; A o be 44 kétszer 
S — BdAB; A — bc; B— aA 
10 abcdbcabcd S — BdABd; A — bc; B — aA Bd kétszer 


§ 6 CAC; A Oo bc B aA; CO Bd — Bcsak egyszer 
§ 6 CAG; A — bc; C — aAd 











22.22. ábra. Az ,abcdbcabcd" bemeneti szöveget elemző nyelvtant tartalmazó SEOUITUR-rendszer futási 
lépései. Egy §-re vonatkozó szabályból indulunk ki, és ezen szabály végéhez sorban minden egyes szim- 
bólumot hozzáadunk. Miután a hatodik szimbólumot is hozzáadtuk, megkapjuk egy ismétlődő pár első 
előfordulását: be. Ezért a bc mindkét előfordulását lecseréljük egy új nem záróra, A-ra, és egy új szabályt 
veszünk fel: A — be. Miután három újabb szimbólumot hozzáraktunk a bemenethez, a kilencedik a bc 
egy újabb ismétlését eredményezi, így újra A-val helyettesítjük. Ez az aA két előfordulásához vezet, ezért 
egy új nem záróval, B-vel helyettesítjük. Miután a tizedik, utolsó szimbólumot is hozzáraktuk, Bd két 
előfordulását kapjuk, ezért lecseréljük őket egy új nem záróval, C-vel. De B immár csak egyszer szere- 
Pel, a C szabály jobb oldalán, ezért B-t a neki megfelelő bővítéssel, a4-val cseréljük le. 





len alkalmazása ezen predikátum megtanulására gyenge teljesítményt hoz: a kikövetkez- 
tetett elemző csak körülbelül 2090-os pontosságú. Szerencsére az ILP tanuló algoritmusok 
fejleszthetők tudás bevitelével. Ebben az esetben a Parse predikátum nagy részét logikai 
programként definiálták, és a CHILL feladatát a vezérlő szabályok kikövetkeztetésére 
redukálták, amelyek segítik az elemzőt a különböző elemzések közötti választásban. Ezzel 
a hozzáadott háttértudással a CHILL 70-8596 közötti pontosságot ér el különböző adatbá- 
Zis-lekérdezési feladatokon. 


22.9. ÖSSZEFOGLALÁS 


A természetes nyelv megértése az MI egyik legfontosabb részterülete. Ötleteket merít 
a filozófiából és a nyelvészetből, valamint a logikai programozás, valószínűségi tudás- 
reprezentáció és a következtetés területének technikáiból is. Más MI-területektől eltérő 
módon a természetes nyelv megértése a tényleges emberi viselkedés empirikus vizsgá- 
latát igényli — amely komplexnek és érdekesnek bizonyul. 


s Az ágensek jelzéseket küldenek egymásnak bizonyos célok elérése érdekében: infor- 
málni, figyelmeztetni, segítséget szerezni, tudást megosztani vagy megígérni valamit. 
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A jelzések ily módon való küldését szólásaktusnak (speech act) nevezzük. Végső 
soron minden szólásaktus kísérlet arra, hogy egy másik ágens elhiggyen vagy meg- 
tegyen valamit. 

" A nyelv megállapodáson alapuló jelzésekbő! (signs) áll, melyek jelentést közvetítenek. 
Sok állat használ ilyen értelemben jelzéseket. Az ember tűnik az egyetlen állatnak, aki 
nyelvtant (grammar) használ strukturált üzenetek végtelen számú variációinak elő- 
állítására. 

s A kommunikáció három lépést igényel a beszélőtől, a szándékot egy elképzelés átadá- 
sára, a szavak mentális előállítását és a szavak fizikai szintézisét. Ezek után a hallgató- 
nak négy lépést kell végrehajtania: észlelés, analízis, többértelműség feloldása és a 
jelentés beépítése. Minden nyelvhasználat beágyazott (situated) abban az értelem- 
ben, hogy a megnyilatkozások jelentése függhet attól a szituációból, amiben előállnak. 

" A formális nyelvészet és a kifejezésstruktúra (phrase structure) nyelvtanok (külö. 
nösen a környezetfüggetlen nyelvtan (context-free grammar)) hasznos eszközök 
a természetes nyelv egyes aspektusainak kezelésére. 

.  Környezetfüggetlen nyelv mondatai O(r?) időben elemezhetők a diagramelemző 
(chart parser) segítségével. 

s Kézenfekvő egy nyelvtan kiterjesztése (augment) annak érdekében, hogy olyan 
problémákat kezeljünk, mint az alany-ige egyeztetése vagy a névmási esetek. 
A definit klóz nyelvtan (definite clause gyrammar, DCG) egy olyan formalizmus, 
amely lehetővé teszi a kiterjesztéseket. A DCG segítségével az elemzés és szemantikai 
értelmezés (sőt még a generálás is) logikai következtetés segítségével elvégezhető. 

s A szemantikus értelmezés (semantic interpretation) szintén kezelhető egy kiter- 
jesztett nyelvtannal. Egy kvázilogikai forma jó közvetítő lehet a szintaktikai fák és 
a szemantika között. 

" A többértelműség (ambiguity) nagyon fontos probléma a természetes nyelv meg- 
értésében; a mondatok többségének több lehetséges értelmezése van, de általában 
csak egy megfelelő. A többértelműség feloldása a világról, az adott szítuációról és 
a használt nyelvről szóló tudáson alapszik. 

s A legtöbb nyelv több mondat kontextusában létezik, nem csak egyben. A szövegér- 
tés (discourse) a kapcsolódó szövegek vizsgálata. Láttuk, hogyan oldjunk fel mon- 
datok közötti névmási utalásokat, és a mondatok hogyan kapcsolódnak koherens 
szegmensekké. 

s A nyelvtan indukciós (grammar induction) tanulása példákból tud nyelvtant 
tanulni, bár vannak határai annak, hogy a nyelvtan milyen jól általánosít. 








Irodalmi és történeti megjegyzések 


A jelek és szimbólumok mint nyelvi elemek tanulmányozását John Locke (1690) jel- 
tudománynak (semiotics) nevezte, bár a 20. századig nem művelték (Peirce, 1902; 
De Saussure, 1993). A legutóbbi áttekintő munkák között van Eco (Eco, 1979) és 
Cobley (Cobley, 1997) műve. 

A nyelv mint cselekvés ötlete a 20. századi nyelvészeti beállítottságú filozófiából ered 
(Wittgenstein, 1953; Grice, 1957; Austin, 1962), leginkább a Speech Acts c. könyvből 
(Searle, 1969). A szólásaktus ötletének előfutára Protagorasz négyféle mondatkategóriája 
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volt: ima, kérdés, válasz és ítélet (kb. i. e. 430-ból). A szólásaktusok tervalapú modelljét 
először Cohen és Perrault (Cohen és Perrault, 1979) javasolta. A nyelv cselekvéshez kap- 
csolását tervfelismerés segítségével történetek megértéséhez Wilensky tanulmányozta 
(Wilensky, 1983). Cohen, Morgan és Pollack (Cohen, Morgan és Pollack, 1990) gyűjt 
össze újabb munkákat e területen. 

A szemantikus hálókhoz hasonlóan a környezetfüggetlen nyelvtanok (amelyek kifeje- 
zésstruktúra nyelvtanokként is ismertek) a sásztra szanszkrit nyelvet tanulmányozó ősi in- 
diai nyelvészek (különösen Pánini, kb. i. e. 350) által használt technika felelevenítései 
(Ingerman, 1967). A modern időkben Noam Chomsky fedezte fel újra őket az angol szin- 
taxis elemzésére (Chomsky, 1956), és tőle függetlenül John Backus az Algol-58 szintaxis 
analízisére használta. Naur kiterjesztette Backus jelölésrendszerét (Naur, 1963), ma pedig 
őhozzá rendelik az ,, N" betűt a BNF-ben, ami eredetileg a Backus Normál Forma volt 
(Backus Normal Form) (Backus, 1996). Knuth egyfajta kiterjesztett nyelvtant definiált, 
amelyet attribútumnyelvtannak (attribute grammar) nevezünk, és programozási nyel- 
vek esetén hasznos (Knuth, 1968). A definit klóz nyelvtanokat Colmerauer vezette be 
(Colmeraver, 1975), majd Pereira és Warren fejlesztette tovább és népszerűsítette (Pereira 
és Warren, 1980). A Prolog programozási nyelvet Alain Colmerauer találta ki, elsősorban 
a francia nyelv elemzésének problémájára. Colmerauer voltaképpen kidolgozott egy 
metamorfózis-nyelvtannak (metamorphosis grammar) nevezett formalizmust, amely to- 
vábbment a definit klózoknál, de a DCG hamarosan követte. 

Számos kísérlet volt természetes nyelvek formális nyelvtanának leírására, mind a 
atiszta", mind a számítógépes nyelvészetben. A gépek számára készült nyelvtanok kö- 
zött van a New York University Linguistic String projektje (Sager, 1981) és a Universíty 
of Pennsylvania XTAG projektje (Doran és társai, 1994). A modern DOG-rendszerek jó 
példája a Core Language Engine (Alshawi, 1992). Több átfogó, de nem formális nyelv- 
tan létezik az angol nyelvről (Jespersen, 1965; Ouirk és társai, 1985; McCawley, 1998; 
Huddleston és Pullum, 2002). A nyelvészetről szóló jó jegyzetek között van a (Sag és 
Wasow, 1999) bevezetése a szintaxisba, valamint a (Chierchia és McConnell-Ginet, 
1990; Heim és Kratzer, 1998) szemantikáról szóló jegyzetek. McCawley nyelvészek 
számára szóló anyaga a logikára koncentrál (McCawley, 1993). 

A nyolcvanas évek közepétől létező trend szerint egyre több információt tesznek a szó- 
kincsbe és kevesebbet a nyelvtanba. A lexikai-funkcionális nyelvtan (lexical-functional 
grammar), avagy LFG (Bresnan, 1982) volt az első jelentős nyelvtani formalizmus, ami- 
hez nagy szókincset gyűjtöttek. Ha a szélsőségig fokozzuk a lexikalizálást, akkor a kate- 
gorikus nyelvtant (categorial grammar) kapjuk, amelyben lehet, hogy csak két nyelvta- 
ni szabály van, vagy a függőségi nyelvtant (dependency grammar) (Meláik és Polguere, 
1988), amelyben nincsenek kifejezések/frázisok, csak szavak. Sleator és Temperley leír 
egy függőségi nyelvtant használó népszerű elemzőit (Sleator és Temperley, 1993). ATAG, 
avagy Tree-Adjoining Grammar (Joshi, 1985) nem szigorúan lexikális, de nő a népszerű- 
sége lexikalizált alakban is (Schabes és társai, 1988). A Wordnet (Fellbaum, 2000) egy 
körülbelül 100 000 szót és kifejezést tartalmazó szabadon elérhető szótár, melyet a beszéd 
részei szerint kategorizáltak, és olyan szemantikai relációkkal egészítettek ki, mint például 
a szinonima, antonima és része. 

Az első gépesített elemző algoritmusokat Yngve mutatta be (Yngve, 1955). Haté- 
kony algoritmusokat a hatvanas évek végén fejlesztettek ki, néhány kisebb újítással az- 
óta (Kasami, 1965; Younger, 1967; Graham és társai, 1980). A diagramelemzőnk Early 
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rendszeréhez áll a legközelebb (Early, 1970). Egy jó összefoglaló Aho és Ullman elem- 
zésről és fordításról szóló tanulmányában található (Aho és Ullman, 1972). Maxwell és 
Kaplan mutatja meg, hogy a kiterjesztett diagramelemző algoritmus hogyan tehető ha- 
tékonnyá az átlagos esetekben (Maxwell és Kaplan, 1993). Church és Patil foglalkozik 
a szintaktikai többértelműség feloldásával (Church és Patil, 1982). 

A természetes nyelvek formális szemantikai értelmezése a filozófiából és a formális 
logikából ered, és különösen szorosan kapcsolódik Alfred Tarskinak a formális nyelvek 
szemantikájáról szóló munkájához (Tarski, 1935). Bar-Hillel volt az első, aki a pragma- 
tikai elemzés problémáját áttekintette, és azt javasolta, hogy formális logikával kezeljék. 
Például bevezette C. S. Pierce referenciális index (indexical) fogalmát a nyelvészetben 
(Bar-Hillel, 1954). Richard Montague esszéje, az , English as a formal language" a nyelv 
logikai analízisének egyfajta manifesztuma (Montague, 1970), azonban Dowty és társai- 
nak könyve (Dowty és társai, 1991), valamint Lewis cikke (Lewis, 1972) sokkal olvasmá- 
nyosabb. Thomason szerkesztette Montague munkáinak teljes kollekcióját (Thomason, 
1974). A mesterséges intelligenciában McAllester és Givan munkája folytatja a monta- 
gue-i hagyományt sok új technikai részlet megvilágításával (McAllester és Givan, 1992). 

Egy közbülső, avagy kvázilogikai forma ötlete a kvantorok érvényességi köréhez 
hasonló problémák kezelésére Woodsig nyúlik vissza (Woods, 1978), és sok jelenlegi 
rendszerben is megtalálható (Alshawi, 1992; Hwang és Schubert, 1993). 

Az első valódi feladatot megoldó NLP-rendszer valószínűleg a BASEBALL kérdésvá- 
laszoló rendszer volt (Green és társai, 1961), amely baseball-statisztikák adatbázisávai 
kapcsolatos kérdéseket kezelt. Nem sokkal utána következett Woods LUNAR rendszere, 
amely az Apolló program által visszahozott kövekkel kapcsolatos kérdéseket válaszolt 
meg (Woods, 1973). Robert Schank és hallgatói több programot is készítettek (Schank 
és Abelson, 1977; Wilensky, 1978; Schank és Riesbeck, 1981; Dyer, 1983), amelyek 
mindegyikének a nyelv megértése volt a feladata. A hangsúly azonban kevésbé volt 
magán a nyelven, sokkal inkább a reprezentáción és következtetésen. A problémák kö- 
zött volt a sztereotip szituációk reprezentálása (Cullingford, 1981), az emberi memória- 
szervezés leírása (Rieger, 1976; Kolodner, 1983), valamint tervek és célok megértése 
(Wilensky, 1983). 

A természetes nyelv generálását az ötvenes években, a gépi fordítás legelső napjaitól 
kezdve figyelembe vették, de a hetvenes évekig nem merült fel egynyelvű problémaként. 
Simmons és Slocum (Simmons és Slocum, 1972), valamint Goldman (Goldman, 1975) 
munkája reprezentatív. A PENMAN (Bateman és társai, 1989) volt az első teljes generáló 
rendszer, amely a Szisztematikus Nyelvtanra (Systematic Grammar) (Kasper, 1988) 
épült. A kilencvenes években két fontos szabadon elérhető generáló rendszer vált elér- 
hetővé, a KPML (Bateman, 1997) és a FUF (Elhadad, 1993). A generálásról szóló fon- 
tos könyvek között szerepel (McKeown, 1985; Hovy, 1988; Patten, 1988; Reiter és Dale, 
2000). 

A többértelműség feloldásával foglalkozó egyik legkorábbi munka Wilks elmélete 
a preferenciaszemantikáról (preference semantics) (Wilks, 1975), amelyik azokat az 
értelmezéseket próbálta megtalálni, amik minimalizálják a szemantikai anomáliák szá- 
mát. Hirst egy olyan hasonló célú rendszert ír le, amelyik közelebb van a fejezetben 
ismertetett kompozíciós szemantikához (Hirst, 1987). Hobbs és társai a szintaktikai és 
szemantikai reprezentáció minőségét mérő kvantitatív keretrendszert írnak le (Hobbs és 
társai, 1993). Azóta a Bayes-hálók használata vált elterjedtebbé (Charniak és Goldman, 
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1992; Wu, 1993). A nyelvészetben az optimalitás elmélete (Kager, 1999) a puha kény- 
szerek nyelvtanba építésén alapszik, amely természetes súlyt ad az értelmezéseknek 
ahelyett, hogy a nyelvtan az összes lehetőséget egyforma súllyal generálná. Norvig tár- 
gyalja azokat a problémákat, amelyek egy maximálisan valószínű értelmezés helyett 
több párhuzamos értelmezés figyelembevételéből adódnak (Norvig, 1988). Az irodal- 
mi kritika nem egyértelmű a tekintetben, hogy a többértelműség megoldandó probléma 
vagy üdvözlendő dolog (Empson, 1953; Hobbs, 1990). 

Nunberg a metonímia (metonymy) formális modelljét vázolja (Nunberg, 1979). Lakoff 
és Johnson az angol nyelv gyakori metaforáit katalogizálja és magával ragadó módon 
elemzi (LLakoff és Johnson, 1980). Ortony metaforáról szóló cikkgyűjteményt mutat be 
(Ortony, 1979); Martin a metafora értelmezésének számítógépes megközelítését adja 
meg (Martin, 1990). 

Az utalásfeloldás áltaiunk bemutatott kezelése a (Hobbs 1978)-at követi. A (Lappin 
és Leass, 1994) által bemutatott összetettebb megoldás egy kvantitatív pontozási mód- 
szeren alapszik. Újabb munkák (Kehler, 1997; Ge és társai, 1998) gépi tanulást hasz- 
nálnak a kvantitatív paraméterek hangolására. Az utalásfeloldásról szóló két kitűnő 
áttekintés Hirst és Mitkov könyvei (Hirst, 1981; Mitkov, 2002). 

1758-ban David Hume Enguiry Concerning the Human Understanding c. műve 
amellett érvelt, hogy a nyelvi szövegeket , három, az elgondolások közötti kapcsolato- 
kat leíró ely köti/fogja össze, nevezetesen a Hasonlóság, az idő- vagy térbeli Összefüg- 
gés és az Ok vagy Okozar". Így kezdődött a koherenciarelációk meghatározásának 
hosszú története. Hobbs (Hobbs, 1990) adja meg nekünk a fejezetben használt halmazt; 
Mann és Thompson (Mann és Thompson, 1983) egy jobban kifejtett halmazt nyújt, 
amely magában foglalja a következőket: megoldás-összetartozás, bizonyíték, igazolás, 
motiváció, következtetés, sorozat, engedélyezés, kidolgozás, újrafogalmazás, feltétel, 
körülmény, ok, engedmény, háttér, valamint tézis-antitézis. Ez a modell fejlődött a reto- 
rikai struktúra elméletté (rhetorical structure theory, RST), amely valószínűleg napjaink 
legkiemelkedőbb elmélete (Mann és Thompson, 1988). Ez a fejezet átvesz egyes pél- 
dákat (Jurafsky és Martin, 2000) Andrew Kehler által írt fejezetéből. 

Grosz és Sidner bemutat egy fókuszeltoláson alapuló szövegkoherencia-elméletet 
(Grosz és Sidner, 1986), és a (Grosz és társai, 1995) egy középpontba állításon alapuló 
hasonló elméletet kínál. Joshi, Webber és Sag fontos korai munkákat gyűjt össze a szö- 
vegértésről (Joshi, Webber és Sag, 1981). Webber bemutatja olyan szintaxis- és Szö- 
vegkényszerek egymással kapcsolatban álló modelljét, amely kényszerek a szöveg egy 
adott pontján állítható dolgokra vonatkoznak (Webber, 1983), továbbá bemutatja az 
igeidők és a szöveg kölcsönhatási módjának modelljét (Webber, 1988). 

Az első fontos eredmény a nyelvtan indukciós (grammar induction) tanulásának 
területén egy negatív eredmény volt: Gold (Gold, 1967) megmutatta, hogy nem lehetsé- 
ges megbízhatóan egy helyes környezetfüggetlen nyelvtan megtanulása annak szövegei 
alapján. Az ötlet lényege szerint ha adott egy s4, 52. ... Sa füzérhalmaz, akkor a helyes 
nyelvtan lehet a mindent magába foglaló (S — word?), vagy a bemenet másolata, az 
(5— s] 52 1... I sr), vagy bármi a kettő között. Jeles nyelvészek, mint például Chomsky 
(Chomsky, 1957; 1980) és Pinker (Pinker, 1989; 2000) felhasználták Gold eredményeit 
annak megmutatására, hogy lennie kell egy öröklött univerzális nyelvtannak (universal 
grammar), amellyel minden gyermek születésénél fogva rendelkezik. Az úgynevezett In- 
gerszegénység (Poverty of the Stimulus) érvelés szerint a gyerekeknek nincs más nyelvi 
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példájuk, mint pozitív: szüleik és társaik nyelvük legtöbbször pontos példáit állítják elő, 
és igen ritkán javítanak ki hibákat. Ezért, mivel Gold bebizonyította, hogy pozitív példák- 
ból nem lehet CFG-t tanulni, a gyerekeknek már , tudniuk" kell a nyelvtant, és pusztán 
ezen öröklött nyelvtan paramétereit állítják, illetve a szókészletet tanulják. Bár ez az érve- 
lés még befolyással bír a Chomskyt követő nyelvészek körében, egyes nyelvészek 
(Pullum, 1996; Elman és társai, 1997) és a legtöbb számítástudománnyal foglalkozó elve- 
tette. Igen hamar, már 1969-ben Horning megmutatta, hogy meg lehet tanulni PAC érte- 
lemben egy valószínűségi környezetfüggetlen nyelvtant. Azóta számos meggyőző, kizá- 
rólag pozitív példákból tanuló empirikus demonstráció jelent meg, mint például Mooney, 
illetve Muggleton és De Raedt ILP-munkái (Mooney, 1999; Muggleton és De Raedt, 
1994), valamint Schütze és de Marcken emlékezetes PhD-értekezései (Schütze, 1995; de 
Marcken, 1996). Más nyelvtani formalizmusok, mint például a reguláris nyelvek (Oncina 
és Garcia, 1992; Denis, 2001), reguláris fa nyelvek (Carrasco és társai, 1998), valamint a 
véges automaták (Parekh és Honavar, 2001) tanulása is lehetséges. 

A SEovITUR-rendszert Nevill-Manning és Witten készítette (Nevill-Manning és 
Witten, 1997). Érdekes, hogy ők, valamint de Marcken is megjegyezte, hogy nyelvtant 
kikövetkeztető megoldásaik tömörítésre is jól használhatók. Ez összhangban van a mi- 
nimális leíró hosszúság kódolásának elvével: egy jó nyelvtan olyan, amely minimalizál 
két méretet: a nyelvtan és a szövegek elemzési fájának nagyságát. 

A nyelv tanulására szolgáló induktív logikai programozási munkák között van a CHILL 
rendszer (Zelle és Mooney, 1996), valamint Mooney és Califf programja (Mooney és 
Califf, 1995), amely jobban tanult igék múlt idejű alakjára vonatkozó szabályokat, mint 
a korábbi neurális hálók és a döntési fa rendszerek. Cussens és Dzeroski több cikk- 
gyűjteményt is szerkesztett, amelyek a nyelvtanulásról szóltak a logikában (Cussens és 
Dzeroski, 2000). 

Az Association for Computational Linguistics (ACL) rendszeresen rendez konferenci- 
ákat, és kiadja a Computational Linguistics folyóiratot. Ezenkívül van egy nemzetközi 
konferencia a témában, az International Conference on Computational Linguistics (COL- 
ING). A Readings in Natural Language Processing (Grosz és társai, 1986) a terület sok 
fontos korai cikkét tartalmazó antológia. A (Dale és társai, 2000) az NLP-rendszerek 
építésére szolgáló gyakorlati eszközökre helyezi a hangsúlyt. Jurafsky és Martin jegyze- 
te alapos bevezetőt nyújt a területhez (Jurafsky és Martin, 2000). Az (Allen, 1995) egy 
kicsit régebbi munka. Pereira és Sheiber, valamint Covington Prolog-implementációkon 
alapuló tömör áttekintést ad (Pereira és Sheiber, 1987; Covington, 1994). Az Encyclopedia 
of AI-ben sok hasznos cikk található a területről; kiemelendő a , Computational 
Linguistics" és a , Natural Language Understanding". 


Feladatok 


22.1. Olvassa el az alábbi szöveget egyszer, és próbáljon meg amennyit csak lehet 
megjegyezni belőle. Később lesz egy teszt. 


Az eljárás valójában igen egyszerű. Először különböző csoportokba rendezi a dolgokat. Termé- 
szetesen egy halom elegendő lehet attól függően, hogy mennyi teendő van. Ha valahova másho- 
va kell mennie a felszerelés hiánya miatt, akkor az a következő lépés, különben már nagyjából 
előkészült. Fontos, hogy ne vigye túlzásba a dolgot. Ez azt jelenti, hogy jobb egyszerre keveseb- 
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bel foglalkozni, mint többel. Rövid távon ez nem tűnhet fontosnak, de könnyen jelentkezhetnek 
komplikációk, A hiba is költséges. Első ránézésre a teljes eljárás bonyolultnak tűnik. Azonban 
hamarosan az élet megszokott dolgává válik. Nehéz a feladat szükségességének bármilyen 
elmúlását is előre látni, de sosem lehet tudni. Miután az eljárás befejeződött, ismét különböző 
csoportokba kell rendezni az anyagokat. Ezek után a megfelelő helyükre pakolhatók a dolgok. 
"Végső soron újra használni fogják őket, és a teljes ciklust meg kell majd ismételni. Mindazonál- 
tal, ez az élet velejárója. 





Írjon egy nyelvtant a DCG-jelölésrendszerrel, amely ugyanolyan, mint az €) , az- 
Zal a kivétellel, hogy kikényszeríti a mondat alanya és igéje közötti egyeztetést, 
így nem állítja elő az , I smells the wumpus"-t! 


Terjessze ki az £, nyelvtant úgy, bogy kezelje a névelő-főnév egyeztetéseket! 
Azaz biztosítsa, hogy az , agents" NP, de az , agent" és az , an agents" nem az! 


Foglalja össze a legfontosabb különbségeket a Java (vagy bármely más számí- 
tógépes nyelv, amelyet ismer) és a magyar között, megjegyezve a , megértés" 
problémáját mindkettőre! Gondoljon olyan dolgokra, mint a nyelvtan, a szintaxis, 
a szemantika, a pragmatikus elemzés, az összetételek, a környezetfüggőség, a 
lexikális többértelműség, a szintaktikai többértelműség, az utalások megtalálása 
(a névmásokat is ideértve), a háttértudás és leginkább arra, hogy mit is jelent 
a Megérteni". 


Melyek indokolják a következők közül a kvázilogikai forma bevezetését? 

(a) Könnyebben leírható egyszerű összetételes nyelvtani szabályok. 

(b) A szemantikai leíró nyelv kifejezőképességének kiterjesztése. 

(c) A kvantorok érvényességi köre többértelműségének (többek között) tömör 
formában történő ábrázolása. 

(d) A szemantikai egyértelműsítés egyszerűbbé tétele. 


Határozza meg, hogy az ebben a fejezetben található nyelvtan alapján milyen 
szemantikai értelmezés adható a következő mondatokhoz: 

(a) Itis a wumpus. 

(b) The wumpus is dead. 

(c) The wumpus is in 2,2. 

Jó ötlet lenne az ,It is a wumpus" szemantikai értelmezésének egyszerűen a 
3x x E Wumpuses? Fontoljon meg alternatív mondatokat, mint például az , It was 
a wumpus". 


Anélkül hogy megnézné a 22.1. feladatot, válaszolja meg a következő kérdéseket: 
(a) Mi a négy említett lépés? 

(b) Melyik lépés maradt ki? 

(c) Mi az , az anyag", amit a szöveg említ? 

(d) Milyen hiba lenne drága? 

(e) Jobb túl keveset, vagy túl sokat tenni? Miért? 
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228. 


229. 


Ez a gyakorlat nagyon egyszerű nyelvek nyelvtanaival foglalkozik. 

(a) Írjon egy környezetfüggetlen nyelvtant az ab" nyelv számára! 

(b) Írjon egy környezetfüggetlen nyelvtant a tükörmondatok (palindroma) 
számára: az összes olyan füzérre, amelyek második fele épp az első fél tü- 
körképe! 

(c) Írjon egy környezetfüggő nyelvtant a duplázó nyelv számára: az összes 
olyan füzérre, amelyek második fele megegyezik az első felével. 


Vizsgálja meg a , Someone walked slowly to the supermarket (Valaki lassan a 
szupermarkethez sétált)" mondatot és az alábbi szókincset: 

Pronoun — someone V— walked 

Adv — slowly Prep — to 

Det — the Noun — supermarket 


A következő átíró szabályhalmazok melyike állítja elő a fenti mondatot az előbbi 
szókincset használva? Adja meg a megfelelő elemzési fá(ka)t! 


(A): (B): (OC): 

§- o NPVP §- NPVP §- NPVP 

NP 6 Pronoun NP 6 Pronoun NP —G Pronoun 

NP 6 Det Noun NP — Noun NP 6 Det NP 

VP 6 VP PP NP — Det NP VP G V Adv 

VP 6 VP Adv Adv VP 6 V Vmod Adv — Adv Adv 

VPGV Vimod — Adv Vmod Ady 6 PP 

PP o Prep NP Vmod — Adv PP — Prep NP 

NP 6 Noun Adv 6 PP NP G Noun 
PP —G Prep NP 


Írjon három szintaktikailag helyes és három helytelen angol mondatot, amelyet 
a három előbbi nyelvtan állít elő! Lényegében különbözzenek egymástól, leg- 
alább hat szó hosszúak legyenek, és egy teljesen új szókincsre kell épülniük 
(amit lehetőleg Ön határozzon meg). Javasoljon mindhárom nyelvtanra olyan 
újítást, amely elkerüli a nem helyes mondatok előállítását! 


22.10. Valósítsa meg a diagramelemző algoritmus egy olyan változatát, amely a teljes 














bemenetet lefedő összes él tömörített fáját adja vissza! 


22.11. Valósítsa meg a diagramelemző algoritmus egy olyan változatát, amely a leg- 
tást hosszabb bal oldali él tömörített fáját adja vissza, és amennyiben ez az él nem 


fedi le a teljes fát, folytatja az elemzést annak az élnek a végén! Mutassa meg, 
hogy miért lesz szükség a PREpIcT eljárás meghívására a folytatás előtt! A vég- 
eredmény tömörített fák egy olyan listája, ahol a teljes lista lefedi a bemenetet. 


22.12. (Barton és társai, 1987) alapján. Ez a gyakorlat az általunk Buffalo"-nek nevezett 


nyelvvel foglalkozik, ami nagyon hasonlatos az angolhoz (legalábbis az €9-hoz), 
azzal a kivétellel, hogy a szókincsben csak egy szó található: a buffalo. Íme, két 
mondat a nyelvből: 
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22.13. 


22.14. 
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Buffalo buffalo buffalo Buffalo buffalo. 
Buffalo Buffalo buffalo buffalo buffalo Buffalo buffalo. 


Arra az esetre, ha nem hinné el, hogy ezek mondatok, álljon itt két angol mon- 
dat ugyanezzel a szintaktikai struktúrával: 


Dallas cattle bewilder Denver cattle. 
Chefs London critics admire cook French food. 


Írjon egy nyelvtant a Buffalo" számára! A lexikális kategóriák a város, a többes 
számú főnév és a (tranzitív) ige, és egy szabálynak kell lennie a mondat, egynek 
az igei kifejezés és háromnak a következő főnévi kifejezések számára: többes 
számú főnév, főnévi kifejezés, amelyet a város mint módosító előz meg, és fő- 
névi kifejezés, amelyet redukált relatív klóz követ. A redukált relatív klóz egy 
olyan klóz, amelyből hiányzik a relatív névmás. Emellett a klóz egy alanyi fő- 
névi kifejezést követő tárgy nélküli igéből áll. Egy példa a redukált relatív 
klózra a , London critics admire" a fenti példában. Foglalja táblázatba a Buffalo" 
lehetséges elemzéseinek számát ri — 1...10-re! Külön pontért: Carl de Marcken 
kiszámolta, hogy 121 030 872 213 055 159 681 184 485 olyan Buffalo" mon- 
dat van, amely 200 hosszú (az általa használt nyelvtanra). Hogyan csinálta? 


Rajzolja fel a 939. oldalon található , John egy elegáns étterembe megy" történet 
szövegelemzési fáját! Használja a Segment-re vonatkozó két szabályt, megadva 
a helyes CoherenceRelation-t mindent egyes csomópontra! (Nem kell az egyes 
mondatok elemzéseit megmutatnia.) Most tegye meg ugyanezt egy Ön által 
választott tetszőleges 5-10 mondat hosszúságú szövegre! 


Elfelejtettük megemlíteni, hogy a 22.1. feladat szövegének címe: , Ruhamosás". 
Olvassa újra a szöveget, és válaszolja meg a 22.7. feladat kérdéseit újra! Ezúttal 
jobban ment? Bransford és Johnson (1973) ezt a szöveget használta egy jobban 
ellenőrzött kísérletben, és azt tapasztalta, hogy a cím sokat segített. Mit mond ez 
Önnek a szövegértésről? 


23. VALÓSZÍNŰSÉGI NYELV- 
FELDOLGOZÁS 


Ebben a fejezetben meglátjuk, hogyan tehet egyszerű, statisztikailag tanított nyelvi 
modelleket szavak millióinak feldolgozására használni ahelyett, hogy csak egyes mon- 
datok feldolgozására használnánk 


A 22. fejezetben láttuk, hogyan képes egy ágens kommunikálni egy másik (szoftver vagy 
emberi) ágenssel közös nyelvi megnyilatkozások segítségével. A megnyilatkozások teljes 
szintaktikai és szemantikai elemzése szükséges a jelentésük teljes kinyeréséhez, ami azért 
tehetséges, mert a megnyilatkozások rövidek és körülhatárolt tárgyterületre korlátozottak. 
Ebben a fejezetben a nyelvmegértés korpuszalapú (corpus-based) megközelítését 
tárgyaljuk. A korpusz egy nagy szöveggyűjtemény, például az a több milliárd oldal, 
ami a világhálót építi fel. A szövegeket emberek írják embereknek, és a szoftverek fel- 
adata az, hogy megkönnyítsék az embereknek az információkeresést. Ez a megközelí- 
tés magában foglalja statisztikák és tanulás használatát a korpusz kihasználására, és jel- 
lemzően olyan valószínűségi nyelvi modelleket von maga után, amelyek az adatokból 
tanulhatók, és amelyek egyszerűbbek, mint a 22. fejezet kibővített DCG-i. A legtöbb 
feladat esetén az adatmennyiség kárpótol azért, hogy egyszerűbb nyelvi modellt haszná- 
lunk. Három specifikus feladatot fogunk áttekinteni: az információkeresést (information 
retrieval) (23.2. alfejezet), az információkinyerést (information extraction) (23.3. al- 
fejezet) és a gépi fordítást (machine translation) (23.4. alfejezet). Elsőként azonban a 
valószínűségi nyelvi modelleket (probabilistic language model) mutatjuk be röviden. 


23.1. VALÓSZÍNŰSÉGI NYELVI MODELLEK 


A 22. fejezet a nyelv /ogikai modelljét adta meg: CFG-ket és DCG-ket használtunk, 
hogy egy adott karakterfüzérről eldöntsük, eleme-e vagy sem egy nyelvnek. Ebben az 
alfejezetben számos valószínűségi modellt vezetünk be. A valószínűségi modellek szá- 
mos előnnyel rendelkeznek. Kényelmesen taníthatók adatok alapján: a tanulás mind- 
össze az előfordulások megszámlálásából áll (némi tűréssel a kis mintaméret okozta 
hibák miatt). Továbbá robusztusabbak (mivel bármely karakterfüzért elfogadnak, habár 
kis valószínűséggel), visszatükrözik azt a tényt, miszerint nem a beszélők 10090-a ért 
egyet abban, hogy mely mondatok részei a nyelvnek; valamint alkalmasak a többértelmű- 
ség feloldására: a valószínűségre támaszkodva kiválasztható a legvalószínűbb értelmezés. 

A valószínűségi nyelvi modell (probabilistic language model) valószínűségi elosz- 
lást definiál egy (esetleg végtelen) karakterfüzér-haimaz felett. Példaként állhatnak a 
15.6. alfejezetben beszédmegértésre használt bi- és trigram nyelvi modellek. Az unigram 
modell P(w) valószínűséget rendel a szókincs minden egyes szavához. A modell feltéte- 
lezi, hogy a szavak függetlenül lettek kiválasztva, azaz a karakterfüzér valószínűsége 
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egyszerűen a szavak valószínűségének szorzata: II.P(w). A következő húszszavas 
szekvenciát véletlen módon generáltuk, a könyv szavainak unigram modellje alapján:! 


logical are as confusing a may right tries agent goal the was diesel more object then 
information-gathering search is 


A bigram modell egy P(wilw; 1) valószínűséget rendel minden egyes szóhoz, adott elő- 
ző szó esetén. A 15.21. ábra néhány bigram-valószínűséget mutatott be. A könyv 
bigram modellje a következő véletlen szekvenciát generálja: 


planning purely diagnostic expert system are very similar computational approach 
would be represented compactly using tic tac toe a predicate 


Általánosan, egy 1-gram modell az előző n - 1 szó alapján szabja meg a 
P(wlw;.n-1)---Wj1) valószínűséget. A könyv trigram modellje ezt a véletlen szek- 
venciát generálja: 


planning and scheduling are integrated the success of naive bayes model is just a 
possible prior source by the time 


Még a fenti kis példa alapján is láthatónak kell lennie, hogy a trigram modell jobb, mint 
a bigram (amely pedig jobb, mint az unigram), mind az angol nyelv, mind egy MI- 
tankönyv témájának közelítésében. A modellek maguk is egyetértenek ezzel: a trigram 
modell a véletlen módon generált sztringjéhez 10-09 valószínűséget rendel, a bigram 
10729.et, az unigram pedig 10759-et. 

Ez a könyv félmillió szavával nem tartalmaz elég adatot ahhoz, hogy jó minőségű 
bigram modellt lehessen előállítani belőle, nem is beszélve a trigram modellről. 
A könyv szókincse körülbelül 15 ezer különböző szót tartalmaz, tehát a bigram modell 
15 0002 — 225 millió szópárt tartalmaz. Világos, hogy a szópárok legalább 99,895-a 0 
gyakoriságú, de nem akarjuk, hogy a modell azt állítsa, hogy ezek a szópárok lehetet- 
lenek. Szükségünk van valamilyen simításra (smoothing) a nulla gyakoriságok felett. 
A legegyszerűbb megoldás az adj-hozzá-egyet simítás (add-one smoothing): minden 
lehetséges bigram gyakoriságához hozzáadunk egyet. Azaz amennyiben a korpuszban 
N szó és B lehetséges bigram található, akkor minden c gyakoriságú bigramhoz egy 
(c t D/(W 1 B) értékű valószínűség-becslőt rendelünk. Ez a módszer megszünteti a nul- 
la valószínűségű n-gramok problémáját, de az a követelmény, hogy minden gyakoriságot 
Pontosan eggyel kell növelni, kétséges, és rossz becslésekhez vezethet. 

A másik megközelítés a lineáris interpoláción alapuló simítás (linear interpola- 
tion smoothing), ami lineárisan kombinálja a trigam, bigram és unigram modelleket. 
A valószínűség-becslőt a következőképpen definiáljuk: 


Blwilwi 2.1) — ezPlwilw awz 1) 7 czPlwilw; 1) 4 erPGw) 


ahol cz -k €2 - cy — I. A c; paraméterek lehetnek rögzítettek vagy EM algoritmussal 
taníthatók. Az is lehetséges, hogy a c; értékeket az n-gram gyakoriságoktól függőnek 
választjuk, azaz nagyobb súlyt adunk azoknak a valószínűségi becslőknek, amelyeket 
nagyobb gyakoriságokból számítunk. 


1 Mivel nem lett volna értelme lefordítani magyarra az egyes szavakat, ezért meghagytuk az eredeti angol 
nyelvű példát. (A ford.) 
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A nyelvi modell egyik lehetséges kiértékelési módja a következő: először válasszuk 
szét a korpuszt egy tanító és egy teszthalmazra. Határozzuk meg a modell paramétereit 
a tanító halmaz alapján. Ezután számítsuk ki a valószínűséget a teszthalmazra a modell 
alapján; minél nagyobb a valószínűség, annál jobb. A megközelítés egyik problémája az, 
hogy hosszú karakterfüzérek esetén a P(szavak) nagyon kicsi; a kis számok lebegő- 
pontos alulcsordulást okozhatnak, vagy egyszerűen túl nehéz lenne elolvasni őket. Te- 
hát a valószínűség helyett a modell összetettségét (perplexity) számíthatjuk ki a teszt 
karakterfüzéren: 


Összetettségíszavak) — 27108 (P(szavak)/N 


ahol N a szavak száma, Minél kisebb az összetettség, annál jobb a modell, Az az n1-gram 
modell, amely minden szóhoz 1/k valószínűséget rendel, k összetettségű; az összetett- 
séget úgy is lehet értelmezni, mint átlagos elágazási tényezőt. 

Példaként arra, hogy mire képesek az n-gram modellek, vegyük a szegmentáció 
(segmentation) feladatát, ami szóhatárok megtalálása szóköz nélküli szövegben. Ez a 
feladat elengedhetetlen a japán és kínai nyelv esetén; ezek olyan nyelvek, amelyek nem 
raknak szóközt a szavak közé, feltételezzük azonban, hogy a legtöbb olvasónak az angol 
nyelv? jobban megfelel. Az 


Tiseasytoreadwordswithoutspaces? 


mondatatot tényleg könnyű elolvasni. Az olvasó arra gondolhat, hogy ezt az teszi lehető- 
vé, hogy teljesen ismerjük az angol szintaktikát, szemantikát és pragmatikát. Meg fogjuk 
mutatni, hogy a mondatot egy egyszerű unigram modellel is könnyen dekódolni lehet. 
Korábban láthattuk, hogy a Viterbi algoritmus (15.9) hogyan használható a legvalószí- 
nűbb szekvencia megtalálására egy szó-valószínűségi hálóban. A 23.1. ábrán látható a 
Viterbi algoritmus olyan változata, amelyet specifikusan a szegmentációs probléma meg- 
oldására terveztünk. Bemenete a P(szó) unigram valószínűségi eloszlás és egy karakter- 
füzér. Ezután az algoritmus a karakterfüzér minden egyes i pozíciójára a legjobbli) elem- 
ben eltárolja a legvalószínűbb í-ig tartó karakterfüzér valószínűségét. Emellett a szavak[] 
elemben eltárolja azt az i-edik pozícióban végződő szót, ami a legnagyobb valószínűséget 
adta. Miután felépítette a legjobb és a szavak tömböket dinamikus programozási módon, 
hátrafelé mozogva feldolgozza a szavak tömböt, hogy megtalálja a legjobb utat. Ebben az 
esetben, a könyv unigram modellje alapján a legjobb szekvencia ténylegesen az , It is 
easy to read words without spaces"? 0 valószínűséggel. A szekvencia részeinek 
összehasonlítása során látható, hogy az , easy" unigram valószínűsége 2,6 x 1079, miköz- 
ben az alternatív ,e as y" valószínűsége sokkal kisebb, 98 x 107-!? annak ellenére, 
hogy a könyv képleteiben viszonylag gyakran előfordul az , e" és az ,y". Hasonlóképpen: 


PG without") — 0,0004 
P( with") — 0,005; P(, out") — 0,0008 
P( with out") — 0005 x 0,0008 — 0,000004 





2 Mivel nem lehetett volna hasonló magyar példát valószínűségekkel együtt elkészíteni, ezért meghagytuk 
az eredeti angol nyelvű példát. (A ford.) 
3 Könnyőszavakatszóközöknélkülolvasni (A ford.) 
Könnyű szavakat szóközök nélkül olvasni (A ford.) 
€asy - könnyű; as — mint (A ford.) 
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function. VITERBI-SZEGMENTÁCIÓ(szöveg, P) returns legjobb szavak és valószínűségük 
inputs: szöveg, szóköz nélküli karakterfűzér 
P, szavak unigram modellje 





n e Hosszíszöveg) 
szavak — n -- 1 hosszúságú üres vektor 
legjobb — n 4- 1 hosszúságú vektor, 0,0-ra inicializálva 
tegjobbtó] — 1.0 
/" Legjobb és szavak tömbök feltöltése dinamikus programozási módon t/ 
fori-0tondo 
forj— Otoi- 1do 

szó — szöveg[j:i) 

w — Hossz(szó) 

it Píszól x legjobbli - w) 2 tegjobbli) then 

tegjobblíj — P(szó) x legjobbli — w] 
szavaklí) — szó 
7" Legjobb szó szekvencia kigyűjtése " / 
szekvencia — üres lista 
ien 
while i 50 do 
szavakti)] a szekvencia elé 
d 6— £ - Hossztszavakti)) 

/" Legjobb szó szekvencia és valószínűségének visszaadása " / 
return szekvencia, legjobblí) 











23.1. ábra. Viterbi-alapú szószegmentáló algoritmus. Egy szóközöket nem tartalmazó szófüzért feldol- 
gozva megadja a legvalószínűbb szavakra történő szegmentációt. 


Ennek következtében az unigram modell szerint a , without" százszor nagyobb valószí- 
nűségű, mint a , with out".ó 

Ebben a bekezdésben a szavak feletti n-gram modellekről értekeztünk, azonban az 
n-gram modelleket számos egyéb egység — például karakterek vagy beszédrészek (parts 
of speech) — felett is lehet értelmezni. 


Valószínűségi környezetfüggetlen nyelvtanok 


Az n-gram modellek a korpuszon belüli közös előfordulási statisztikát használják ki, 
azonban nincs semmilyen információjuk a nyelvtanról n-nél nagyobb távolságra. A való- 
színűségi környezetfüggetlen nyelvtan - PCFG" (probabilistic context-free grammar) 
— egy alternatív nyelvi modell, ami egy olyan CFG, melyben minden átírási szabályhoz 
valószínűséget rendelünk. Az azonos bal oldallal rendelkező szabályok valószínűségé- 
nek összege I. A 23.2. ábrán az €p nyelvtan egy részletének PCFG-je látható. 

A PCFG-modeliben egy karakterfüzér valószínűsége — a P(szavak) - egyszerűen az 
elemzési fái valószínűségeinek összege. Egy adott fa valószínűsége a fa csomópontjait 


sad withowt — nélkül; with — vele; ort — kint (A ford.) 
A PCFG-k másik megnevezése a sztochasztikus környezetfüggetlen nyelvtan (stochastic context-free 
grammar), avagy SCFG. 
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S o NP VPII,00] 


NP — Pronow (0.10) 
I. Nemef0,10j 
1. Noun (0201 
I Article Noun [0501 
I NP PP [0.10] 


VP — Ige (060) 
1 VPNP 0.20] 
] vPPP (0.20) 


PP. — Preposítion NP [1.001 


Nown — breeze [0101 [ wumpus (0,15) ! agent (0,05]) ... 
Verb — sees [0,15] ] smelis (0,10) ] goes [0,251] ... 
Pronoun — me [0.05] ] you (0,10) ] K (0.25Jit (0.207)... 
Article — the [0.30] ] a (0,35] ] every [0.057 ... 
Preposition — to (030) ) ín [0,10] / on (0,20]J ... 











23.2. ábra. Az €g nyelvtan egy részletének valószínűségi környezetfüggetlen nyelvtana (PCFG) és szó- 
kincse. A szögletes zárójelben levő szám jelzi a valószínűségét annak, hogy az adott bal oldali szimbó- 
Iumot a megfelelő szabály szerint írjuk át. 


§ 
SBS, 
NP VP 
Le ÓES 10.60 
Article Noun Verb 
1005 Jous 10410 
Every wumpus smells 


233. ábra. A , Minden wumpus bűzlik" mondat elemzési fája, megadva minden egyes részfa valószínűsé- 
gét. A teljes fa valószínűsége 10 x 05 x 005 x 0,15 x 0.60 x 0.10 — 0.000225. Mivel a mondatnak ez 
az egyetlen elemzése, ezért ennyi a mondat valószínűsége is. 


felépítő szabályok valószínűségeinek szorzata. A 23.3. ábra bemutatja, hogyan lehet ki- 
számítani egy mondat valószínűségét. A valószínűség kiszámítható egy CFG diagram- 
elemző alkalmazásával, amely megadja az összes lehetséges elemzést, majd egyszerűen 
össze kell adni a valószínűségeket. Azonban ha csak a legvalószínűbb elemzés érdekel 
minket, akkor a nem valószínű elemzések meghatározása pazarlás. A legvalószínűbb 
elemzés hatékony megtalálására használhatunk egy Viterbi algoritmus variációt vagy egy 
legjobbat-először keresési technikát (mint például az AT-ot). 

A PCFG-vel az a probléma, hogy környezetfüggetlen. Ez azt jelenti, hogy a kü- 
lönbség a P(, eat a banana") és a P(, eat a bandanna")ő között mindössze a P(, banana") 





§ egy banánt eszik" — ,egy selyemkendőt eszik" (A ford.) 
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és P(, bandanna") közti különbségtől függ, és nem az , enni" ige és a megfelelő objek- 
tumok közti kapcsolattól. Hogy megkapjuk ezt a kapcsolatot, szükség van valamilyen 
környezetfüggő modellre, mint például a szókinccsel ellátott PCFG-re (lexicalized 
PCFG), amelyben a kifejezés feje? szerepet játszhat a kifejezés valószínűségének meg- 
határozásában. Elegendő tanító adat esetén a VP — VP NP szabály kondicionálható 
Aa beágyazott VP fejére (, enni") és az NP fejére (, banán"). Ezáltal a szókinccsel ellátott 
PCFG-k képesek az n-gram modellek közös előfordulási megszorításai egy részének a 
megragadására, megtartva a CFG-modellek nyelvtani megszorításait. 

A PCFG másik problémája az, hogy erősen preferálja a rövid mondatokat. Egy olyan 
korpuszban, mint a Wall Street Journal, az átlagos mondathossz körülbelül 25 szó. 
Azonban egy PCFG általában úgy végez, hogy viszonylag magas valószínűséget rendel 
olyan szabályokhoz, mint az §— NP VP, az NP — Pronoun és a VP — Verb. Ez azt je- 
lenti, hogy a PCFG viszonylag nagy valószínűséget fog rendelni sok rövid mondathoz, 
mint pl. , ő aludt", azonban a Journalban sokkal valószínűbben találkozunk olyan mon- 
datokkal, mint , Egy megbízható kormányzati forrás jelentése szerint az az állítás, hogy 
aludt, hihető". Úgy tűnik, hogy a Journal mondatai igazából nem környezetfüggetlenek, 
hanem az íróknak van elképzelésük az elvárt mondathosszról, amit fel is használnak lágy 
globális kényszerként a mondatok írásakor. Ezt nehéz visszatükrözni egy PCFG-ben. 


PCFG-valószínűségek tanulása 


Egy PCFG-modell létrehozásához a CFG konstrukciójának összes nehézségével 
szembesülünk, ehhez hozzátevődik még az egyes szabályok valószínűséggel való 
ellátása. Ez azt sugallja, hogy a nyelvtan adatokból való tanulása (learning) haszno- 
sabb lehet, mint a tudásmérnöki megközelítés. Csakúgy, mint a beszédmegértés ese- 
tén is, kétféle adat áll rendelkezésre: elemzett és nem elemzett. A feladat sokkal egy- 
szerűbb, ha az adatok elemzési fáját nyelvészek (vagy legalábbis képzett anyanyelvi 
beszélők) készítették el. Egy ilyen korpusz elkészítése óriási feladat, a legnagyobb 
korpuszok , mindössze" körülbelül egymillió szót tartalmaznak. Az elemzési fa kor- 
Pusz alapján a PCFG-t egyszerűen számlálással (és simítással) készítjük el: minden 
egyes nem záró szimbólumra megnézzük az összes olyan csomópontot, amelynek ez 
a szimbólum a gyökere, és előállítjuk a csomópontok gyermekeinek összes különbö- 
ző kombinációit leíró szabályokat. Például ha az NP szimbólum 100 000-szer fordul 
elő, és ebből 20 000 esetben a gyermekek listája [NP, PP], akkor a következő 
szabályt állítjuk elő: 


NP — NP PP (0,20] 


A feladat sokkal nehezebb, ha csak elemzetlen szöveggel rendelkezünk. Először is két 
problémával szembesülünk: a nyelvtani szabályok struktúrájának és az egyes szabályok 
valószínűségének megtanulásával. (Ugyanezt a megkülönböztetést tesszük neurális há- 
lózatok, valamint Bayes-hálók tanulása esetén is.) 

Pillanatnyilag feltételezzük, hogy a szabályok struktúrája adott, és csak a valószínűsége- 
ket próbáljuk megtanulni. Alkalmazhatunk egy várhatóérték-maximalizálás (expectation— 


94 kifejezés feje a legfontosabb szó, például a főnév a főnévi szerkezetben. 
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maximization, EM) módszert, úgy, mint az RMM-ek tanulásánál. A paraméterek — ame- 
lyeket tanulni próbálunk — a szabály-valószínűségek. A rejtett változók az elemzési fák: 
nem tudjuk, hogy a w;...w; szavakból álló karakterfűzért ténylegesen az X — a szabály 
generálja-e, vagy sem. Az E lépés megbecsüli az egyes részszekvenciák egyes szabályok 
által történő generálásának valószínűségét. Ezután az M lépés megbecsüli az egyes szabá- 
lyok valószínűségét. Az egész számítást el lehet végezni dinamikus programozási módon, 
az ún. belső-kül inside-outside) algoritmussal, ami a HMM tanulás előre-hátra algo- 
ritmusának analógiája. 

A belső-külső algoritmus varázslatosnak tűnik, hiszen elemzetlen szövegekből állít 
elő nyelvtant. Azonban számos hátránnyal rendelkezik. Először is lassú: ahol n a mon- 
datbeli szavak, : pedig a nem záró szimbólumok száma. Másodsorban, a valószínűségi 
hozzárendelések tere nagyon nagy, és a tapasztalatok alapján a lokális maximumokban 
való bennragadás súlyos probléma. Alternatív módszerek — például szimulált lehűtés — 
megpróbálhatók ugyan, de ezek még nagyobb számításigényűek. Harmadsorban, a ka- 
pott nyelvtanok által elvégzett elemzések gyakran nehezen érthetők, és nem elégítik ki 
a nyelvészeket. Ez megnehezíti a manuálisan előállított tudás kombinálását az automa- 
tikus indukcióval. 






PCFG-szabálystruktúrák tanulása 


Most pedig tételezzük fel, hogy a nyelvtani szabályok struktúrája nem ismert. Az első 
probléma, amivel szembesülünk, az, hogy a lehetséges szabályhalmazok tere végtelen, 
azaz nem tudjuk, hogy hány szabályt vegyünk figyelembe, és azt sem, hogy az egyes 
szabályok milyen hosszúak lehetnek. A probléma egyik lehetséges megkerülése az, 
hogy a nyelvtani szabályokat Chomsky normál alakban (Chomsky normal form) 
tanuljuk, ami azt jelenti, hogy minden szabály a következő két alak egyike lehet: 


XGYZ 
Xot 


ahol X, Y és Z nem záró, míg t záró szimbólum. Minden környezetfüggetlen nyelvtant 
át lehet írni Chomsky normál alakra, amely pontosan ugyanazt a nyelvet fogadja el. Ez- 
után önhatalmúlag n nem záró szimbólumra szorítkozhatunk, ezáltal n? -- ny szabályt 
kapunk, ahol v a záró szimbólumok száma. A gyakorlatban ez a módszer csak kis nyelv- 
tanok esetén bizonyult hatékonynak. A bayesi modellösszevonás (Bayesian model 
merging) alternatív megközelítés hasonló a SEOUITUR modellhez (lásd 22.8. alfejezet). 
A módszer mondatonkénti lokális modellek (nyelvtanok) építésével kezd, majd a mini- 
mális leíróhossz felhasználásával összevonja a modelleket. 


23.2. INFORMÁCIÓKERESÉS 


Az információkeresés (information retrieval) feladata olyan dokumentumok megta- 
lálása, amelyek relevánsak a felhasználó információigényére nézve. Az információ- 
kereső rendszerek legjobban ismert példái a világháló keresőgépei. A felhasználó 
megadhat egy lekérdezést — mint például IMI-könyv] — a keresőgépnek, majd megnéz- 
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heti a releváns oldalak listáját. Ebben az alfejezetben bemutatjuk, hogyan épülnek fel 
ezek a rendszerek. Egy információkereső (ezentúl IR-) rendszer a következő módokon 
jellemezhető: 


s  Dokumentumgyűjtemény. Minden rendszernek el kell döntenie, hogy mit kezel 
dokumentumként: egy bekezdést, egy oldalt vagy egy többoldalas szöveget. 

s  Lekérdezőnyelven megadott kérdés. A lekérdezés (guery) írja le, hogy a felhasz- 
náló mit szeretne megtudni, A lekérdezőnyelv (guery language) lehet egyszerűen 
szavak listája (pl. (MI-könyv]); vagy meg lehet adni egymás mellett álló szavakból 
álló kifejezést (pl. (,.MI-könyv"]); logikai operátorokat tartalmazhat (pl. IMI ÉS 
könyv]), nem logikai operátorokat (például (MI KÖZELBEN könyv] vagy (MI könyv 
CÍM:www.aaai.org]) foglalhat magában. 

s  Eredményhalmaz. Ez a dokumentumok azon részhalmaza, amit az IR a keresés 
alapján relevánsnak (relevant) ítél. Relevánson azt értjük, hogy valószínűleg hasz- 
nos lesz a kérdést feltevő személy számára, arra a bizonyos információigényre, ame- 
lyet a lekérdezésben fogalmazott meg. 

" Az eredményhalmaz megjelenítése. Ez lehet olyan egyszerű, mint a dokumentum- 
címek rendezett rangsorolt listája, vagy olyan bonyolult, mint az eredményhalmaz 
háromdimenziós térbe vetített, forgó színes térképe. 


Az előző fejezet elolvasása után gondolhatunk arra, hogy egy információkereső rend- 
szert úgy is felépíthetünk, hogy a dokumentumhalmazt elemzés után leképezzük logikai 
mondatok tudásbázisába, majd elemezzük a kérdéseket, és MEGKÉRDEZ-zük a tudásbá- 
zist, hogy a válaszokat megkapjuk. Sajnos senkinek sem sikerült így működő, nagy- 
méretű IR-rendszert készítenie. Egyszerűen túl bonyolult olyan szókincset és nyelvtant 
építeni, amely képes nagy dokumentumhalmazokat lefedni, így minden IR-rendszer 
egyszerűbb nyelvi modellt használ. 

A legkorábbi IR-rendszerek a Boole-kulcsszó modell (Boolean keyword model) sze- 
rint működtek. A dokumentumgyűjtemény minden egyes szavát úgy kezelik, mint egy 
Boole-tulajdonságot, amely igaz, ha a szó előfordul a dokumentumban, és hamis, ha nem. 
Azaz a , visszakeresés" tulajdonság igaz erre a fejezetre, de hamis a 15. fejezetre. A le- 
kérdezőnyelv a tulajdonságok feletti logikai kifejezések nyelve. Például az [információ- 
keresés ÉS lekérdezés] lekérdezés igaz erre a fejezetre, de nem igaz a 15. fejezetre. 

Ez a modell rendelkezik azza! az előnnyel, hogy könnyű elmagyarázni és megvaló- 
sítani. Azonban rendelkezik néhány hátránnyal is. Először, a dokumentum relevan- 
ciája egyetlen bit, így nincs semmilyen iránymutatás arra, hogy hogyan rendezzük a 
megjelenítés során a releváns dokumentumokat. Másodszor, a logikai kifejezések szo- 
katlanok lehetnek a nem programozó vagy nem logikával foglalkozó felhasználók 
számára. Harmadszor, még egy gyakorlott felhasználó számára is nehéz lehet a meg- 
felelő lekérdezést megfogalmazni. Tételezzük fel, hogy az finformációkeresés ÉS mo- 
dellek ÉS optimálás] kérdést tesszük fel, és üres eredményhalmazt kapunk vissza. 
Megpróbálhatjuk az finformációkeresés VAGY modellek VAGY optimálás]) lekérde- 
zést, azonban ha túl sok eredményt ad vissza, akkor nehéz megmondani, mit kell utá- 
na kipróbálni. 

A legtöbb IR-rendszer a szavak előfordulási statisztikájára (és esetleg más alacsony 
szintű jellemezőkre) épít. Bemutatunk egy valószínűségi keretrendszert, amely jól il- 
leszkedik a tárgyalt nyelvi modellekhez. Az alapötlet az, hogy egy adott lekérdezéshez 
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meg akarjuk találni azokat a dokumentumokat, amelyek relevánsak. Más szavakkal, ki 
akarjuk számolni a: 


P(R — igaz] D, 0) 


értéket, amelyben D a dokumentum, () a lekérdezés, R pedig egy véletlen logikai változó, 
amely a relevanciát fejezi ki. Ha meghatároztuk ezt az értéket, alkalmazhatjuk a valószí- 
nűségi rendezési elvet, amely szerint amennyiben be kell mutatnunk az eredményhalmazt, 
akkor azt csökkenő valószínűségű relevancia szerint kell tennünk. 

Számos lehetőség létezik a P(R — igaz] D, 0) együttes eloszlás dekomponálására. Itt az 
ún. nyelvi modellezés (language modeling) megközelítést fogjuk bemutatni, amely min- 
den egyes dokumentumra egy nyelvi modellt becsül, majd az adott dokumentum nyel- 
vi modellje alapján minden egyes lekérdezésre kiszámítja a lekérdezés valószínűségét. 
Az R — igaz érték jelölésére r-t használva, a következő alakra írhatjuk át a valószínűséget: 


PGID, 9) — RCD, OlnPG/PD, 9) (a Bayes-szabály alapján) 
— P(2, DIDPOIDP(/PP(D, 9) (a láncszabály alapján) 
7 aP(OID, )P(rID)/P(D, 9) (a Bayes-szabály alapján, rögzített D-re) 


Azt mondtuk, hogy a P(rID, 0) értékét akarjuk maximalizálni, azonban ezzel ekvivalens, 
ha a PrrID, 9)/P(-r]D, 9) valószínűségi arányt maximalizáljuk. Azaz a dokumentumo- 
kat a következő pontszám alapján rangsorolhatjuk: 


PrIDO) — P(OIDIDPEID) 
PCrID.2)  P(OJD,-NPC-r]D) 


Ennek az az előnye, hogy kiküszöböli a P(D, 0) tagot. Most pedig feltételezzük, hogy 
az irreleváns dokumentumokra a dokumentum független a lekérdezéstől. Más szavak- 
kal, amennyiben egy dokumentum irreleváns egy adott lekérdezésre, akkor a dokumen- 
tum ismerete nem fog segíteni a lekérdezés meghatározásában. Ezt a lekérdezést 
a következő egyenlet írja le: 

P(D., Ol-p) z P(DI-nP0]-n 
Ezzel a feltételezéssel azt kapjuk, hogy: 

PGIDO) P(OID,D)x P(rID) 

PCrID.9) Pc-rlD) 
A P(rID)/P(-rID) tényező a dokumentum relevanciájának lekérdezésfüggetlen való- 
színűsége. Ez a dokumentum minőségének mértéke: egyes dokumentumok bármely 
lekérdezéshez relevánsak, mert a dokumentum egyszerűen magas színvonalú. Akadé- 
miai környezetben született folyóiratcikkek esetén a relevancia a hivatkozások száma 
alapján becsülhető, míg weboldalak esetén az oldalra mutató hiperhivatkozások számát 
használhatjuk. Minden esetben nagyobb súlyt adhatunk azoknak a hivatkozásoknak, 
amelyek maguk is magas színvonalúak. A dokumentum kora szintén szerepelhet a le- 
kérdezésfüggetlen relevancia becslésében. 

Az első tényező — a P(OJD, r) — a lekérdezés valószínűsége, feltéve egy adott releváns 
dokumentumot. Hogy megbecsülhessük ezt a valószínűséget, egy nyelvi modellt kell 
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választanunk, amely megadja, hogy milyen kapcsolatban állnak a lekérdezések a rele- 
váns dokumentumokkal. Az egyik népszerű választás a dokumentumok unigram szómo- 
dellel történő reprezentálása. Ez az információkeresésben úgy is ismert, mint a szózsák 
(bag of words) modell, mivel a szavak dokumentumon belüli előfordulási gyakorisága 
az, ami számít, nem a sorrendjük. Ebben a modellben a , man bites dog" és a , dog bites 
man? (nagyon rövid) dokumentumok azonosan fognak viselkedni. Világos, hogy eltérő 
jelentésűek, azonban az is igaz, hogy mindketten relevánsak a kutyákat és a harapásokat 
tartalmazó lekérdezésekre. Ezek után, hogy kiszámolhassuk egy lekérdezés valószínűsé- 
gét egy adott dokumentum esetében, egyszerűen össze kell szoroznunk a lekérdezésben 
található szavak valószínűségeit a dokumentum unigram modellnek megfelelően. Ez a 
lekérdezés naiv Bayes- (naive Bayes) modellje. 0/vel jelölve a lekérdezés j-edik sza- 
vát, azt kapjuk, hogy: 
PAD, )—]T[P(O;ID.r) 
j 
Ez lehetővé teszi a következő egyszerűsítést: 
PrID,9) P(CD) 
PCIID,) CD) 

Végre készen állunk, hogy ezeket a matematikai modelleket egy példára alkalmazzuk. 
A 23.4. ábra a (Bayes informational retrieval model] ([Bayes információkeresés mo- 
dell)) lekérdezés szavainak ennek a könyvnek öt kiválasztott fejezetéből álló doku- 
mentumgyűjtemény feletti unigram statisztikáját adja meg. Feltesszük, hogy a fejezetek 
azonos minőségűek, így csak azt kell kiszámolnunk, hogy mennyi a lekérdezés valószí- 


nűsége az adott dokumentum esetén, minden egyes dokumentumra. Két alkalommal 
tesszük ezt meg, egyszer egy D; simítatlan maximum-likelihood becslővel, majd egy Dj 
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Szavak Lekérdezés] 1. fejezet 13. fejezet 15. fejezet [ 22. fejezet ] 23. fejezet 
Bevezetés ] Bizonytalanság Idő NLP Aktuális 
Bayes 1 5 32 38 0 7 
information 1 15 18 8 12 39 
retrieval 1 1 1 o o 17 
model 1 A 7 160 9 63 
N 4 14 680 10941 18 186 16 397 12574 
PAD?) USxz10M] 282 1078 0 01 1.2. x 10711 
POD P 41x10-M] 70x 1075] 5.2 x 1078] 17 x 1075] 15 x 10-11 





























23.4. ábra. A [Bayes information retrieval model] lekérdezés- valószínűségi IR-modellje a könyv első öt 
fejezetét tartalmazó dokumentumgyűjtemény felett. Megadjuk a szógyakoriságot mindegyik dokumen- 
tum-szó párra, és a szavak számát (N) az összes dokumentumra. Két dokumentummodelit atkatmazunk, 
D; az i-edik dokumentumon alapuló simítatlan unigram szómodell, míg D/ ugyanaz a modell adj-hozzá- 
egyet simítással, majd kiszámítjuk a lekérdezés valószínűségét minden dokumentumra mindkét model- 
lel. A jelen (23.) fejezet az egyértelmű győztes, mindkét modell esetén több mint kétszázszor valószí- 
nűbb, mint bármely más dokumentum. 


10 Egy kutya megharapott egy embert", illetve ,egy ember megharapott egy kutyát", jellemző újságcím- 
stílus. (A ford.) 
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adj-hozzá-egyet simító becslőjű modellel. Azt tételeznénk fel, hogy egy ilyen keresésénél 
ez a fejezet lesz elsőnek rangsorolva, és valóban ez így is van mindkét modell szerint. 

A simított modell rendelkezik azzal az előnnyel, hogy kevésbé érzékeny a zajra, és 
hogy nemzérus relevancia-valószínűséget képes rendelni olyan dokumentumokhoz, 
amelyek nem tartalmazzák az összes szót. A simítatlan modellnek az az előnye, hogy 
könnyű sok dokumentumot tartalmazó gyűjteményekre kiszámolni: ha elkészítünk egy 
olyan indexet, amely megadja, hogy az adott szót mely dokumentumok tartalmazzák, 
akkor gyorsan elő tudjuk állítani az eredményhalmazt ezeknek a listáknak a metszete- 
ként, és a P(OID;) értékeket csak a metszetben szereplő dokumentumokra kell kiszá- 
molni, nem pedig mindegyikre. 


Az IR-rendszerek értékelése 


Honnan tudjuk, hogy egy IR-rendszer jól teljesít? Elvégzünk egy kísérletet, amelyben 
a rendszer kap egy lekérdezéshalmazt, az eredményhalmazokat pedig pontozzuk az em- 
beri relevanciamegítélés szerint. Tradicionálisan két mértéket használunk a pontozásra: 
a felidézést (recall) és pontosságot (precision). Ezeket egy példán keresztül fogjuk be- 
mutatni. Képzeljük el, hogy egy IR-rendszer visszaadott egy eredményhalmazt egy 
olyan lekérdezésre, amelyre tudjuk, hogy egy 100 dokumentumot tartalmazó korpusz- 
ból mely dokumentumok relevánsak, és melyek nem. Az egyes kategóriákba tartozó 
dokumentumok számát az alábbi táblázat adja meg: 














f. Az eredményhalmazban ] — Nem az eredményhalmazban "" ] 
Releváns 30 20 ] 
Nem releváns 10 40 ] 











A pontosság az eredményhalmaz dokumentumai közül a ténylegesen relevánsak ará- 
nyát méri. A példánkban a pontosság 30/(30 -- 10) — 0,75. A hamis pozitív arány 1— 0,75 
— 0.25. A felidézés a gyűjtemény releváns dokumentumaiból az eredményhalmazban 
megjelenő hányadát méri. A példánkban a felidézés 30/(30 -- 20) — 0,60. A hamis nega- 
tív arány 1 - 0,60 — 040. Egy nagyon nagy dokumentumgyűjteményben, mint például a 
világhálón, a felidézés nehezen számítható, mivel nincs egyszerű módszer a web összes 
oldalának a relevancia szempontjából történő elemzésére. A legjobb, amit tehetünk, a fel- 
idézés becslése mintavételezéssel, vagy pedig teljesen figyelmen kívül hagyjuk a fel- 
idézést, és csak a pontosság alapján ítélünk. 

A rendszer kompromisszumot köthet a pontosság és felidézés között. Extrém esetben 
a rendszer visszaadhatja az összes dokumentumot a dokumentumgyűjteményből az ered- 
ményhalmazban, 10096-os felidézést garantálva, azonban a pontossága kicsi lesz. Alter- 
natívaként, a rendszer visszaadhat egyetlen dokumentumot, így a felidézés alacsony lesz, 
azonban tűrhető esélye van 10096-os pontosságra. A kompromisszum összefoglalásának 
egyik lehetséges módja az ROC-görbével (ROC curve) történhet. Az ,ROC" a , vevő 
működési karakterisztika" (receiver operating characteristics) rövidítése (ami nem 
túlzottan felvilágosító név). Ez egy olyan grafikon, amely a hamis negatív arányt méri az 
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y tengelyen és a hamis pozitív arányt az x tengelyen, ábrázolva az egyes kompromisszu- 
mos pontokat. A görbe alatti terület az IR-rendszer hatékonyságának összefoglalása. 

A felidézést és pontosságot akkor definiálták, amikor az IR-kereséseket elsődlegesen 
könyvtárosok végezték, akik alapos, pontos találatokban voltak érdekeltek. Manapság 
a legtöbb (napi több százmillió) lekérdezést az internetfelhasználók végzik, akik kevés- 
bé érdekeltek az alaposságban, sokkal inkább abban, hogy azonnal választ kapjanak. 
Számukra jó mérték az első releváns találat átlagos reciprokrangja (reciprocal rank). 
Azaz, amennyiben a rendszer első találata releváns, 1-es pontszámot kap a lekérdezésre, 
és amennyiben az első kettő nem releváns, de a harmadik az, akkor 1/3-ot. Egy alterna- 
tív mérték a válaszidő (time to answer), ami azt méri, hogy mennyi ideig tart a fel- 
használónak a problémára kívánt választ megtalálni. Ez kerül a legközelebb ahhoz, 
amit mérni szeretnénk, azonban azzal a hátránnyal rendelkezik, hogy minden egyes 
kísérlethez új emberi tesztalanycsoportra van szükség. 


Az IR-rendszerek továbbfejlesztése - 


Az unigram modell az összes szót függetlenként kezeli, azonban mi tudjuk, hogy bizo- 
nyos szavak korreláltak: a , dívány" közeli kapcsolatban áll mind a , díványok"-kal, mind 
a ,kanapé"-val. Számos IR-rendszer próbálja figyelembe venni ezeket a korrelációkat. 

Például, amennyiben a lekérdezés [dívány], gyalázatos lenne kihagyni az eredmény- 
halmazból azokat a dokumentumokat, amelyek a , DÍVÁNY" vagy a , díványok" sza- 
vakat tartalmazzák, de a , dívány"-t nem. A legtöbb IR-rendszer kisbetű-nagybetű 
konverziót (case folding) alkalmaz, hogy a , DÍVÁNY"-t , dívány" alakká alakítsa, 
számos rendszer pedig szótövesítő (stemming) algoritmusokat, hogy a , díványok" ala- 
kot a , dívány" szótőre redukálja. Ez tipikusan a felidézés kismértékű növekedését ered- 
ményezi (az angol nyelv esetén kb. 299-ot). Azonban ronthatja a pontosságot. Például 
a ,stocking" szótövesítése , stock"! alakra valószínűleg csökkenteni fogja a ruházati, 
valamint pénzügyi eszközökre irányuló lekérdezések pontosságát, azonban növelheti a 
raktározásra irányuló lekérdezések felidézését. Szabályalapú szótövesítők (például az 
sing" végződés eltávolítása az angolban) nem képesek megkerülni ezt a problémát, de 
a szótárakon alapuló újabb algoritmusok igen (nem kell eltávolítani az ,-ing" képzőt, 
ha a szó már szerepel a szótárban). Bár az angol nyelv esetén a szótövesítésnek csak kis 
hatása van, sokkal fontosabb más nyelvek esetén. A német nyelvben gyakran találkoz- 
hatunk olyan szavakkal, mint , Lebensversicherungsgesellschattsangestellter" (életbiz- 
tosító cég alkalmazottja). Az olyan nyelvek, mint a finn, a török, az inuit vagy a jupik 
rekurzív morfológiai szabályokkal rendelkeznek, amelyek elméletileg korlátlan hosszú- 
ságú szavakat generálnak. 

A következő lépés a szinonimák (synonyms) felismerése, mint amilyen a , dívány" 
és a ,kanapé". A szótövesítéshez hasonlóan ez is a felidézés kismértékű növekedését 
eredményezheti, azonban a pontosságot veszélyezteti, ha túl agresszíven alkalmazzuk. 
Akik Tim Couch futballistára kíváncsiak, nem szeretnének átvergődni a kanapékról 
(couch — kanapé) szóló dokumentumokon. Az a probléma, hogy ,,a nyelv ugyanúgy ir- 
tózik az abszolút szinonimáktól, mint ahogy a természet retteg a vákuumtól" (Cruse, 


1 Harisnya, illetve raktárkészlet. (A ford.) 
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1986). Azaz, amennyiben két szó azonos dolgot jelent, a nyelv beszélői törekednek 
a jelentés módosítására, hogy megszüntessék a zűrzavart. 

Számos IR-rendszer bizonyos mértékig szó bigramokat használ, azonban csak néhá- 
nyuk valósít meg egy teljes valószínűségi bigram modellt. A helyesírás-javító (spelling 
correction) eljárások alkalmazhatók mind a dokumentumok, mind a lekérdezések hibái- 
nak javítására. 

Végső finomításként az IR-rendszerek tökéletesíthetők metaadatok (metadata) figye- 
lembevételével, amelyek a dokumentum szövegén kívül álló adatok, mint például embe- 
rek által megadott kulcsszavak vagy dokumentumok közötti hypertext-hivatkozások. 


Az eredményhalmaz prezentálása 


A valószínűségi rendezési elv szerint vegyünk egy eredményhalmazt, és a relevancia 
valószínűségének megfelelően sorba rendezve prezentáljuk a felhasználónak. Ennek 
akkor van értelme, ha a felhasználó az összes releváns dokumentum minél hamarább 
történő megtalálásban érdekelt. Azonban bajba kerül, mert nem veszi figyelembe 
a hasznosságot. Például ha a legrelevánsabb dokumentum két példányban szerepel a 
gyűjteményben, akkor az első megnézése után a második azonos relevanciájú, de zérus 
hasznosságú. Számos IR-rendszer rendelkezik mechanizmusokkal, amelyek eliminál- 
ják az előző találatokhoz túlzottan hasonlító eredményeket. 

Az IR-rendszerek teljesítménynövelésének egyik leghatékonyabb módja a relevan- 
cia-visszacsatolás (relevance feedback), amely a felhasználó visszajelzése, hogy az 
eredeti eredményhalmazból mely dokumentumok voltak relevánsak. A rendszer ezután 
egy második eredményhalmazt prezentálhat, amelynek dokumentumai hasonlók a meg- 
adottakhoz. 

Egy másik lehetséges megközelítés az eredményhalmaznak egy rendezett lista he- 
lyett egy címkézett faként történő prezentálása. A dokumentumosztályozás (document 
classification) során az eredményeket egy előre definiált témakör-taxonómiának megfe- 
lelően osztályozzuk. Például újsághírekből álló gyűjteményt a következő kategóriákba 
lehet sorolni: külföldi, belföldi, üzleti hírek, szórakozás és sport. Dokumentumklaszte- 
rezés (document ciustering) esetén minden eredményhalmazra teljesen új kategóriafa 
készül. Az osztályozás akkor használható, ha a gyűjteményben kevés számú témakör 
található, míg a klaszterezést a világhálóhoz hasonló széles körű gyűjtemények esetén 
érdemes használni. Mindkét esetben, miután a felhasználó megad egy lekérdezést, az 
eredményhalmazt a kategóriáknak megfelelő mappákba rendezve kapja meg. 

Az osztályozás felügyelt tanítási probléma, és mint ilyen, a 18. fejezetben ismerte- 
tett bármelyik módszerrel megtámadható. Az egyik népszerű megközelítés a döntési 
fák alkalmazása. Amennyiben rendelkezünk a megfelelő kategóriákkal címkézett doku- 
mentumokból álló tanító halmazzal, építhetünk egyetlen döntési fát, amelynek levelei 
a dokumentumot a megfelelő kategóriához rendelik. Ez akkor működik jól, ha mind- 
össze néhány kategória van; nagyobb kategóriahalmazok esetén minden egyes kategó- 
riára külön döntési fát építünk, amelynek a levelei megadják, hogy a dokumentum az 
adott kategóriába tartozik-e vagy sem. Általában az egyes csomópontokban tesztelt tulaj- 
donságok egyedi szavak. Például a , Sport" kategóriában az egyik csomópont tesztelheti 
a , kosárlabda" szó meglétét. Javított teljesítményű döntési fák, naiv Bayes-modellek, 
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valamint szupport vektor gépek mindegyikét használták szövegosztályozásra, sok eset- 
ben a hitelesség 90-9892-os volt bináris osztályozás esetén. 

A klaszterezés egy felügyelet nélküli tanítási módszer. A 20.3. alfejezetben láthattuk, 
hogy hogyan alkalmazható az EM algoritmus a klaszterezés eredeti becslésének javításá- 
ra, Gauss-modellek keverékét használva. A dokumentumok klaszterezése nehezebb fel- 
adat, mert nem tudjuk, hogy az adatokat egy barátságos Gauss-modell generálta-e, és mert 
egy sokkal több dimenziós térrel kell elbánnunk. Számos megközelítést dolgoztak ki. 

Az agglomeratív klaszterezés (agglomerative ciustering) klaszterekből álló fát épít, 
lemenve egészen az egyedi dokumentumok szintjére. A fa bármely szinten nyeshető, 
hogy kevesebb kategóriát kapjunk, de ezt az algoritmuson kívül vesszük figyelembe. 
Az elején minden dokumentumot külön klaszternek tekintünk. Ezután megkeressük azt 
a két klasztert, melyek egy bizonyos távolságmérték szerint legközelebb állnak egymás- 
hoz, és összevonjuk őket. Addig ismételjük a folyamatot, amíg csak egy klaszter ma- 
rad. A két dokumentum távolságát meghatározó mérték a dokumentumok szavai közti 
átfedés valamilyen mértéke. Például reprezentálhatjuk a dokumentumot szógyakorisá- 
gok vektoraként, ahol a távolságot a két vektor euklideszi távolságaként értelmezzük. 
Két klaszter távolsága a klaszterek mediánjainak távolságaként értelmezhetjük, vagy 
a klaszterek elemeinek átlagos távolságát vehetjük figyelembe. Az agglomeratív klasz- 
terezés időigénye O(11?), ahol n a dokumentumok száma. 

A k-közép klaszterezés (k-means ciustering) pontosan k darab kategória halmazát 
állítja elő. A következő elven működik: 


1. Vegyünk véletlenszerűen k dokumentumot a k kategória reprezentálására. 

2. Rendeljünk minden dokumentumot a legközelebbi kategóriához. 

3. Számoljuk ki minden egyes kategória átlagát, és használjuk a k átlagot a k kategóriák 
új értékeinek reprezentálására. 

4. Ismételjük a 2-es és 3-as lépéseket, amíg konvergálnak. 


A k-közép módszer 0(n) időigényű, ez az egyetlen előnye az agglomeratív klasztere- 
zéshez képest. Általában kevésbé pontos, mint az agglomeratív klaszterezés, bár egyesek 
szerint majdnem olyan hatékony (Steinbach és társai, 2000). 

Az alkalmazott klaszterezési módtól függetlenül van még egy feladat, amit el kell végez- 
nünk, mielőtt a klaszterezést az eredményhalmaz bemutatására használhatjuk: a klaszter jó 
leírásának megtalálása. Az osztályozás esetén a kategóriák előre definiáltak (például , jöve- 
delmek"), míg a klaszterezés esetén ki kell találnunk a kategórianeveket. Az egyik válasz- 
tás a klaszter szempontjából reprezentatív szavak listájának használata. A másik lehetőség 
a klaszter középpontjához közel levő egyik dokumentum címének a használata. 


Az IR-rendszerek megvalósítása 


Az eddigiekben csupán absztrakt módon definiáltuk az IR-rendszerek működését, azonban 
nem magyaráztuk el, hogy hogyan lehet olyan hatékonnyá tenni őket, hogy egy webes ke- 
resőgép visszaadhassa a legfelső találatokat egy több milliárd oldalas gyűjteményből egy- 
tized másodperc alatt. Minden IR-rendszer számára két kulcsfontosságú adatstruktúra 
szükséges: a szókincs, amely felsorolja a dokumentumok szavait, és az invertált index, 
amely megadja, hogy az egyes szavak hol szerepelnek a dokumentumgyűjteményben. 
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A szóklnes (lexicon) egy olyan adatstruktúra, amely egy műveletet támogat: megad- 
ja, hogy egy adott szó hol szerepel az invertált indexben, amely a szó előfordulásait tá- 
rolja. Egyes megvalósítások esetén azt is visszaadja, hogy összesen hány dokumentum 
tartalmazza a szót. A szókincset hash-tábla vagy valamilyen hasonló adatstruktúrával 
ajánlott megvalósítani, amely lehetővé teszi a gyors kikeresést. Egyes esetekben kis in- 
formációtartalmú gyakori szavakat kihagynak a szókincsből. Ezek a tiltólistás szavak 
(stop words) (például , a", ,egy", ,ez" stb.) helyet foglalnak az indexben, és nem javít- 
ják az eredmény rangsorolását. Az egyetlen jó indok arra, hogy mégis megtartsuk őket 
a szókincsben a kifejezéslekérdezést támogató rendszerek esetén áll fenn: a tiltólistás 
szavak szókincsbeli tárolása szükséges olyan lekérdezések kiszolgálására, mint pl. a , to 
be or not to be",!2 

Az invertált index ? (inverted index), a könyvünk végén található szójegyzékhez 
hasonlóan, találati listák (hit lists) halmazából — az egyes szavak előfordulási helyei- 
ből — áll. A Boole-kulcsszó modell esetén a találati lista nem más, mint a dokumentu- 
mok listája. Az unigram modell esetén egy (dokumentum, gyakoriság) párokat tartal- 
mazó lista. A kifejezéslekérdezés támogatásához a találati listának az adott szó minden 
egyes dokumentumon belüli előfordulási helyeit is tartalmaznia kell. 

Amennyiben a lekérdezés egyetlen szó (Silverstein szerint ilyen az esetek 2699-a 
(Silverstein és társai, 1998)), akkor a feldolgozás igen gyors. Egyszerűen kikeressük a 
szót a szókincsből, hogy megkapjuk a találati lista címét, majd egy üres prioritási sort 
hozunk létre. Ezután egyesével végigmegyünk a találati lista dokumentumain, és meg- 
nézzük a szó gyakoriságát a dokumentumban. Amennyiben a prioritási sor R-nél keve- 
sebb elemet tartalmaz (ahol R az eredményhalmaz elvárt mérete), akkor hozzáadjuk a 
(dokumentum, gyakoriság) párt a sorhoz. Ellenkező esetben, ha a gyakoriság nagyobb, 
mint a prioritási sor legkisebb elemének gyakorisága, akkor töröljük a legkisebb elemet, 
és hozzáadjuk az új (dokumentum, gyakoriság) párat. Ezáltal a lekérdezés megválaszo- 
lása O(H -- R logR) időt vesz igénybe, ahol a találati Hista dokumentumainak száma. 
Amennyiben a lekérdezés n szót tartalmaz, akkor /i találati listát kell összevonni, ami 
O(nH -- R logR) időt vesz igénybe. 

Azért mutattuk be az IR-rendszerek elméletét a valószínűségi modellen keresztül, 
mert ez a modell hasznosítja azokat az ötleteket, amelyeket más témákban is alkalmaz- 
tunk. A jelenlegi gyakorlati IR-rendszerek sokkal inkább egy másik megközelítést alkal- 
maznak, amelyet vektortér modellnek (vector space model) hívunk. Ez a modell ugyan- 
úgy a szózsák-megközelítést alkalmazza, mint a valószínűségi modell. Minden egyes 
dokumentumot unigram szógyakoriságok vektoraként ábrázolunk. A lekérdezést is így 
ábrázoljuk, például a [Bayes information retrieval model) lekérdezést a 


[0,..., 1. 0, ..., 1, 0, ..., 1, 0, ..., 1, 0, ...) 


vektor írja le, amelyben az ötlet az, hogy minden egyes szóhoz külön dimenzió tarto- 
zik, és a lekérdezés vektorában minden dimenzió 0 értékű, kivéve azt a négy szót, 
amely a lekérdezésben előfordul. A releváns dokumentumokat úgy kapjuk meg, hogy 


12 enni . 
lenni vagy nem lenni (A ford.) 
Az sinventált index" kifejezés redundáns, sokkal jobb lenne egyszerűen az , index" kifejezést használni. 
Azért invertált, mert más sorrendben van, mint a szöveg szavai, de ilyen minden index. Azonban az , invertált 
index" a hagyományos IR-kifejezés. 
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megkeressük azokat a dokumentumokat, amelyek a lekérdezés vektorának legközeleb- 
bi szomszédai a vektortérben. A hasonlóság egyik lehetséges mértéke a lekérdezés- és 
dokumentumvektor skaláris szorzata: minél nagyobb ez a szorzat, annál közelebb van 
egymáshoz a két vektor. Algebrailag ez a mérték nagy pontszámot ad azoknak a szavak- 
nak, amelyek mind a dokumentumokban, mind a lekérdezésben gyakran előfordulnak. 
Geometriailag a két vektor skaláris szorzata az általuk bezárt szög koszinusza, azaz ha 
két ilyen vektor koszinuszát maximalizáljuk (amennyiben azonos kvadránsban találha- 
tók), akkor az általuk bezárt szög nullához közeli lesz. 

A vektortér modell ennél sokkal többre képes. A gyakorlatban számos jellemzővel, 
finomítással, javítással és kiegészítéssel lett kibővítve. Az az alapötlet, miszerint a do- 
kumentumokat a vektortérbeli hasonlóságuk alapján lehet rangsorolni, lehetővé teszi, 
hogy új ötleteket építsünk be a numerikus sorrendező rendszerbe. Egyesek azt állítják, 
hogy a valószínűségi model! ezeket a módosításokat sokkal tisztább elvi alapokon állva 
tenné lehetővé, azonban az IR-kutatók nem fognak váltani, amíg nem látnak egyértelmű 
teljesítményjavulást a másik modellhez képest. 

Hogy egy átlagos IR-feladat indexelési problémájának nagyságrendjét érzékeltessük, 
vegyünk egy szabványos TREC (Text REtrieval Conference — Szöveg-visszakeresési 
Konferencia) dokumentumgyűjteményt, amely 750 ezer dokumentumot tartalmaz, ösz- 
szesen 2 GB (gigabájt) szöveggel. A szókincs körülbelül 500 ezer szót tartalmaz, szó- 
tövesítés és kisbetű-nagybetű konverzió után; ennyi szó tárolása 7 és 10 MB közötti 
tárterületet igényel. Az invertált index a (dokumentum, gyakoriság) párokkal 324 MB 
területet igényel, bár tömörítési technikák alkalmazásával csak 83 MB-ot. A tömörítés 
tárhelyet takarít meg, a feldolgozási követelmények kismértékű növelése árán. Azon- 
ban ha a tömörítés lehetővé teszi, hogy az egész indexet a memóriában — és nem hát- 
tértáron tároljuk -, akkor jelentős eredő teljesítménynövekedést kapunk. A kifejezés- 
lekérdezés támogatása a tárigényt 1200 MB-ra növeli tömörítetlen, illetve 600 MB-ra 
tömörített esetben. A webes keresőgépek háromezerszer ekkora feladattal dolgoznak. 
A legtöbb probléma az esetükben is hasonló, azonban nem praktikus terabájtnyi 
mennyiségű adatot kezelni egyetlen számítógépen, ezért az indexet k szegmensre vág- 
ják, és minden szegmenst külön számítógép tárol. A lekérdezést mindegyik számítógép 
megkapja, majd a k eredményhalmazt egy eredményhalmazba vonják össze, amelyet 
megjelenítenek a felhasználó számára. A webes keresőgépeknek ráadásul másodper- 
cenként több ezer lekérdezést kel! kiszolgálniuk, így a k számítógép n másolatára van 
szükség. Az idő folyamán k és n folyamatosan növekszik. 


23.3. INFORMÁCIÓKINYERÉS 


Az információkinyerés (information extraction) adatbázis-bejegyzések előállításá- 
nak a folyamata, amely során egy szöveget egy adott osztályba tartozó objektum vagy 
esemény előfordulásait, valamint az objektumok és események közti relációkat keresve 
átfutunk. Megpróbálhatjuk konkrét címek kinyerését weboldalakról, adatbázismezőkkel 
az utca, az állam és az irányítószám számára, vagy konkrét viharok adatainak a kinyeré- 
sét időjárás-jelentésekből, mezőkkel a hőmérséklet, a szélsebesség és a csapadék számá- 
ra. Az információkinyerő rendszerek félúton állnak az információkereső rendszerek és 
a teljes nyelvi elemzők között, hiszen többet kell tenniük, mint egyszerűen szózsáknak 
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tekinteni a dokumentumot, de kevesebbet, mint minden egyes mondat teljes nyelvtani 
elemzését. 

Az információkinyerő rendszerek legegyszerűbb típusát attribútumalapú (attribute- 
based) rendszernek nevezzük, mert feltételezi, hogy a teljes szöveg egy objektumról 
szól, és a feladat ezen objektum attribútumainak kinyerése. Például a 10.5. alfejezetben 
megemlítettük a ,,17 hüvelykes SXGA Monitor mindössze 249,99 $-ért" szövegből az 
alábbi adatbázis-reláció kinyerésének problémáját: 

Am m € SzámítógépMonitorok N Méret(m, Hüvelykí17)) A Ár(m, $(249,99)) 

A Felbontásím, 1280 x 1024) 


Ennek az információnak egy része reguláris kifejezésekkel (regular expression) 
kezelhető, amelyek reguláris nyelvtant definiálnak egy karakterfüzérben. Reguláris ki- 
fejezéseket használnak olyan Unix-parancsokban, mint a grep, olyan programozási 
nyelvekben, mint a Perl, valamint olyan szövegszerkesztőkben, mint a Microsoft Word, 
A részletek eltérők az egyes eszközökben, és legjobban a megfelelő útmutatóból tanul- 
hatók meg, azonban itt bemutatjuk, hogyan lehet reguláris kifejezéseket építeni dollár- 
ban megadott árakra, bemutatva a közös részkifejezéseket: 


(10-91 megfelel bármely 0 és 9 közti számjegynek 

[0-9] 4 megfelel egy vagy több számjegynek 

. [0-9] [0-9] megfelel számjegyek által követett pontnak 

(.(0-9] [0-9]) ? megfelel számjegyek által követett pontnak vagy 
üres füzérnek 

$10-9] 4 (.[0-9)(0-9])? megfelel 249,99 $-nak, vagy 1,23 $-nak, vagy 
1.000 000 $-nak, vagy... 


Az attribútumalapú információkinyerő rendszerek reguláris kifejezések sorozatából 
építhetők fel, ahol minden egyes attribútumhoz egy reguláris kifejezés tartozik. Ha a 
reguláris kifejezés pontosan egyszer illeszkedik a szövegre, akkor kivehetjük a szöveg 
illeszkedő részét, amely az attribútum értéke lesz. Ha nincs illeszkedés, akkor nem 
tudunk mit tenni, azonban ha több illeszkedés is van, akkor szükségünk van egy eljá- 
rásra, hogy hogyan válasszunk közülük. Az egyik megoldás szerint minden egyes attri- 
bútumhoz több reguláris kifejezést rendelünk, prioritás szerint sorba rendezve. Például 
a legnagyobb prioritású árra vonatkozó reguláris kifejezés a dollárjel előtti , ár:" karak- 
terfüzérre kereshet, ha ezt nem találja meg, akkor átlépünk egy kevésbé megbízható 
reguláris kifejezésre. Egy másik stratégia az összes találat kinyerése, majd valamilyen 
módon választani közülük. Például vehetjük azt a legalacsonyabb árat, amely a leg- 
nagyobbnak legalább fele. Ez a megoldás kezelni tudja az olyan szövegeket, mint a 
aListaár 99.00 $, akciós ár 78,00 $, szállítás 3.00 $7. 

Az attribútumalapú rendszereknél eggyel összetettebbek a relációs alapú információ- 
kinyerő rendszerek, amelyeknek több mint egy objektummal kell foglalkozniuk, ráadá- 
sul a köztük levő relációkat ís figyelembe kell venniük. Azaz, amikor egy ilyen rendszer 
a ,249,99 $" szöveget látja, akkor nem csak azt kelt megállapítania, hogy ez egy ár, 
hanem azt ís, hogy mely objektumnak az ára. A FASTUS egy tipikus relációs alapú 
információkinyerő rendszer, amely cégegyesülésekről és felvásárlásokról szóló híreket 
képes kezelni. El tudja olvasni a következő hírt: 
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s.Bridgestone Sports Co. said Friday it has set up a joint venture in Taiwan with a 
local concern and a Japanese trading house to produce golf clubs to be shipped to 
Japan."14 


és egy a következőhöz hasonló adatbázisrekordot tud létrehozni: 


e € VegyesVállalat A Termékte, , Golfütők") A Dátum(e, , Péntek") 
A Entitás(e, , Bridgestone Sports Co.") A Entitás(e, ,egy helyi konszern") 
AN Entitás(e, ,egy japán kereskedőház") 


Relációs információkinyerő rendszereket gyakran építenek kaszkádosított véges álla- 
potú átalakítók (cascaded finite-state transducer) segítségével. Ez azt jelenti, hogy 
egy sor véges állapotú automatából (finite-state automaton, FSA) áll, ahol minden 
egyes automata egy szöveget kap bemenetként, amelyet átalakít egy más formába, majd 
továbbadja a következő automatának. Ez azért megfelelő, mert az egyes véges automaták 
hatékonyak lehetnek, és együtt képesek lehetnek a szükséges információ kinyerésére. 
A FASTUS egy tipikus rendszer, amely a következő öt fokozatból áll: 


Tokenizálás 

Komplex szavak kezelése 
Alapcsoport-kezelés 
Komplex kifejezések kezelése 
Siruktúra-összevonás 


auappe 


A FASTUS első lépése a tokenizálás (tokenization), amely a karakterfüzéreket tokenekbe 
(szavak, számok és írásjelek) szegmentálja. Az angol nyelv esetén a tokenizálás elég egy- 
szerű lehet, pusztán a szóközök (white space) vagy írásjelek mentén történő szegmentálás 
viszonylag jó hatékonyságú. A japán nyelv esetén a tokenizálásnak szegmentálást kell 
végeznie, valami olyasmit használva, mint a Viterbi algoritmus (lásd 23.1. ábra). Egyes 
tokenizálók az olyan jelölőnyelveket is kezelik, mint a HTML, az SGML és az XML. 

A második lépés komplex szavak (complex words) kezelése, ideértve az olyan szó- 
kapcsolatokat, mint a , set up" és a , joint venture", valamint olyan tulajdonneveket, 
mint a , Prime Minister Tony Blair " és a , Bridgestone Sports Co.".!5 Ezeket szótárbe- 
jegyzések és véges állapotú nyelvtani szabályok kombinációjaként ismeri fel. Például 
egy cégnevet a közvetkező szabállyal lehet felismerni: 


NagybetűvelkezdődőSzó -k (, Company" ] , Co" ] Inc" [ Ltd") 


A szabályokat gondosan kell megalkotni, majd ellenőrizni kell a felidézést és a pontos- 
ságot. Az egyik kereskedelmi rendszer az , Intel Chairman Andy Grove""6 szöveget 


személy helyett helyként ismerte fel, az egyik szabály miatt: 
NagybetűvelkKezdődőSzó -t (,.Grove" ] , Forest" ] , Village" [ ...) 


14 A Bridgestone Sports Váltalat pénteken azt nyilatkozta, hogy vegyes vállalatot hozott létre egy helyi 
konszernnel és egy japán kereskedőházzal Tajvanon, hogy Japánba szánt golfütőket gyártsanak." A golf club 
kétértelmű, itt golfütő. (A ford.) 

5 vegyes vállalat", , Tony Blair Miniszterelnök", , Bridgestone Sports Vállalat" (A ford.) 
6 Az Intel elnöke, Andy Grove — a grove magyarul ligetet jelent. (A ford.) 


23.4. GÉPI FORDÍTÁS 969 


A harmadik lépés az alapcsoportok (basic groups) kezelése, amelyek főnévi és igei 
csoportokat jelentenek. A lépés lényege, hogy ezeket darabokra kell vágni, hogy a ké- 
sőbbi lépések kezelhessék őket. A főnévi csoport a fejszerepet betöltő főnévből áll, 
amelyet opcionálisan megelőzhetnek névelők és egyéb módosítók. Mivel a főnévi csoport 
nem tartalmazza az NP €4-beli teljes komplexitását, ezért nincs szükség rekurzív környe- 
zetfüggetlen nyelvtani szabályokra, a véges automaták által megengedett reguláris nyelv- 
tanok is elégségesek. Az igei csoport az igéből és a hozzá kapcsolódó segédigékből, 
valamint határozókból áll, azonban nem tartalmazza a közvetlen és közvetett tárgyakat 
és az elöljárói kifejezéseket. Az előbbi példamondat a következő módon kerülne ki eb- 
ből a lépésből: 


1NG: Bridgestone Sports Co. 10  NG: a local concern 


2VG: said 11 CJ: and 

3 NG: Friday 12  NG: a Japanese trading house 
4NG: it 13  VG: to produce 

5VG: has set up 14  NG: golf clubs 

6NG: a joint venture 15 VG: to be shipped 

ZPR5 din 16. We ÉG 

8NG: Taiwan 17  NG: Japan 

9 PR: with 


Az NG főnévi csoportot, a VG igei csoportot, a PR elöljárószót, a CJ pedig kötőszót jelent. 

A negyedik lépés az alapcsoportokat komplex kifejezésekké (complex phrases) 
kombinálja. Ismét az a cél, hogy véges állapotú szabályokat használjunk a gyors feldol- 
gozás érdekében, és a szabályok olyanok legyenek, hogy (közel) egyértelmű kimeneti 
kifejezéseket kapjunk. A kombinációs szabályok egyik típusa tárgyterületfüggő esemé- 
nyekkel foglalkozik. Például a 


Cég-t- VegyesvállalatLétrehozása (, with" Vállalat--)? 


szabály a vegyes vállalat létrehozásának egyik lehetséges leírása. A kaszkádban ez az el- 
ső lépés, amely eredményét nemcsak a kimenetre, hanem adatbázissémákba is elhelyezi. 

Az utolsó lépés az előző lépés által felépített struktúrákat vonja össze (merges 
structures). Amennyiben a következő mondat azt állítja, hogy , A vegyes vállalat ja- 
nuárban kezdi meg a termelést", akkor ez a lépés felismeri, hogy két hivatkozás történt 
a vegyes vállalatra, amelyeket össze kellene voni 

Általánosságban az információkinyerés jól működik egy olyan korlátozott tárgyterü- 
let esetén, amelyben a tárgyalt témákat előre meg lehet állapítani, továbbá azt is lehet 
tudni, hogy hogyan írnak róluk. Számos tárgyterületen használhatónak bizonyult ez 
a technika, azonban nem lehet a teljes természetes nyelvi elemzés helyettesítője. 
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A gépi fordítás (machine translation) egy természetes nyelvű szöveg egyik nyelvről 
(forrás) egy másik nyelvre (cél) történő automatikus fordítása. Ez a folyamat számos 
feladatra alkalmasnak bizonyult, beleértve a következőket: 
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. Nyersfordítás (rough translation), amelyben a cél pusztán az, hogy egy passzus 
lényegét megkapjuk. Nyelvtanilag helytelen és nem elegáns mondatokat is elfoga- 
dunk, mindaddig, amíg a jelentés világos. Például a webszörfözés során a felhasz- 
náló gyakran örül az idegen nyelvű weboldal nyersfordításának. Az esetek egy 
részében egy egynyelvű ember utólagosan szerkesztheti a kimenetet, az eredeti szö- 
veg elolvasásának szükségessége nélkül. A géppel támogatott fordítás ezen típusa 
azért takarít meg pénzt, mert az ilyen szerkesztőknek kevesebbet kell fizetni, mint 
a kétnyelvű fordítóknak. 
2. Korlátozott forrás fordítása írestricted-source translation), amelyben a forrás- 
szöveg témája és formátuma szigorúan korlátozott. Az egyik legsikeresebb példa 
a TAUM-METEO rendszer, amely időjárás-jelentéseket fordít angolból franciára. 
Azért működik, mert az időjárás-jelentések nyelvezete erősen stilizált és reguláris. 

3. Előre szerkesztett fordítás (preedited translation), amelyben egy ember úgy szer- 
keszti meg előre a forrásdokumentumot, hogy megfeleljen az angol nyelv (vagy bár- 
mely forrásnyelv) egy korlátozott részhalmazának. Ez a megközelítés különösen 
akkor költséghatékony, amikor egyetlen dokumentumot sok nyelvre kell lefordítani, 
mint például jogi szövegeket az Európai Közösségnél, vagy olyan vállalatok esetén, 
amelyek ugyanazt a terméket sok országban értékesítik. A korlátozott nyelveket 
néha , Caterpillar-angolnak" nevezik, mert a Caterpillar vállalat volt az első, amelyik 
az útmutatóit ilyen formában próbálta megírni. A Xerox olyan nyelvet definiált a 
javítási útmutatók számára, amely annyira egyszerű volt, hogy géppel le lehetett for- 
dítani minden olyan nyelvre, amellyel a Xerox érintkezésbe kerül. További haszon- 
ként az eredeti angol nyelvű útmutatók is világosabbá váltak. 

4. Irodalmi fordítás (Iliterary translation), amely a forrásszöveg legkisebb árnyalatát 

is megőrzi. Ez jelenleg túlmutat a legmodernebb gépi fordítók képességén is. 


A nyersfordítás példájaként álljon itt jelen fejezetünk első bekezdésének a SYSTRAN 


fordító szolgáltatás által történt fordítása előbb olaszra, majd vissza angoira:!7 


OLASZ: Ín capitolo 22 abbiamo visto 
come un agente potrebbe comunicare 
con un altro agente (essere umano o soft- 
ware) che usando le espressioni in un 
linguaggio reciprocamente accordato. 
Completare sintattico e Vanalisi seman- 
tica delle espressionié necessaria da 
estrarre il significato completo del utte- 
rances ed é possible perché le espressioni 
sono corte e limitate ad un settore limitato. 


ANGOL: In chapter 22 we have seen as 
an agent could communicate with an 
other agent (to be human or software) 
that using the expressions in a language 
mutual come to an agreement. Complete 
Syntactic and the semantic analysis of 
the expressions is necessary to extract 
the complete meant one of the utterances 
and is possible because the expressions 
short and are limited to a dominion. 


17 A fejezet első bekezdésének eredeti angol szövege: In Chapter 22, we saw how an agent could 
communicate with another agent (human or sofware), using utterances in a common language. Coriplete 
Syntactic and semantic analysis of the utterances is necessary to extract the full meaning of the utterances, and 
is possible because the utterances are short and restricted to a limited domain. Látható, hogy a két angol nyel- 
vű szöveg között jelentős eltérések vannak, azonban a gépi fordítás eredményeként kapott szöveg nagyjából ért- 
hető. (A ford.) 
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A fordítás azért nehéz, mert általában a szövegek mély megértését igényli, amihez 
pedig a közölt szituáció mély megértése szükséges. Ez még nagyon egyszerű szövegek 
esetén is fennáll, sőt egyszavas , szövegek" esetén is. Vegyük a , Open" szót egy üzlet 
ajtaján." Ez azt az információt közvetíti, hogy az üzlet pillanatnyilag fogad vevőket. 
Most vegyük ugyanezt a szót egy újonnan felépített üzleten található hatalmas transz- 
parensen. Ez azt jelenti, hogy az üzlet megnyílt, de az olvasók nem éreznék becsapva 
magukat, ha éjszaka a transzparens eltávolítása nélkül lenne zárva a bolt. A két felirat 
ugyanazt a szót használja különböző jelentések közvetítésére. Német nyelvű országban 
a felirat az ajtón , Offen", míg a transzparensen , Neu eröffnet" lenne. 

Az a probléma, hogy az egyes nyelvek eltérő módon kategorizálják a világot. Például 
a francia , doux" szó jelentések széles körét fogja át, amely megközelítőleg a következő 
angol szavakkal adható meg: ,soff", , sweet", , gentle". Hasonlóképpen az angol 
shard" szó gyakorlatilag a német , hart" szó összes jelentését (fizikailag ellenálló, durva) 
lefedi, emellett a , schwierig" (, nehéz", fáradságos, bonyolult értelemben) szó néhány 
jelentését is magában foglalja. A német , heilen" (meggyógyít) ige az angol , cure" (gyó- 
gyít) szó orvosi használatát fedi le, továbbá a , heal" (meggyógyul) tranzitív és intranzi- 
tív jelentéseit. Emiatt az adott mondat jelentésének ábrázolása sokkal nehezebb a fordí- 
tás, mint az egynyelvi megértés esetén. Egy egynyelvű elemzőrendszer használhatna 
olyan predikátumokat, mint Open(x), azonban a fordítás céljából a reprezentációs nyelv- 
nek esetleg több megkülönböztetést kellene tennie, például az , Offen" jelentést repre- 
zentáló Openi(x) predikátummal és a , Neu eröffnet" jelentést reprezentáló Open(x) 
predikátummal. Azt a reprezentációs nyelvet, amely a lefedett nyelvekhez szükséges 
összes megkülönböztetést lehetővé teszi, köztes nyelvnek (interlingua) nevezzük. 

Folyékony fordításhoz az szükséges, hogy a fordító (ember vagy gép) elolvassa az 
eredeti szöveget, megértse a szituációt, amiről szól, és találjon egy megfelelő szöveget 
a célnyelvben, amely jól leírja ugyanazt, vagy egy hasonló szituációt. Ez gyakran válasz- 
tást jelent. Például amennyiben az angol , you" szó egy személyre vonatkozik, akkor 
vagy a magyar hivatalos , ön" vagy a közvetlen ,.te" alakra fordítható. Egyszerűen nem 
lehet a , you" fogalomról beszélni magyarul anélkül, hogy eldöntenénk, hogy hivatalos 
vagy közvetlen módon szeretnénk használni. A fordítók (mind a gépi, mind az emberi) 
néha nehezen tudják ezt a döntést meghozni. 


Gépi fordító rendszerek 


A gépi fordító rendszerek erősen különböznek abban, hogy milyen szinten elemzik a 
szöveget. Egyes rendszerek a bemeneti szöveget egészen a köztes nyelv szintjéig próbál- 
ják elemezni (mint ahogy azt a 22. fejezetben tettük), majd a célnyelven ezen reprezen- 
táció alapján generálnak mondatokat. Ez azért nehéz, mert részproblémaként tartalmaz- 
za a teljes nyelvi megértés problémáját, amihez még a köztes nyelv kezeléséből fakadó 
nehézségek is hozzáadódnak. A megközelítés azért törékeny, mert ha az elemzés siker- 
telen, akkor nincs kimenet. Azonban az az előnye, hogy a rendszerben nincs olyan kom- 


18 artin Kay példája. 
Nyitva — Kinyitottunk (A ford.) 
doux — édes, enyhe, lágy, soft - lágy, sweet — édes, gentle - finom, gyengéd (A ford.) 
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ponens, amelynek két (természetes) nyelvet egyszerre kell ismernie. Ez azt jelenti, hogy 
köztes nyelv használatával n nyelv közti fordítás O(n) és nem O(rr?) nehézségű. 

Más rendszerek az átvitelen (transfer) alapulnak. Fordítási szabályok (vagy pél- 
dák) adatbázisát tartalmazzák, és amikor egy szabály (vagy példa) illeszkedik, akkor 
közvetlenül fordítanak. Az átvitel lexikai, szintaktikai vagy szemantikai szinten tör- 
ténhet. Például egy szigorúan szintaktikai szabály az angol [Melléknév Főnév] szek- 
venciát a francia IFőnév Melléknév] szekvenciába képezi le. Egy kevert szintaktikai és 
lexikai szabály a francia (Sz ,et puis" S2] szekvenciát az angol (Si sand then" S2] 
szekvenciába képezi le.2! Azt az átvitelt, amely egy mondatot közvetlenül egy másik- 
ba visz át, memóriaalapú fordításnak (memory-based translation) nevezünk, mivel 
nagyszámú (angol, francia) pár memorizálására támaszkodik. Az átviteli módszer ro- 
busztus, mert minden esetben generál valamilyen kimenetet, és legalább a szavak egy 
része feltétlenül helyes. A 23.5. ábra bemutatja az egyes átviteli pontokat. 


Köztes nyelvi szemantika 
VonzalomtjohnNei 


Angol szemantika 
Lovesídohn, Mary) 
Angol szintaxis Francia szintaxis 
S(NP(Johnj, VP(loves, NP(Mary)) S(NP(Jean), VP(aime, NP(Marie))) 

Angol szavak Francia szava 
John loves Mary Jean aime Marie 


23.5. ábra. Egy gépi fordító rendszer választási lehetőségeit ábrázoló sematikus diagram. A fenn talál- 
ható angol szöveggel kezdjük. A köztes nyelven alapuló rendszer a folytonos vonalakat követi, az angol 
Szöveget először szintaktikai elemzésnek veti alá, majd szemantikai és köztes nyelvi reprezentációt állít 
elő, végül szemantikai, szintaktikai és lexikai formákon keresztül francia szöveget állít elő. Az átvitel- 
alapú rendszerek a szaggatott vonalak által jelölt rövidzárakat használják. Az egyes rendszerek eltérő 
szinteken végzik az átvitelt, egyes rendszerek több szinten is. 






















Statisztikai gépi fordítás 


Az 1960-as évek elején nagy reményeket fűztek ahhoz, hogy a számítógépek képesek 
egyik természetes nyelvből a másikba fordítani csakúgy, mint ahogy Turing projektje 
képes volt kódolt német üzeneteket értelmes német szövegbe fordítani. 1966-ra vilá- 
gossá vált, hogy a folyékony fordítás igényli az üzenet jelentésének a megértését, míg 
a kódfejtés nem. 

Az elmúlt évtizedben elmozdulás volt megfigyelhető a statisztikai alapú gépi fordító 
rendszerek irányába. Természetesen, a 23.5. ábra bármely lépésének javára szolgálná- 
nak statisztikai adatok, valamint egy olyan egyértelmű valószínűségi modell használata, 


21 Mindkét esetben magyarul (S) , és utána" S2] (A ford) 
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amely megadja, hogy mi egy jó analízis vagy átvitel. Azonban a , statisztikai gépi for- 
dítás" az egész fordítási probléma olyan megközelítésének a megnevezésévé vált, 
amely a mondat legvalószínűbb fordításának kétnyelvű korpuszon alapuló megtalálását 
jelenti. A kétnyelvű korpuszok egyik példája a Hansard, ?? amely parlamenti viták nap- 
lója. Kanada, Hongkong, 5. más országok kétnyelvű Hansardokat tesznek közzé, az 
Európai Unió 11 nyelven? publikálja hivatalos dokumentumait, míg az Egyesült Nem- 
zetek Szervezete többnyelvű dokumentumokat ad ki. Ezek a statisztikai gépi fordítás 
számára felbecsülhetetlenül értékes forrásoknak bizonyultak. 

Egy angol nyelvű mondat (E) például francia?! (F) mondatra történő fordításának 
problémáját a Bayes-szabály következő alkalmazásaként írhatjuk le: 


argmaxy P(FIE) hai argmaxy P(EIP)P(F)/P(E) 
je argmaxy P(EIP)P(F) 


Ez a szabály azt állítja, hogy minden lehetséges F francia mondatot figyelembe kell 
vennünk, és azt kell választanunk, amelyik maximalizálja P(EIF)P(F)-t. A P(E) ténye- 
zőt nem kell figyelembe venni, hiszen minden F esetén azonos. A P(F) tényező a fran- 
cia nyelvi modell (language model), azt adja meg, hogy milyen valószínűségű egy adott 
francia mondat, A P(ElF) a fordítási modell (translation model), azt adja meg, hogy 
milyen valószínűségű egy adott angol mondat, mint az adott francia mondat fordítása. 

Az ügyes olvasók bizonyára csodálkoznak, hogy mít nyertünk a P(FJE) definiálásával a 
P(EIF) segítségével. A Bayes-szabály más alkalmazásainál azért tettük ezt, mert kauzális 
modellt akartunk használni. Például a P(Szimptómákl Betegség) kauzális modellt használtuk 
P(Betegségi Szimptómák) kiszámolására. A fordítás esetében azonban egyik irány sem kau- 
zálisabb, mint a másik. Jelen esetben a Bayes-szabály alkalmazásának az az oka, hogy azt 
hisszük, képesek leszünk egy olyan P(F) nyelvi modellt megtanulni, amely pontosabb, mint 
a P(EIF) fordítási modell (és pontosabb, mint P(FIE) közvetlen becslése). Lényegében 
a problémát két részre osztottuk: először a P(FIE) fordítási modellt alkalmazzuk, hogy 
olyan francia mondatokat találjunk, amelyek visszaadják az angol mondat lényegét, de ame- 
lyek nem feltétlenül folyékony francia mondatok, majd a P(F) nyelvi modellt (amelyre sok- 
kal jobb valószínűségi becslésünk van) használjuk a legjobb jelölt kiválasztására. 

A P(F) nyelvi modell bármilyen olyan modell lehet, amely egy mondathoz valószí- 
nűséget rendel. Nagyon nagy korpusz esetén P(F)-et közvetlenül becsülhetnénk az 
egyes mondatok korpuszbeli előfordulási száma alapján. Például ha a webről össze- 
gyűjtünk 100 millió francia mondatot, és a , Cligue ici"?5 mondat 50 ezerszer fordul 
elő, akkor P(Cligue ici) — 0,0005. Azonban még 100 millió példa esetén is a legtöbb 
mondat előfordulási száma nulla lenne. Emiatt az ismert bigram modellt fogjuk 
alkalmazni, amelyben az f...f,, szavakból álló francia nyelvű mondat valószínűsége: 


22 william Hansard után elnevezve, aki 1811-ben elsőként publikálta a brit parlamenti vitákat. 

Az angol nyelvű kiadás idején. (A ford.) 

Ebben a bekezdésben az angolról francia nyelvre történő fordítás problémájával foglalkozunk. Ne zavarja 
az olvasót, hogy a Bayes-szabály alkalmazása a P(EIF), és nem a P(FIE) figyelembe vételéhez vezet, ami annak 
tűnik, mintha franciáról fordítanánk angolra. 

Kattints ide (A ford.) 

Amennyiben csak 100 ezer szó fordulna elő a lexikonban, akkor az összes lehetséges háromszavas mon- 
datok 99.999994-ának előfordulási száma nulla lenne a 100 milliós korpuszban. Hosszabb mondatok esetén 
még rosszabb a helyzet. 
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PC.) TIE PCR 


Ismernünk kell az olyan bigram valószínűségeket, mint például a P(Eiffeljtour) — 0,02.27 
Ez a szintaxis mindössze nagyon lokális jellemzőit képes leírni, ahol a szó csak az őt 
megelőző szótól függ. A nyersfordításhoz azonban többnyire ez is elegendő.§ 

A P(EIF) fordítási modellt (translation model) nehezebb meghatározni. Egyrészt 
nem áll rendelkezésünkre (angol, francia) mondatpárokból álló kész gyűjtemény, amely 
alapján taníthatnánk. Másrészt a modell komplexitása nagyobb, mivel mondatok ke- 
resztszorzatára, és nem pedig különálló mondatokra alapul. Egy túlzottan leegyszerűsí- 
tett fordítási modellel fogunk kezdeni, és felépítünk valamit, ami az , IBM Model 3"-at 
(Brown és társai, 1993) közelíti, ami továbbra is a végletekig leegyszerűsítettnek tűnik, 
azonban az esetek körülbelül felében elfogadható fordításokat generált. 

A végletekig leegyszerűsített modell arról szól, hogy , a mondat fordításához egysze- 
rűen fordítsuk le a szavakat egyesével és egymástól függetlenül, balról jobbra". Ez egy 
unigram szóválasztási modell. Lehetővé teszi, hogy egyszerűen kiszámítsuk egy fordí- 
tás valószínűségét: 


PEP) TT Pl 
Néhány esetben ez a modell jól működik. Vegyük például a következőt: 
P(the dogjle chien) — P(thelle) x P(doglchien) 


Bármely elfogadható valószínűségi értékhalmaz esetén a , the dog"?9 lenne a , le chien" 
maximum-likelihood becslője. A legtöbb esetben azonban a modell megbukik. Az egyik 
probléma a szórend. Franciában a , dog" megfelelője a ,chien", a , brown"-é a ,brun", 
azonban a , brown dog"-é a , chien brun".?0 A másik probléma az, hogy a szóválasztás 
nem egy az egyes leképezés. Az angol , home" szót gyakran , A la maison"-nak?! fordít- 
ják, ami egy hármas leképezés (illetve három az egybe a másik irányban). Ezen problé- 
mák ellenére az IBM Model 3 makacsul ragaszkodik az alap unigram modellhez, bár, 
hogy javítson rajta, hozzátesz néhány kiegészítést. 

A modell, hogy képes legyen kezelni azt a tényt, hogy a szavakat nem egy az egyben 
fordítjuk, bevezeti a szó termékenységének (fertility) fogalmát. Egy n termékenységű 
szót n-szer lemásolja, és az n másolat mindegyike függetlenül fordítódik. A modell az 
összes francia szóra tartalmazza a P(termékenység — n]szó) paramétereket. Az ,a la 
maison" , home"-ra történő fordításához a modell 0 termékenységet választana az , a" 
és ,.la" szavakra, ? míg egyet a , maison"-ra, és utána az unigram modelit alkalmazná a 
, Maison" szó ,home"-ra történő fordításához. Ez eléggé indokoltnak tűnik, az , A" és 
a , la" kis információtartalmú szavak, amelyeket ésszerű üres karakterfüzérré fordítani. 


27 piffel-torony (A ford.) 

Világos, hogy a fordítás finomabb részleteihez P(f/lf; 1) nem elegendő. Híres példaként álljon itt Marcel 
Proust 3500 oldalas regénye, a ..A la récherche du temp perdu", amely ugyanazzal a szóval kezdődik és 
végződik, így egyes fordítók úgy döntöttek, hogy ugyanezt teszik, azaz egy szó fordítását egy olyan szóra ala- 
pozták, amely durván 2 millió szóval korábban fordult elő. 

a loitya (A ford.) 

barna kutya (A ford.) 

3 home — otthon, a la maison — otthon lenni. haza menni értelemben (A ford.) 
, ár" — nagyjából a magyar -ban, -ben. -ba, -be ragoknak felel meg. , Ja" — nőnemúi határozott névelő (A ford.) 
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A másik irányba történő fordítás már kétségesebb. A , home" szóhoz hármas termé- 
kenységet rendelne a modell, , home home home" szekvenciát kapva. Az első , home" 
A-ra, a második ,la"-ra, míg a harmadik , maison"-ra fordulna. A fordítási modell 
szempontjából az , a la maison" és a , maison a la" pontosan azonos valószínűséget 
kapna. (Pont ez a kétséges rész.) A nyelvi modellre lenne bízva, hogy eldöntse, melyik 
a jobb. Értelmesebbnek tűnhet a , :home"-ot közvetlenül , a la maison"-ra fordítani, mint 
közvetett módon a , home home home"-on keresztül, azonban ehhez sokkal több para- 
méterre lenne szükség, amelyeket nehéz lenne a rendelkezésre álló korpuszból meg- 
határozni. 

A fordítási modell végső része a szavak megfelelő sorrendbe történő permutálása. Ez 
egy eltolási modellel történik, amely során a szó az eredeti pozíciójából a végleges 
pozícióba mozog. Például a ,chien brun" ,brown dog"-ra történő fordítása során 
a , brown" szó -HI eltolási értéket kap (azaz jobbra egy pozíciót mozog), míg a , dog" —1 
értéket. Az olvasó elképzelheti, hogy az eltolásnak függnie kellene a szótól: az olyan 
melléknevek, mint a , brown" többnyire pozitív eltolási értékkel! rendelkeznének, mert 
a francia nyelv általában a főnév után helyezi el a mellékneveket. Azonban az IBM 
Model 3 úgy döntött, hogy a szótól függő eltolás túl sok paramétert igényelne, ezért az 
eltolás független a szótól, és csak a mondatbeli pozíciótól és a mondat mindkét nyelv- 
beli hosszától függ. Azaz a modell a következő paramétereket becsüli: 


P(Eltolás — olPozíció — p, AngoltíHossz — m, FranciaHossz — n) 


Azaz a , brown" szó , brown dog"-beli eltolásának meghatározásához megnézzük 
a P(Eltolás]1,2,2) értékét, amely mondjuk --1 értéket adna 0,3, és 0 értéket 0,7 való- 
színűséggel. Az eltolási modell még kétségesebbnek látszik, olyan, mintha egy olyan 
személy agyalta volna ki, aki sokkal jobban ért a mágnesbetűk hűtőn történő tologatá- 
sához, mint a valódi természetes nyelven történő beszédhez. Rövidesen bemutatjuk, 
hogy nem azért tervezték ilyen módon, mert jól modellezi a természetes nyelvet, hanem 
azért, mert a rendelkezésre álló adatokat ésszerűen hasznosítja. Mindenesetre arra szol- 
gál, hogy élénken emlékeztessen bennünket arra, hogy egy középszerű fordítási modellt 
meg lehet menteni egy jó francia nyelvi modellel. Íme, egy példa egy mondat fordítá- 
sának lépéseire. 


Forrás francia: Le chien brun m est o pas o allé A la maison?? 
Termékenységi modell: 1 1 1 1 1 0 1 o 01 
Transzformált francia: Le chien  bren nm! est allé maison 
Szóválasztási modell The dog brown not did 20 home 
Eltolási modellt 0  H Aa H - 0 o 

Cél angol: The — brown dog did not 0 home 


Most már tudjuk, hogyan kell kiszámítani a P(FIE) valószínűséget bármely (francia, an- 
01) mondatpárra. Azonban amit igazából tenni akarunk az az, hogy egy adott angol mon- 
dat esetén megtaláljuk azt a francia mondatot, amely maximalizálja ezt a valószínűséget. 
Nem sorolhatunk fel egyszerűen mondatokat: 107 francia szó esetén 105" n hosszúságú 
mondat lehetséges, és számos összerendelés mindegyikre. Még ha csak a 10 leggyakoribb 
szó-szó fordítást tekintjük minden egyes szóra, és csak 0 és -H1 eltolást veszünk figyelem- 


33 A barna kutya nem ment haza. (A ford.) 
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be, akkor is 27/2407 mondatot kapunk, ami azt jelenti, hogy n — 5 esetén még fel tudnánk 


őket sorolni, de n — 10 esetén már nem. Ehelyett meg kell keresnünk a legjobb megol- 
dást. Az A" keresés hatékonynak bizonyult a feladatra (Germann és társai, 2001). 


Valószínűségek tanulása gépi fordításhoz 


Körvonalaztunk egy olyan P(FJE) modellt, amely négy paraméterhalmazt tartalmaz: 


Nyelvi modell: P(szójlszó;.1) 

Termékenységi modell: P(Termékenység — niszóp) 
Szóválasztási modell: P(szórlszóp) 

Eltolási modell: P(Eltolás — olpozíció, hossz, hossz) 


Ennek a modellnek még egy 1000 szót tartalmazó, szerény szókincs esetén is paramé- 
terek millióira van szüksége. Nyilvánvalóan adatokból kell megtanulnunk őket. Felté- 
telezzük, hogy az egyetlen rendelkezésünkre álló adat egy kétnyelvű korpusz. Lássuk a 
felhasználási módját: 

Mondatokra történő szegmentáció: a fordítási egység a mondat, tehát a korpuszt 
mondatokra kell tördelnünk. A pont a mondatvég jellemző indikátora, de vegyük a 
..Dr. J. R. Smith of Rodeo Dr. megérkezett." példát, amelyben csak az utolsó pont je- 
lenti a mondat végét. A mondatokra történő szegmentációt körülbelül 9896-os pontos- 
sággal lehet elvégezni. 

A P(szójlszó; 1) francia nyelvi modell becslése: vegyük a korpusz francia nyelvű ré- 
szét, számoljuk meg a szópárok előfordulási gyakoriságát, és végezzünk simítást, hogy 
megkapjuk a P(szójjszój 1) becslőjét. Például megkaphatjuk, hogy P(Eiffelltour) — 0,02. 

Mondatok illesztése: minden egyes angol nyelvű mondatra határozzuk meg az(oka)t a 
francia nyelvű mondato(ka)t, amely(ek) megfelel(nek) neki a francia változatban. Általában 
a szövegben következő angol mondat megfelel a következő francia mondatnak 1:1 megfe- 
leltetéssel, azonban néha előfordulnak variációk: az egyik nyelvű mondatot 2:1 megfelelte- 
tésbe vágjuk, vagy két mondat sorrendjét felcseréljük, 2:2 megfeleltetést kapva. Mindössze 
a mondathosszakat tekintve lehetséges az illesztésük (1:1, 1:2, 2:2 stb.) 9096 és 9999 
tí pontossággal, a Viterbi szegmentációs algoritmus (lásd 23.1. ábra) megfelelő variációjá- 
val. Még jobb illeszkedés is elérhető amennyiben olyan iránypontokat használunk, amelyek 
mindkét nyelvben közösek, mint például számok, tulajdonnevek, illetve olyan szavak, 
melyeknek - egy kétnyelvű szótár alapján — tudjuk, hogy egyértelmű a fordításuk. 

A P(Termékenység 7 niszóp) kezdeti termékenységi modell becslése: legyen adott 
egy m hosszúságú francia mondat, amely egy n hosszúságú angol mondathoz illeszke- 
dik, ekkor vegyük ezt annak alátámasztásaként, hogy mindegyik (a mondatban előfor- 
duló) francia szó termékenysége n/m. Vegyük figyelembe ezeket az összes mondatra 
az egyes szavak termékenységi eloszlásának meghatározásához. 

A P(szóriszóp) kezdeti szóválasztási modell becslése: vegyük az összes olyan mon- 
datot, amely tartalmazza például a , brun" szót. Azok a szavak, amelyek a leggyakrabban 
fordulnak elő az illeszkedő angol mondatokban, valószínűleg a , brun" szó-szó fordításai, 

A P(Eltolás — olpozíció, hossz, hosszp) kezdeti eltolási modell becslése: most, 
hogy rendelkezünk egy szóválasztási modellel, használjuk fel azt az eltolási modell 
becslésére. Egy n hosszúságú angol mondat esetén, amely egy m hosszúságú francia 
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mondathoz illeszkedik, vegyük minden egyes francia szót (i pozícióban) és minden 
olyan angol szót (j pozícióban), amely valószínű választás lenne a francia szóra, és 
vegyük ezt P(Eltolás — i — jli, n, m) bizonyítékául. 

A becslések javítása: használjuk az EM (elvárásmaximalizáló) algoritmust a becslé- 
sek javítására. A rejtett változó az illeszkedő mondatpárok közti szóilleszkedési vektor 
(word alignment vector). A vektor megadja minden egyes angol szóra a megfelelő 
francia szó francia mondatbeli pozícióját. Például megkaphatjuk a következőt: 


Forrás francia: Le chien — brun n est pas allé a la  maison 
Cél angol: The — brown dog did not go home 
Szóilleszkedés: 1 8 2 5 4 ré 10 


Először a paraméterek aktuális becslőit használva elkészítjük a szóilleszkedési vektort 
mindegyik mondatpárra. Ez jobb becslő megalkotását fogja számunkra lehetővé tenni. 
A termékenységi modellt az alapján becsüljük, hogy a szóilleszkedési vektor egy adott 
tagja hányszor képződik le több szóra, vagy egyetlenegyre sem. A szóválasztási mo- 
dellnek a mondat összes szava helyett most már csak olyan szavakat kell figyelembe 
vennie, amelyek egymáshoz lettek illesztve. Az eltolási modell a mondat egyes pozíci- 
óinak elmozdulását vizsgálja a szóilleszkedési vektornak megfelelően. Sajnos nem tud- 
juk, hogy mi a helyes illeszkedés, és túl sok van belőlük ahhoz, hogy mindet felsoroljuk. 
Emiatt arra vagyunk kényszerítve, hogy megkeressünk néhány nagy valószínűségű 
illeszkedést, és a valószínűségükkel súlyozzuk őket, miközben bizonyítékot gyűjtünk 
az új paraméterbecslőkhöz. Mindössze ennyire van szükségünk az EM algoritmushoz. 
A kezdeti paraméterek alapján illeszkedéseket számolunk, majd az illeszkedések alap- 
ján javítjuk a paraméterbecslőket. Ismételjük, amíg konvergál. 
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A fejezet főbb pontjai a következők: 


: Az n-gram alapú valószínűségi nyelvi modellek meglepő mennyiségű információt 
képesek visszaadni egy nyelvről. 

" A CFG-ket ki lehet egészíteni valószínűségi CFG-kre, könnyebbé téve az adatok 
alapján történő tanulásukat és a kétértelműségek feloldását. 

" Az információkereső (information retrieval) rendszerek egy nagyon egyszerű, 
szózsákokra épülő nyelvi modellt használnak, ennek ellenére jó felidézési (recall) 
és pontossági (precision) mutatókkal rendelkeznek nagyon nagy korpuszokon. 

"  Azinformációkinyerő (information extraction) rendszerek bonyolultabb modellt 
alkalmaznak, amely korlátozottan figyelembe veszi a szintaxist és a szemantikát. 
Gyakran véges automaták kaszkádjával valósítják meg őket. 

" A gépi fordító (machine translation) rendszereket különböző technikák alkalmazá- 
sával valósították meg, a teljes szintaktikai és szemantikai analízistől kezdve egészen 
a szógyakoriságon alapuló statisztikai módszerekig. 

s Egy statisztikai nyelvi rendszer építése során az a legjobb, ha olyan rendszert gon- 
dolunk ki, amely a rendelkezésre álló adatokat jól hasznosítja, még akkor is, ha 
a modell a végletekig leegyszerűsítettnek tűnik. 
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Az n-gram betűmodelleket nyelvi modellezésre Markov javasolta (Markov, 1913). 
Claude Shannon generált elsőként 1-gram szómodelleket az angol nyelvre (Shannon és 
Weaver, 1949). Chomsky mutatta meg a véges állapotú modellek korlátait a környezet- 
független modellekhez képest, az alábbi következtetést levonva: , Valószínűségi model- 
lek nem adnak részletes bepillantást a szintaktikai struktúrák egyes alapvető problémái- 
ba" (Chomsky, 1956; 1957). Ez igaz, azonban figyelmen kívül hagyja azt a tényt, hogy 
a valószínűségi modellek lehetővé teszik a bepillantást néhány más alapvető problémá- 
ba, olyanokba, amelyekkel a CFG-k nem foglalkoznak. Chomsky észrevételeinek olyan 
sajnálatos hatása volt, hogy két évtizeden keresztül sokakat elijesztett a statisztikai mo- 
dellektől egészen addig, míg ezek a modellek újra megjelentek a beszédfelismerésben 
(Jelinek, 1976. 

Az adj-hozzá-egyet simítás Jeffreystől származik (Jeffreys, 1948), míg a törölt inter- 
polációs simítás Jelinektől és Mercertől, akik beszédfelismerésre használták (Jelinek és 
Mercer, 1980). További technikákra példa a Witten-Bell-simítás (Witten-Bell, 1991) 
és a Good-Turing-simítás (Church és Gale, 1991). Az utóbbit gyakran használják bio- 
informatikai problémáknál is. A biostatisztika és a valószínűségi természetes nyelv 
feldolgozás (NLP) közelednek egymáshoz, mivel mindkettő alkotóelemek ábécéjéből 
felépülő hosszú, strukturált szekvenciákkal foglalkozik. 

Az egyszerű n-gram betű- és szómodellek nem az egyetlen lehetséges valószínűségi 
modellek. Blei és társai leírják a rejtett Dirichlet-allokációnak (latent Dirichlet 
allocation) nevezett valószínűségi szövegmodellt, amely a szövegeket témák keveréké- 
nek tekinti, amelyben mindegyik téma saját szóeloszlással rendelkezik (Blei és társai, 
2001). Ez a modell a rejtett szemantikai indexelés (latent semantic indexing) modell 
(Deerwester és társai, 1990) (lásd még (Papadimitriou és társai, 1998)) kibővítésének 
és racionalizálásának tekinthető, valamint Sahami és társai többszörös okkeverék (cause 
mixture) modelljéhez is kötődik (Sahami és társai, 1996). 

A valószínűíségi környezetfüggetlen nyelvtanok (PCFG) megválaszolják Chomsky 
valószínűségi modellekkel kapcsolatos összes ellenvetését, és a CFG-khez képest elő- 
nyökkel rendelkeznek. A PCFG-ket Booth (Booth, 1969) és Salomaa (Salomaa, 1969) 
vizsgálták. Jelinek bemutatja a veremdekódoló algoritmust, amely a Viterbi-keresés 
olyan variációja, amely arra használható, hogy megtalálja egy PCFG-vel a legvalószí- 
nűbb elemzést (Jelinek, 1969). Baker vezette be a belső-külső algoritmust (Baker, 1979), 
Lari és Young leírta használhatóságát és korlátait (Lari és Young, 1990). Charniak 
(Charniak, 1996), valamint Klein és Manning (Klein és Manning, 2001) a treebank 
nyelvtanokkal történő elemzést tárgyalják. Stolcke és Omohundro megmutatták, hogyan 
lehet nyelvtani szabályokat tanulni Bayes-modellek egyesítésével (Stolcke és Omo- 
hundro, 1994). További PCFG-algoritmusokat mutatott be Charniak (Charniak, 1993), 
valamint Manning és Schütze (Manning és Schütze, 1999). Collins a terület áttekintő 
tanulmányát kínálja, továbbá az egyik legsikeresebb statisztikai elemzőprogram ma- 
gyarázatát (Collins, 1999). 

Sajnos a PCFG-k rosszabbul teljesítenek, mint az egyszerű n-gram modellek számos 
feladat esetén, mert a PCFG-k nem képesek reprezentálni az egyes szavakhoz társuló in- 
formációkat. Hogy kijavítsák ezt a hiányosságot, számos szerző (Collins, 1996; Charniak, 
1997; Hwa, 1998) bevezették a szókinccsel ellátott valószínűségi nyelvtanok (lexica- 
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lized probabilistic grammar) különböző verzióit, amelyek kombinálják a környezetfüg- 
getlen és a szóalapú statisztikákat. 

A Brown-korpusz volt az első próbálkozás, hogy tapasztalati nyelvészeti célokra 
kiegyensúlyozott korpuszt gyűjtsön (Francis és Kucera, 1967). Körülbelül egymillió 
szót tartalmazott, szófaji információval ellátva. Eredetileg 100 ezer lyukkártyán tárolták. 
A Penn treebank körülbelül 1,6 millió szó gyűjteménye, kézi elemzéssel fákba rendezve. 
Elfér egy CD-n. A brit nemzeti korpusz (British National Corpus) kibővíti ezt 100. millió 
szóra (Leech és társai, 2001). A világháló több mint egybillió szót tartalmaz, több mint 
10 millió szerveren tárolódik. 

Az információkeresés (informational retrieval) területe iránti érdeklődés újra nő, 
amelyet az internetes keresés széles körű elterjedése inspirál. Robertson egy korai át- 
tekintést ad, és bevezeti a valószínűségi rangsorolási elvet (Robertson, 1977). 
Manning és Schütze az NLP statisztikai megközelítésének kontextusában tárgyalja rö- 
viden az IR-t (Manning és Schütze, 1999). Baeza-Yates és Ribeiro-Neto általános cé- 
lú áttekintést ad (Baeza-Yates és Ribeiro-Neto, 1999), helyettesítve az olyan régi 
klasszikusokat, mint Salton és McGill (Salton és McGill, 1983), valamint Frakes és 
Baeza-Yates (Frakes és Baeza-Yates, 1992). A Gigabájtok kezelése (Managing Giga- 
bytes) c. könyv pont azt teszi, amit a címe mond: elmagyarázza hogyan lehet hatékonyan 
indexelni, tömöríteni és lekérdezni gigabájtos méretű korpuszokat (Witten és társai, 
1999). Az amerikai kormány Nemzeti Szabványügyi és Technológiai Intézete (National 
Institute of Standards and Technology, NIST) által szervezett TREC konferencia min- 
den évben megrendezi az IR-rendszerek versenyét, és kiadványában publikálja az ered- 
ményeket. A verseny első hét évében a részt vevő rendszerek teljesítménye körülbelül 
megduplázódott. 

A legnépszerűbb IR-modell a vektortér modell (vector space model) (Salton és tár- 
sai, 1975). Salton munkája uralta a terület korai éveit. Két alternatív valószínűségi mo- 
dell létezik. Mi a Ponte és Croft munkáján alapulót mutattuk be (Ponte és Croft, 1998). 
A P(D, 0) közös valószínűségi eloszlást P(?ID) segítségével modellezi. Egy alternatív 
modell (Maron és Kuhns, 1960; Robertson és Sparck Jones, 1976) a P(DIO)-t használ- 
ja. Lafferty és Zhai megmutatta, hogy a modellek ugyanazon a közös valószínűségi 
eloszláson alapulnak, azonban a modellválasztásnak következményei vannak a paramé- 
tertanításra (Lafferty és Zhai, 20019. Az általunk bemutatottak az ő munkájukon alapul. 
Turtle és Croft összehasonlítják a különféle IR-modelleket (Turtle és Croft, 1992). 

Brin és Page leírják egy világhálón kereső gép implementációját, taglalva a PAGERANK 
algoritmust is, mely a dokumentumok minőségének weblinkek elemzésén alapuló lekér- 
dezésfüggetlen mértéke (Brin és Page, 1998). Kleinberg leírja, hogyan lehet hiteles forrá- 
sokat találni a weben hivatkozáselemzéssel (Kleinberg, 1999). Silverstein és társai meg- 
vizsgáltak egy egymilliárd webkeresést tartalmazó logot (Silverstein és társai, 1998). 
Kukich felmérte a helyesírási hibák javításának irodalmát (Kukich, 1992). Porter leírja 
a klasszikus szabályalapú szótövesítő algoritmust (Porter, 1980), míg Krovetz egy szó- 
táralapú verziót ír le (Krovetz, 1993). 

Manning és Schütze a dokumentumosztályozás és klaszterezés alapos áttekintését 
adják (Manning és Schütze, 1999). Joachims statisztikai tanulási elméletet és szupport 
vektor gépeket alkalmazott annak elméleti vizsgálatára, hogy mikor sikeres egy osztá- 
lyozás (Joachims, 2001). Apté és társai a Reuters-hírek , Jövedelmek" kategóriába tör- 
ténő osztályozásánál 9699-os pontosságot publikált (Apté és társai, 1994). Koller és 
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Sahami 9596-os pontosságot ért el egy naiv Bayes-osztályozóval, és akár 98,692-ot is, 
ha olyan Bayes-osztályozót alkalmazott, amely bizonyos jellemzők közti összefüggése- 
ket is figyelembe vett (Koller és Sahami, 1997). Lewis áttekinti a Bayes-osztályozók 
negyvenéves alkalmazását szövegosztályzásra és visszakeresésre (Lewis, 1998). 

Az Information Retrieval újság és az éves SIGIR konferenciakiadványai a terület 
friss fejleményeit fedik le. 

A korai információkinyerő programok közé tartozik a Gus (Bobrow és társai, 1977) 
és a FRUMP (DeJong, 1982). A modern információkinyerő rendszerek egyes tervezési 
részletei az 1970-1980-as évekbeli szemantikai nyelvtanokkal foglalkozó kutatásokra 
vezethetők vissza. Például egy szemantikai nyelvtanokon alapuló repülőgép-foglaló 
rendszer interfésze olyan kategóriákkal rendelkezne, mint a Hely és a Repül, az NP-k 
és a VP-k helyett. Biímbaum és Selfridge munkája egy szemantikai nyelvtanon alapuló 
rendszer megvalósítását mutatja be (Birnbaum és Selfridge, 1981). 

Az újabb keletű információkinyeréssel foglalkozó munkákat az amerikai kormány 
által szponzorált Message Understand Conference (MUC) konferenciák mozgatták. 
A FASTUS-rendszert Hobbs és társai készítették (Hobbs és társai, 1997), és az a pub- 
likációgyűjtemény, amely bemutatja, további véges állapotú modelleket alkalmazó 
rendszereket is felsorol (Roche és Schabes, 1997). 

Az 1930-as években Petr Troyanskii beadott egy , fordítógépre" vonatkozó szaba- 
dalomkérelmet, azonban még nem állt rendelkezésre számítógép ötleteinek megvaló- 
sítására. 1947 márciusában a Rockefeller Alapítványnak dolgozó Warren Weaver az 
írta Norbert Weinernek, hogy a gépi fordítás megvalósítható lehet. A kriptográfiai és 
információelméleti munkákra alapozva Weaver azt írta, hogy: , Amikor egy orosz 
nyelvű cikket nézek, azt mondom, hogy vEzt igazából angolul írták, azonban furcsa 
szimbólumokkal kódolták. Most pedig nekiállok a dekódolásnak." A következő évti- 
zedben a közösség ilyen módon próbálta a dekódolást. Az IBM 1954-ben bemutatott 
egy kezdetleges rendszert. Bar-Hillel (Bar-Hillet, 1960), valamint Locke és Booth 
(Locke és Booth, 1955) leírták az ebben az időszakban meglévő lelkesedést. A gépi 
fordításból való későbbi kiábrándulást Lindsay írta le, aki a gépi fordítás néhány olyan 
akadályát is bemutatta, amelyek a szintaxis és a szemantika közti kölcsönhatáshoz és 
a világ ismeretének szükségességéhez kötődnek (Lindsay, 1963). Az amerikai kor- 
mány csalódott az előrehaladás hiánya miatt, ezt egy jelentés akként összegezte, hogy 
A gépi fordításnak nincs közvetlen vagy megjósolható jövője" (ALPAC, 1966). En- 
nek ellenére korlátozottan ugyan, de folytatódott a munka, és az amerikai légierő 
1970-ben , hadrendbe állította" a SYSTRAN-rendszert, míg az Európai Közösség 1976- 
ban kezdte azt használni. A TAuM-METEOo időjárásjelentés-fordító rendszer használata 
szintén 1976-ban indult (Ouinlan és O"Brien, 1992). Az 1980-as években a rendelke- 
zésre álló számítási teljesítmény eljutott arra a szintre, ahol az ALPAC megállapításai 
már nem voltak helyesek. Voorhees bemutat néhány Wordneten alapuló, közelmúltbe- 
li fordítási alkalmazást (Voorhees, 1993). Bevezető tankönyvet Hutchins és Somers írt 
(Hutchins és Somers, 1992). 

A statisztikai gépi fordítás Weaver 1947-es megjegyzéséig nyúlik vissza, azonban 
csak az 1980-as évekre jutott el gyakorlati szintre. Az általunk bemutatottak Brown és 
kollégáinak IBM-beli munkáin alapulnak (Brown és társai, 1988; 1993). Nagyon ko- 
moly matematikát alkalmaznak, ezért a Kevin Knight által írt kísérő oktatóanyag sokat 
segít a megértésben (Knight, 1999). A még frissebb statisztikai gépi fordítás területén 
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végzett munkák továbblépnek a bigram modellen, és olyan modelleket használnak, ame- 
lyek valamennyi szintaxist is figyelembe vesznek (Yamada és Knight, 2001). A mondat- 
szegmentáció terén Palmer és Hearst végezték a korai munkákat (Palmer és Hearst, 1994). 
Michel és Plamondon a kétnyelvű mondatillesztésről értekezik (Michel és Plamondon, 
1996). 

Két kitűnő könyv szól a valószínűségi nyelvfeldolgozásról: Charniak könyve rövid 
és lényegre törő (Charniak, 1993), míg Manning és Schütze munkája átfogó és napra- 
kész (Manning és Schütze, 1999). A gyakorlati nyelvfeldoigozás terén végzett munká- 
kat a kétévente megrendezett Applied Natural Language Processing (ANLP) és az 
Empirical Methods in Natural Language Processing (EMNLP) konferenciák, valamint 
a Natural Language Engineering folyóirat mutatja be. A SIGIR egy hírlevelet és egy 
információkeresést tárgyaló évenkénti konferenciát támogat. 


Feladatok 


23.1. (Jurafsky és Martin, 2000) alapján. Ebben a feladatban szerzőséget osztályozó 

ugyse rendszert fogunk kifejleszteni, amely egy adott szöveg esetén megpróbálja meg- 
határozni, hogy a két pályázó szerző közül melyik írta a szöveget. Szerezzünk 
be szövegeket két különböző szerzőtől. Válasszuk szét őket tanító és teszthal- 
mazokra. Tanítsunk unigram modellt mindkét szerző tanító halmaza alapján. 
"Végül minden egyes tesztelő szövegre számítsuk ki mindkét unigram modellre 
a valószínűséget, és rendeljük a legvalószínűbb modellhez. Határozza meg 
a technika pontosságát. Tudná növelni a pontosságot további jellemzőkkel? 
A nyelvészet ezen részterületét a stílusmérés tudományának (stylometry) ne- 
vezzük, sikerei közé sorolható a Federalist Papers (Mosteller és Wallace, 1964), 
valamint Shakespeare néhány vitatott munkája (Foster, 1989) szerzőjének meg- 
határozása. 





23.2. Ez a feladat az n-gram modellek minőségét méri fel. Keressen vagy hozzon lét- 
re körülbelül 100 ezer szavas egynyelvű korpuszt. Tördelje szavakra, és szá- 
mítsa ki az egyes szavak előfordulási gyakoriságát. Hány különböző szó ta- 
lálható benne? Ábrázolja a gyakoriságot a sorrend (leggyakoribb, második leg- 
gyakoribb stb.) függvényében 10g-log skálán. Határozza meg a bigramok (két 
egymást köbvető szó) és trigramok (három egymást követő szó) gyakoriságát 
is. Használja ezeket a gyakoriságokat nyelv generálására: az unigram, bigram 
és trigram modell alapján a gyakoriságnak megfelelő véletlen választással ge- 
neráljon 100 szavas szövegeket. Hasonlítsa össze ezeket a szövegeket a tény- 
legesen beszélt nyelvvel. Végül számolja ki az egyes modellek összetettségét. 














23.3. Ez a feladat a spam-felismeréssel foglalkozik. A spam definíciója , kéretlen tö- 
just meges reklám e-mail". A spam kezelése bosszantó elfoglaltság számos e-mailező 
számára, tehát megbízható eltávolításuk áldás lenne. Hozzon létre spam és spam- 
mentes e-mailekből álló korpuszt. Elemezze mindkét korpuszt, és állapítsa meg, 
hogy mely jellemzők lennének alkalmasok az osztályozásra (unigram, brigram, 
üzenethossz, feladó, érkezési idő). Ezután tanítson egy osztályozó algoritmust 
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23. VALÓSZÍNŰSÉGI NYELVFELDOLGOZÁS 


(döntési fa, naiv Bayes vagy más, Ön által választott algoritmus) egy tanító hal- 
mazon, majd értékelje pontosságát egy teszthalmazon. 


Készítsen öt lekérdezésből álló teszthalmazt, majd küldje el három nagy web- 
keresőnek. Értékelje mindegyik pontosságát az első 1, 3 és 10 dokumentumra és 
az átlagos reciprok rangra. Próbálja megmagyarázni az eltéréseket. 


Próbáljon megbizonyosodni arról, hogy az előbbi feladat keresőgépei közül 
melyek használnak betűkonverziót, szótövesítést, szinonimákat és helyesírási- 
hiba-javítást. 


Becsülje meg, hogy mekkora tárterület szükséges egy egymilliárd weboldalt 
tartalmazó korpusz indexeléséhez. Mutassa be a feltételezéseket, amelyekre 
alapozott. 


Írjon egy reguláris kifejezést vagy egy rövid programot vállalatnevek kinyeré- 
sére. Tesztelje üzleti híreket tartalmazó cikkeken. Adja meg az elért felidézést 
És pontosságot. 


Válasszon ki öt mondatot és küldje el egy internetes fordítószolgáltatásnak, 
Fordítsa le angolról egy idegen nyelvre, majd vissza angolra. Értékelje a kapott 
mondatokat nyelvtani helyesség és a jelentés megtartásának szempontjából. 
Ismételje meg a folyamatot; az iteráció második lépése rosszabb vagy azonos 
eredményeket ad? Befolyásolja az eredmény minőségét a közbenső nyelv meg- 
választása? 


Gyűjtsön össze időre vonatkozó kifejezéseket, például , két órakor", , éjfélkor", 
n12:46-kor". Találjon ki olyan nyelvtanilag helytelen példákat is, mint , huszon- 
öt órakor" vagy , félnegyedháromkor". Írjon nyelvtant az idő nyelvére. 


(Knight, 1999) alapján. Az IBM Model 3 gépi fordító feltételezi, hogy miután 

a szóválasztási modell egy szólistát ajánl, a nyelvi modell képes kiválasztani 

a legjobb permutációt. Ez a feladat megvizsgálja, hogy mennyire értelmes ez a 

feltételezés. Próbálja meghatározni a következő mondatok szavainak helyes 

sorrendjét: 

(a) have programming a seen never I language better 

(b) loves john mary 

(c) is the communication exchange of intentional information brought by about 
the production perception of and signs from drawn a of system signs con- 
ventional shared 

Melyik mondat szavait tudta sorrendbe tenni? Milyen tudás alapján volt erre ké- 

pes? Tanítson egy bigram modellt egy tanító korpusz alapján, és használja arra, 

hogy meghatározza egy tesztkorpusz mondatainak legnagyobb valószínűségű 

permutációit. Mutassa meg a modell pontosságát. a 
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23.11. Amennyiben megnéz egy angol-francia szótárt, a , hear" ige fordítása ,en- 
tendre".34 Azonban ha az IBM Model 3-at a kanadai Hansard alapján tanítjuk, 
akkor a , hear" legvalószínűbb fordítása , Bravo". Magyarázza meg, hogy mi 
ennek az oka, és becsülje meg, hogy mi lehet a , hear" termékenységi eloszlása. 
(Segítség: ha Hansard-szövegeket szeretne megnézni, írja be egy webkeresőbe 
a [Hansard hear] lekérdezést.) 


34 hal, hallgat (A ford.) 
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Ebben a fejezetben a számítógépet a zord, koszos világhoz csatlakoztatjuk. 


Az észlelés információhoz juttatja az ágenst arról a világról, amelyben létezik. Az ész- 
lelést az érzékelők (sensors) kezdeményezik. Egy érzékelő lehet bármi, ami a környe- 
zet valamelyik aspektusát rögzíti és továbbítja az ágensprogram számára. Ez olyan 
egyszerű is lehet, mint egy egybites érzékelő, amely egy kapcsoló be és ki állapotát 
jelzi, de lehet olyan bonyolult is, mint az emberi szem retinája, amely több mint száz- 
millió fotoérzékeny elemet tartalmaz. Ebben a fejezetben a látásra összpontosítunk, 
mert a fizikai világ kezelésében ez az észlelésfajta messze a leghatásosabb. 


24.1. BEVEZETÉS 


Egy mesterséges ágens több észlelési modalitással is rendelkezhet. Amin az ágensek és 
az emberek ís osztoznak, az többek között a látás, a hallás és a tapintás. A hallással a 
beszédfelismerés témán belül, a 15.6. alfejezetben foglalkozunk. A tapintás, máskép- 
pen a taktilis érzékelés (tactile sensing) a 25. fejezet témája, ahol a kézi műveleteket 
végző ágenseknél vizsgáljuk meg ennek a használatát, a fejezet hátralevő része pedig 
a látással foglalkozik. Egyes robotok aktív érzékelést (active sensing) végeznek, azaz 
kiküldenek egy jelet, mint például radar- vagy ultrahangjelet, és ennek a jelnek a kör- 
nyezetből érkező visszaverődését vizsgálják. 

Egy ágens kétféle módon használhatja az érzékeléseit. A tulajdonság kinyerési 
(feature extraction) megközelítés szerint az ágens néhány kevés számú tulajdonságot 
észlel az érzékelő bemenetein, és ezeket továbbítja az ágensprogramnak, amely a tulaj- 
donságoknak megfelelően reagál, vagy kombinálja őket más információkkal. A wumpus 
ágens ily módon működött, öt érzékelővel, amelyek mindegyike egybites információt 
nyert ki. Ma már ismert, hogy egy légy az optikai bemenetről tulajdonságokat nyer ki, 
és ezeket direkt módon a kanyarodásban segítő izmokhoz továbbítja, lehetővé téve, hogy 
30 milliszekundumon belül reagáljon, és irányt váltson. 

Az alternatív lehetőség a modellalapú (model-based) megközelítés, ahol a szenzo- 
ros bemenet alapján a világ egy modellje épül fel. E megközelítés szerint egy f függ- 
vényből indulunk ki, amely a világ W állapotát az általa keltett S ingerületre képezi le: 


s5-fw 


Az f függvényt a fizika és az optika határozza meg, és viszonylag jól ismerjük. S és egy 
valós vagy elképzelt W világ előállítása f-ből a számítógépes grafika (computer 
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graphics) által kezelt probléma. A számítógépes látás bizonyos értelemben a számító- 
gépes grafika fordítottja, ha adott f és S, akkor W-t próbáljuk kiszámítani: 


w-f-5) 


Sajnos az f-nek nincs jól definiált inverze. Nem láthatunk a sarkon túlra, így a világ 
aktuális állapotának minden aspektusát az ingerületből visszaállítani nem tudjuk. Sőt az 
a része, amit láthatunk, nagyban bizonytalan: kiegészítő információ nélkül nem tudjuk 
megmondani, hogy S egy játék Godzilla-képe, amint egy hatvan centiméteres modell- 
épületet tarol le, vagy egy valóságos szörnyeteg, amely egy hatvanméteres épületet 
pusztít el. Ezen problémák egy részét kezelhetjük úgy, hogy egy világ megtalálása he- 
lyett világok valószínűségi eloszlását határozzuk meg: 


P(W) — PWIS)P(S) 


Az ilyen modellezés legfontosabb hátránya az, hogy túl nehéz problémát kísérel meg 
megoldani. Gondoljunk bele, hogy a számítógépes grafikában többórányi számításra 
lehet szükség egy film egyetlen kockájának az előállításához, amiből 24 kocka kell má- 
sodpercenként, és f7! kiszámítása sokkal bonyolultabb, mint f-é. Világos, hogy ez túl 
sok számítás egy szuperszámítógép számára, hogy valós időben reagáljon, nem is 
beszélve egy légyről. Szerencsére az ágensnek nem kell a fényképhű számítógépes gra- 
fikához hasonló szintű modellel rendelkeznie a világról. Az ágensnek elegendő azt tud- 
nia, hogy rejtőzködik-e egy tigris a bozótban, és nem kell tudnia a tigris hátán levő min- 
den egyes szőrszál pontos elhelyezkedését és irányát. 

A fejezet nagy részében azt fogjuk látni, hogy hogyan kell objektumokat — például 
tigriseket — felismerni, továbbá olyan módszereket, amelyek ezt a tigris minden egyes 
részletének reprezentálása nélkül teszik. A 24.2. alfejezetben a képalakítás folyamatát 
tanulmányozzuk majd, definiálva az f(W) függvény egyes aspektusait. Először a folya- 
mat geometriájára tekintünk. Látni fogjuk, hogy a fény a világ objektumairól az ágens 
érzékelőjének képsíkján lévő pontokra verődik vissza. Ez a geometria magyarázza meg, 
hogy egy nagy Godzilla a távolban miért néz ki úgy, mint egy kis Godzilla a közelben. 
Ezután a folyamat fotometriáját vizsgáljuk, amely leírja, hogy a táj fénye hogyan hatá- 
rozza meg a kép pontjainak fényességét. A geometria és a fotometria együtt egy olyan 
modellt nyújtanak, amely leírja, hogy a világ objektumai hogyan képződnek le a kép- 
pontok kétdimenziós tömbjére. 

Annak megértése után, hogy hogyan jönnek létre a képek, megvizsgáljuk, hogy ho- 
gyan dolgozzuk fel őket. A vizuális feldolgozás folyamata az emberekben és a számító- 
gépekben is három részre bontható. Először, avagy az alacsony szintű látás során (24.3. 
alfejezet), a feldolgozatlan képet simítjuk, hogy kiszűrjük a zajt, majd a kétdimenziós 
kép tulajdonságait kinyerjük, elsősorban a kép régiói közötti éleket. A középső szintű 
látásban ezeket összekapcsolva régiókat hozunk létre. A magas szintű látásban (24.4. al- 
fejezet) a kétdimenziós régiókat mint a világ valóságos objektumait ismerjük fel (24.5. 
alfejezet). A képekben megtalálható olyan speciális információkat tanulmányozunk, 
amelyeket erre a célra felhasználhatunk, mint például a mozgást, a térbeli információt,a 
textúrát, az árnyalást és a kontúrokat. Az objektumfelismerés fontos a vadonban levő 
ágens számára, hogy észlelje a tigriseket, és fontos az ipari robotok számára, hogy meg- 
különböztesse az anyákat a csavaroktól. Végezetül a 24.6. alfejezet megmutatja, hogy 
az objektumok felismerése hogyan segíthet nekünk olyan hasznos feladatokban, mint 
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például a manipulálás vagy a navigáció. A manipulálás azt jelenti, hogy megragadha- 
tunk és használhatunk szerszámokat, illetve más tárgyakat, a navigáció pedig azt, hogy 
egyik helyről átmehetünk egy másikra anélkül, hogy nekimennénk valaminek. Ezeket 
a feladatokat észben tartva biztosíthatjuk, hogy egy ágens csak akkora modellt építsen, 
amire céljai eléréséhez szüksége van. 


24.2. KÉPALKOTÁS 


A látás egy jelenet (scene) objektumairól szóródó fényt összegyűjti, majd egy két- 
dimenziós képet (image) alkot egy képsíkon. A képsíkot fényérzékeny anyag borítja: 
a retinában rodopszinmolekulák, a negatív filmen ezüst-halogenidek, a digitális fény- 
képezőgépben pedig egy töltéscsatolt eszköz (CCD) lapka. A CCD minden cellája ösz- 
szegyűjti a fényelnyelés által adott idő alatt keltett elektronokat. A digitális fényképe- 
zőgépben a képsík egy néhány millió képpontból (pixel) álló négyzethálóra van 
felosztva. A szem hasonló képpontráccsal rendelkezik, amely körülbelül 100 millió 
pálcikát és 5 millió csapot tartalmaz egy hexagonális mozaikba rendezve. 

A jelenet nagyon nagy, és a képsík egészen kicsi, tehát lennie kell valamilyen módszer- 
nek a fény képsíkra fókuszálásához. Ezt megtehetjük lencsével vagy anélkül. Bárhogy is 
tesszük, a lényeg a geometria meghatározása, hogy megmondhassuk, a jelenet melyik 
pontja hova kerül a képsíkon. 





Lencsék nélküli képek: a sötétkamra 


A képalkotás legegyszerűbb eszköze a sötétkamra, amely egy doboz elején található 
kis lyukból (0) és a doboz hátsó részén levő képsíkból áll (lásd 24.1. ábra). Egy három- 
dimenziós koordináta-rendszert fogunk használni, amelynek az origója az 0 pont, a 
jelenet egy P pontját pedig az (X, Y, 2) koordinátákkal reprezentáljuk. A P pontot egy 





24.1. ábra, A képalkotás geometriája a sötétkamrában 
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P" pontra képezzük le a képsíkon, amelynek koordinátái (X, F, Z). Ha f az 0 pontszerű 
lyuknak a képsíktól vett távolsága, akkor a hasonló háromszögek alapján az alábbi 
egyenleteket tudjuk levezetni: 

-x X-y Y x -fX . zfY 

TT 2r 7 zzz 
Ezek az egyenletek egy perspektivikus vetítés (perspective projection) néven ismert 
képalkotási eljárást definiálnak. Vegyük észre, hogy a Z az osztóban azt jelenti, hogy 
minél távolabb van az objektum, annál kisebb lesz a képe. Valamint azt is figyeljük 
meg, hogy a kép, mind a bal-jobb, mind a fel-le irányban fordított a jelenethez képest, 
amit az egyenletekben a negatív előjel jelez. 

A perspektivikus vetítésben a párhuzamos vonalak a horizontvonalon lévő pontban 
futnak össze. Nézzük meg, miért szükségszerű ez! Az (Xg, Yg, 29) ponton keresztül (U, 
V, W) irányban áthaladó egyenes leírható, mint az (Xg t AU, Yg H AV, Zg 1 AW) pon- 
tok halmaza, ahol A a --oo és —o0 között változik. Ezen egyenes egy P) pontjának kép- 
síkra vett vetületét az: 


XOHAU  Xp-HAV 
Zo 4AW" " Zo HAW 


adja. Amint A — 00 vagy A — -oo ez a pont a p., — (fU/W, fV/ W) lesz, ha W 5 0. 
A Pp. Pontot az (U, V, W) irányú egyenesek családjával kapcsolatos távlatpontnak 
(vanishing point) nevezzük. Az azonos irányú egyenesek távlatpontja azonos. 

Ha a tárgy a kamrától vett távolságához képest viszonylag lapos, a perspektivikus ve- 
títést a skálázott ortografikus vetítéssel (scaled orthographic projection) közelíthet- 
jük. Ennek elve a következő. Ha a tárgy pontjainak Z mélysége egy bizonyos Zg t AZ 
tartományban változik, és AZ — Zo, akkor a perspektíva f/Z skála tényezőjét az 
s — f/ Zo állandóval lehet közelíteni. Az (X, Y, 2) jelenet koordinátákból a képsíkra tör- 
ténő vetítés egyenletei az x — sX és az y — sY lesznek. Jegyezzük meg, hogy a skálázott 
függőleges síkú vetítés egy közelítés, amely a jelenet azon részeire érvényes, amelyek- 
nek a saját mélységváltozásuk elenyésző. A globális tulajdonságok tanulmányozására 
ezt a módszert nem szabad használni. Hogy az óvatosság nem árt, erre egy példa: füg- 
gőleges síkú vetítésben a párhuzamos vonalak párhuzamosak maradnak ahelyett, hogy 
egy távlatpontban összefutnának. 





f 8 j 


Lencserendszerek 


A gerincesek szeme és a modern kamerák is lencséket használnak. A lencse a sötétkamra 

nyílásánál nagyobb, így több fényt enged át. Ennek az az ára, hogy egyidejűleg a jelenet 

minden részének az élességét nem lehet biztosítani. A jelenet egy Z távolságban lévő pont- 

jának a képe a lencsétől egy rögzített Z" távolságban keletkezik, és a Z és a Z" között az: 
KRSLERI 
mé átállt a 

reláció áll fenn, ahol f a lencse fókusztávolsága. Ha a lencse optikai középpontja és 

a képsík közötti távolságot valamilyen Zg-nak választjuk, a jelenet azon tárgyai, ame- 
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lyek a Zg körül egy adott mélységtartományban fekszenek, ahol Zg a megfelelő tárgy- 
távolság, nagyjából élesen fognak látszani. A jelenet ezen mélységi tartományát mély- 
ségélességnek (depth of field) nevezzük. 

Jegyezzük meg, hogy mivel a Z tárgytávolság általában sokkal nagyobb, mint a Z" 
képtávolság vagy mint az f, sokszor jogos az alábbi közelítés: 

es og zat 

ZSZ Tf, 
Azaz a képtávolság Z" sz f. A sötétkamra vetítésegyenleteit tehát egy lencse által létre- 
hozott kép geometriájának leírásához is használhatjuk. 

Ahhoz, hogy a különböző Z távolságban lévő tárgyakat élesen lássuk, az emberi 
szem lencséje (lásd 24.2. ábra) változtatja az alakját, a kamera lencséje pedig Z irány- 
ban elmozdul. 





Szivárványhártya 
Szaruhártya 


Látógódör 
ögsgegöőbáőb § Látóideg 


Optikai tengely / 


Retina 






Szemlencse 





24.2. ábra. Az emberi szem vízszintes keresztmetszete 


A fény: a képalkotás fotometriája 


A fény nélkülözhetetlen a látáshoz: nélküle minden kép egyformán sötét lenne, függet- 
lenül attól, mennyire érdekes a jelenet. A fotometria (photometry) a fény tanulmányo- 
zása. Saját céljainkra azt fogjuk modellezni, hogy a jelenet fénye hogyan képződik le 
az időben a képsík fényintenzitására, amit Xx, y)-nal! jelölünk. A látás rendszere ezt a mo- 
dellt visszafelé alkalmazza, a képek intenzitásából kiindulva a világ tulajdonságai felé. 
A 24.3. ábra egy asztalon lévő tűzőgép digitalizált képét és a tűzőgép egy 12 x 12 kép- 
pontból álló részletét mutatja. Egy számítógépes program, amely értelmezni próbálja a 
képet, egy ilyen intenzitásmátrixból indulna ki. 


1 Ha az időbeli változást is vizsgáljuk, akkor az Ax, y, 1) jelölést alkalmazzuk. 
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24.3. ábra. (a) Egy asztalon lévő tűzőgép fényképe. (b) Az (a) egy 12 x 12 képpontból álló, nagyított 
részlete. (c) A részletnek megfelelő képfényességértékek egy 0-tól 255-ig tartó skálán. 


A kép egy képpontjának a fényessége arányos a jelenet képpontba vetített felület- 
eleme által a kamera felé irányított fény mennyiségével. Ez viszont függ a felületelem 
fényvisszaverő tulajdonságaitól és a fényforrások elhelyezésétől, valamint eloszlásától 
a jelenetben. Egy képpont fényességébe a jelenet egyéb részeinek fényvisszaverő tulaj- 
donságai is beleszólnak, hiszen a jelenet más felületei indirekt fényforrásként szolgál- 
nak, mivel a rájuk eső fényt az adott fejületelem felé verik vissza. 

Kétféle visszaverődést modellezhetünk. A tükröző visszaverődés (specular reflec- 
tion) azt jelenti, hogy a fény a tárgy külső felületéről verődik vissza, és teljesíti azt 
a kényszert, miszerint a beesés és a visszaverődés szöge megegyezik. Ilyen a tökéletes 
tükör viselkedése. A diffúz visszaverődés (diffuse reflection) azt jelenti, hogy a fény 
a tárgy felszínén belülre hatol, a tárgy a fényt elnyeli és ismételten kisugározza. A tö- 
kéletesen diffúz (avagy Lambert-féle) felület minden irányban azonos intenzitással 
szórja a fényt. Az intenzitás egyedül a fényforrástól érkező fény beesési szögétől függ: 
a felületre pontosan merőleges fényforrás esetén lesz a legnagyobb intenzitású a refle- 
xió, míg majdnem párhuzamos fényforrás esetén a legkisebb. E két véglet között a visz- 
szaverődést Lambert koszinusztörvénye írja le: 

I — kigcos8 
ahol s a fényforrás intenzitása, a felület normálisa és a fény beesési iránya közötti szög, 
k a visszaverődési tényező értéke, amely a felület visszaverési képességeitől függ, és 
0-tól (tökéletesen fekete felület) 1-ig (tökéletesen fehér felület) változik. 

A valódi életben a felületek kevert, diffúz és tükrös tulajdonságúak. Számítógépes 
modellezésük a számítógépes grafika fő alkalmazási területe. A valósághű képek elő- 
állítása általában fénysugár-követési eljárással történik, amely szimulálja azt a fizikai 
folyamatot, ahogy a fénysugár a forrásnál keletkezik, és a tárgyakról többszörösen 
visszaverődik. 
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Színek: a képalkotás spektrális fotometriája 


A 24.3. ábrán egy fekete-fehér képet mutattunk, nagyban figyelmen kívül hagyva azt a 
tényt, hogy a látható fény a hullámhosszak egész tartományát öleli át — a 400 nm-től 
kezdve a spektrum ibolyaszínű végénél, egészen a 700 nm-ig a vörös színű végénél. Bi- 
zonyos fény csak egyetlen hullámhosszból áll, amely a szivárvány egy színének felel 
meg. De más fények különböző hullámhosszok keverékei. Azt jelenti ez, hogy az Kx, y) 
mértékére egyetlen szám helyett az értékek egy keveréke kell? Ha a fény fizikáját pon- 
tosan akarnánk reprezentálni, akkor bizony igen. De ha csak utánozni akarjuk az embe- 
rek (és más gerincesek) fényérzékelését, akkor köthetünk kompromisszumokat. Kísér- 
letek mutatják (egészen 1801-től, Thomas Youngtól), hogy hullámhosszak bármilyen 
komplex keverékét is előállíthatjuk mindössze három szín keverésével. Azaz, ha van egy 
fénygenerátor, amely képes lineárisan kombinálni három hullámhosszt (tipikusan 
a vörös [700 nml, a zöld [546 nm) és a kék (436 nm színeket választjuk), akkor az egyes 
színeket erősítő, másokat gyengítő gombok csavargatásával bármilyen hullámhossz-kom- 
bináció beállítható, legalábbis az emberi érzékelés szempontjából. Ez a kísérleti tény azt 
jelenti, hogy a képek egy olyan vektorral reprezentálhatók, amely képpontokként csak há- 
rom intenzításértéket tárol: minden elsődleges hullámhosszra egyet. A gyakorlatban 
mindegyiket egy bájttal ábrázolva a kép igen jó minőségű reprodukcióját kapjuk. A szí- 
nek ezen háromszínű észlelése azzal a ténnyel van összefüggésben, hogy háromféle csap 
található a retinában, amelyek érzékelési maximuma 650, 530 és 430 nm, de az összefüg- 
gés pontos részletei az egy az egyben történő leképezésnél bonyolultabbak. 
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Láttuk eddig, hogy a fény hogyan tükröződik a jelenet tárgyairól egy mondjuk ötmillió 
hárombájtos képpontból álló képet formálva. Mint minden érzékelő esetében, most is 
lesz zaj a képben, és minden esetben nagyon sok adattal kell dolgozni. Elsőként a fino- 
mítás műveleteit nézzük meg, amelyekkel a zaj csökkenthető, majd az éldetektálás 
műveleteit vizsgáljuk. Ezeket , előzetes" vagy , alacsony szintű" műveleteknek hívjuk, 
mivel ezek az elsők egy műveletsorozatban. Az előzetes látási műveletekre egyrészt 
a lokalitás jellemző (a kép egy részletére végrehajthatók anélkül, hogy néhány képpont- 
nál messzebb bármit is figyelembe vennénk), másrészt az ismeretek hiánya: anélkül 
finomíthatjuk a képeket vagy detektálhatunk éleket, hogy bármilyen fogalmunk lenne 
arról, milyen objektumok vannak a képeken. Ez az alacsony szintű műveleteket esé- 
lyessé teszi a párhuzamos hardveren történő megvalósításra, akár élőlényekben, akár 
mesterséges eszközökben. Ezek után a középső szinten levő műveletek nézzük majd 
meg, amelyekkel a kép régiókra bontható. A műveletek ezen fázisa még mindig a ké- 
pen dolgozik, nem a jeleneten, de nem helyi feldolgozást igényel. 

A 15.2. alfejezetben a simítás (smoothing) azt jelentette, hogy egy állapotváltozó 
értékét jósoltuk meg valamilyen múltbeli / időpontra, bizonyos, a t időpontra és továb- 
bi, egészen a jelenig terjedő időpontokra vonatkozó tények ismeretében. Most ugyan- 
ezt az ötletet alkalmazzuk a térbeli kiterjedésre az időbeli helyett: a simítás egy képpont 
értékének jóslását jelenti a környező képpontok alapján. Vegyük észre, hogy világosan 
megkülönböztetjük a képpontban mért megfigyelt értéket és azt a valódi értéket, amit 
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ott mérnünk kellett volna. Ezek véletlenszerű és szisztematikus mérési hibák (például 
ha a CCD érzékelője elromlott) miatt különbözhetnek. 

A simítás egyik módszere az, ha minden képponthoz az őt környező szomszédok 
értékeinek átlagát rendeljük. Ez az extrém értékek kihagyása felé mutató megoldás. 
De hány szomszédot kell figyelembe vennünk — az egy képpontnyi távolságra vagy a 
kettő esetleg több pont távolságra lévőket? Erre egy válasz, amely jól működik Gauss- 
zajok kiszűrésére, a Gauss-szűrőt (Gaussian filter) használó súlyozott átlag. Emlékez- 
zünk a standard ő szórással rendelkező Gauss-függvényre: 





1 3 g 
G(x) — es (2e. egy dimenzióban, illetve 
Hi Pro? só 
G (xy) szgév vy29 két dimenzióban. 
Te 


Egy Gauss-szűrő alkalmazása azt jelenti, hogy az F(xo, yo) intenzitást lecseréljük a 
minden (x, y)-ra kiszámolt I(x, y)G (d) intenzitások összegével, ahol d az (xp, yo) és az 
(x, y) pontok távolsága. Az ilyen fajta súlyozott összeg olyan gyakori, hogy van számá- 
ra egy speciális elnevezés és jelölés. Azt mondjuk, hogy a h függvény az f és a g függ- 
vények konvolúciója (convolution) (amit A — f 3 g alakban írunk), ha 


400 
ht) — D f080 0) egy dimenzióban, illetve 
u 00 
ne ka § . 
higy XX fünYalx—ny—v) két dimenzióban. 


1m—XV—— 00 
Azaz a simított függvényt úgy kapjuk, hogy a képet a Gauss-függvénnyel konvolváljuk: 
1 x G,. Egy képpontnyi a kevés zaj kisimításához elegendő, míg 2 képpontnyi több zajt 
fog elsimítani, de valamilyen mértékű részletvesztés mellett. Mivel a Gauss-hatás a távol- 
sággal eltűnik, a gyakorlatban a -k 00 a szummákban -t 39-val helyettesíthető. 


Éldetektálás 


Az előzetes látás következő lépése az élek (edges) detektálása a képsíkon. Az élek olyan 
egyenes vagy görbe vonalak a képsíkon, amelyekre merőlegesen a kép fényességében 
s lényegesen" változás van. Az éldetektálás végső célja, hogy eltávolodjunk a bonyolult, 
több megabájtos képtől egy tömörebb, absztrakt reprezentáció felé, mint amilyen a 24.4. 
ábrán látható. Az indíték az, hogy a kép élkontúrjai a jelenet fontos kontúrjainak felelnek 
meg. A képen három mélységi diszkontinuitás példa szerepel 1-gyel címkézve; a 2-vel 
címkézett felületi orientáció diszkontinuitásból két példa látható, míg a 3-mal címkézett 
visszaverődési képesség diszkontinuitásokról és a 4-gyel címkézett fényességi diszkonti- 
nuitásokról (árnyék) egy-egy. Az éldetektálás csak a képpel foglalkozik, így nem tesz 
különbséget a jelenet ezen diszkontinuitásfajtái között, de a későbbi feldolgozás igen. 

A 24.5.(a) ábra egy asztalon nyugvó tűzőgépet tartalmazó jelenet képét mutatja, 
a 24.5.(b) pedig a képre lefuttatott éldetektáló algoritmus eredményét mutatja. Láthatjuk, 
hogy az éldetektáló kimenete és az ideális vonalas ábra között van különbség. A kis részek 
élei nem mind illeszkednek egymáshoz, vannak hézagok, ahol nincsenek vonalak, valamint 
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24.4. ábra. Különféle élek: (1) mélységi diszkontinuitás, (2) felületi orientáció diszkontinuitás, (3) visz- 
szaverődési képesség diszkontinuitás, (4) fényességi diszkontinuitás (árnyékok) 





(a) b 
24.5. ábra. (a) Egy asztalon nyugvó tűzőgép fényképe. (b) Az (a) alapján meghatározott élek, 


szajos" kontúrok, amelyek a jeleneten semmilyen lényeges vonásnak nem felelnek meg. 
A későbbi feldolgozási fázisokban ezeket a hibákat majd korrigálni kell. Hogyan detektál- 
juk a képen az éleket? Figyeljük meg a kép fényintenzitás-profilját egy egydimenziós ke- 
resztmetszet mentén egy élre merőleges irányban, pl. az asztal bal éle és a fal között. Nagy- 
jából olyan lesz ez, mint amit a 24.6. (a) ábra mutat. Az él helye az x — 50-nek felel meg. 

Tekintettel, hogy az élek azoknak a képhelyeknek felelnek meg, ahol a fényességben 
hirtelen változás tapasztalható, egy naiv ötlet az lehetne, hogy a képet differenciáljuk, 
és azokat a helyeket keressük meg, ahol az /"(x) derivált értéke nagy. Nos, az ötlet 
majdnem működőképes. A 24.6. (b) ábrán láthatjuk, hogy az x — 50 csúccsal együtt 
más helyeken, másodlagos csúcsok is megjelentek (például x — 75), amiket tévesen 
valódi éleknek fogadhatunk el. A jelenség oka a kép zajossága. Ha a képet először 
simítjuk, akkor a felesleges csúcsok eltűnnek, ahogy azt a (c) mutatja. 

Van arra esélyünk, hogy optimalizáljuk a munkát ezen a ponton: egyetlen művelet- 
ben kombinálhatjuk a simítást és az éldetektálást. Egy tétel szerint tetszőleges f és g 
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függvények esetén megmutatható, hogy a konvolúció deriváltja (f x g) megegyezik a 
derivált konvolúciójával: f x (g)". Tehát ahelyett, hogy először simítanánk, majd diffe- 
renciálnánk, egyszerűen konvolváljuk a képet a Gauss simító függvény deriváltjával, 
G7, -val. Így az egydimenziós éldetektálás algoritmusa a következő: 


I. Az F képet a G5 -val kell konvolválnunk, hogy az R-et megkapjuk. 

2. Jelöljük be az azokat a csúcsokat I[RCOI[-ben, amelyek egy előre definiált 7 küszöb- 
nél magasabbak. A küszöb értékét úgy határozzuk meg, hogy a zaj miatti másodla- 
gos csúcsokat elimináljuk. 


Két dimenzióban egy él irányítottsága tetszőleges 8 szögű lehet. A függőleges élek de- 
tektálásának módja nyilvánvaló: G(x) G. (y-nal kell konvolválnunk a képet. A hatás 
) irányban simító (a Gauss-konvolúció miatt), x irányban pedig egy simítással kísért 
differenciálás. A függőleges élek detektálási algoritmusa így az alábbi: 


1. Konvolváljuk az 7 (x, y) képet az fy(x, y) — G/ (2) G, (v)-nal, hogy az Ry(x, y) -t 
megkapjuk. 

2. Jelöljük be azokat a csúcsokat az IIRy.(x, y)II-ben, amelyek egy előre definiált 7, kü- 
szöbnél magasabbak. 


A tetszőleges orientációjú él detektálásához a képet két szűrővel: az fy — Gf.(x) G,(w) 


és az fir — G5 (v) G(x) szűrővel kell konvolválni (az fy az fy 90"7-kal elforgatott válto- 
Zata). A tetszőleges ( orientációjú éldetektáló algoritmus az alábbi: 
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24.6. ábra. Felül: Az X(x) intenzitásprofil egy egydimenziós részlet mentén egy lépcsőfok élén át, 
Középen: Az intenzitás deriváltja, F(x). A függvény nagy értékei éleknek felelnek meg, de a függvény 
zajos. Lent: Az intenzitás simított változatának deriváltja, (7 GY, amely / s Gj-hoz hasonlóan egy 
lépésben számolható. Az x — 75 pontban levő zajos él jelölt eltűnt. 
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1. Konvolváljuk az / €r, y) képet az fv €x, y)-nal, valamint az fiz Cr, y)-nal, hogy az Rys 3-t 
és az Ry(x, y) -t megkaphassuk. Definiáljuk az R(x, y) — Re, 9) Rá y-t. 

2. Jelöljük be azokat a csúcsokat az [IR(x, y)II-ban, amelyek egy előre definiált 7 kü- 
szöbnél magasabbak. 


Miután ezzel az algoritmussal megjelöltük az élek képpontjait, a következő lépés az 
azonos élekhez tartozó képpontok összekötése. Ez megtehető, ha feltételezzük, hogy 
bármely két szomszédos képpont, amely élpont és konzisztens irányítottságú, szükség- 
szerűen ugyanahhoz az élhez tartozik. Ezt a folyamatot Canny-féle éldetektornak 
(Canny edge detection) nevezzük, kitalálója, John Canny után. 

Miután detektáltuk őket, az élek alkotják több következő feldolgozási lépés alapját: fel- 
használhatjuk őket a térbeli képalkotásban, a mozgásdetektálásban és az objektumok 
felismerésében. 


A kép szegmentálása 


Az emberek rendszerezik észleléseiket; az egyes fotóérzékelőkhöz tartozó fényességértékek 
halmaza helyett vizuális csoportokat észlelünk, amelyek általában objektumokkal vagy 
azok részeivel asszociáltak. Ez a képesség a számítógépes látás számára is éppúgy fontos. 

A szegmentálás (segmentation) a kép felbontása részcsoportokra a képpontok hason- 
lósága alapján. Az alapötlet a következő: minden képponthoz rendelhetünk bizonyos 
vizuális tulajdonságokat, mint például fényesség, szín és mintázat? Ezek az attribútu- 
mok egy objektumon vagy annak egyetlen részén belül, csak kismértékben változnak, 
míg az objektumok közötti határok mentén tipikusan egyik vagy másik attribútum jelen- 
tősen változik. Úgy kelt a képet képpontok halmazaira felosztanunk, hogy ezeket a kény- 
szereket amennyire csak lehet, kielégítsük. 

Többféle módszer létezik ezen intuitív elképzelés matematikai formalizálására. Pél- 
dául Shi és Malik (Shi és Malik, 2000) ezt gráfparticionálási problémaként határozzák 
meg. A gráf csomópontjai a képpontoknak felelnek meg, az élek pedig a köztük levő 
kapcsolatoknak. Egy Wij súly értéke az i és j képpontokat összekötő élen attól függ, 
hogy a két képpont mennyire hasonló fényességben, színben, mintázatban és más tulaj- 
donságokban. Ezek után olyan partíciókat keresnek, amelyek minimalizálnak egy 
normalizált vágási kritériumot. Durván fogalmazva a gráf particionálásának kritériuma, 
hogy a csoportok közötti élek súlyainak összegét minimalizáljuk, a csoportokon belüli 
élek súlyainak összegét pedig maximalizáljuk. 

A pusztán alacsony szintű, helyi tulajdonságokon — például a fényességen és színen — 
alapuló szegmentáció hibázásra hajlamos eljárás. Ahhoz, hogy az objektumokhoz ren- 
delt határokat megbízhatóan megtalálhassuk, a jelenetben várható objektumfajtákról 
magas szintű tudást is be kell építenünk. A beszédfelismerésre ezt a rejtett Markov- 
modell formalizmusa teszi lehetővé, míg a képek kontextusában egy ilyen egységes 
keretrendszer még mindig az aktív kutatás tárgya. Mindenesetre az objektumokról szóló 
magas szintű tudás a következő alfejezet tárgya. 


? A mintázati jellemzők a képpontra középpontozott kis felületdarabka statisztikai elemzésén alapulnak. 
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Ebben az alfejezetben azt mutatjuk meg, hogyan kell a kétdimenziós képből kiindulva 
a jelenet háromdimenziós reprezentációjáig eljutni. Fontos, hogy a jelenettel foglalkoz- 
zunk, hiszen végső soron az ágens a világban létezik, nem a képsíkon, a látás célja 
pedig annak elérése, hogy az ágens a világ objektumaival együttműködjön. Mindazon- 
által az ágensek többségének csak a jelenet egyes aspektusainak korlátozott absztrakt 
reprezentációjára van szüksége, nem minden részletre. A könyv hátralevő részében 
látható, a világgal foglalkozó algoritmusok az objektumok tömör leírására építenek, 
nem minden háromdimenziós felületdarabka kimerítően teljes számbavételére. 

Elsőként az objektumfelismerést (object recognition) tárgyaljuk, azt a folyamatot, 
amely során a képek jellemzői (mint például az élek) átalakulnak ismert objektumok 
(mint például a tűzőgépek) modelljeivé. Az objektumfelismerés három lépésből áll: 
a jelenet szegmentálása különálló objektumokra, mindegyik objektum pozíciójának és 
térbeli orientációjának a megfigyelőhöz képesti meghatározása, valamint mindegyik 
objektum alakjának a meghatározása. 

A manipulálási és a navigálási feladatok szempontjából legfontosabb az objektum 
pozíciójának és térbeli orientációjának (az objektum ún. helyzetének — pose) a meg- 
határozása a megfigyelőhöz képest. Ahhoz, hogy egy nyüzsgő gyárban eligazodjunk, 
tudnunk kell az akadályok elhelyezkedését, mert akkor egy olyan pályát tudunk tervez- 
ni, amely az akadályokat kikerüli. Ha egy tárgyat szeretnénk felvenni és kézben tartani, 
a kézhez képesti helyzetet kell ismernünk, mert csak így tudjuk generálni a megfelelő 
pályájú cselekvésszekvenciát. A manipulálást és a navigálást tipikusan szabályozási hu- 
rokban oldjuk meg - az érzékelők információja visszacsatolást jelent, amivel a robot 
vagy a robotkar mozgását befolyásolni tudjuk. 

Használjunk most matematikai jelölést a pozíció és az orientáció leírására. A jelenet 
egy P pontjának a pozícióját három szám jellemzi, a P pont (X, Y, Z) koordinátái a sötét- 
kamra nyílásában elhelyezett origójú és az optikai tengellyel parallel Z tengelyű koor- 
dináta-rendszerben (lásd 24.1. ábra). Amivel rendelkezünk, az a kép egy pontjának (x, y) 
perspektivikus vetülete. Ez egyben a fénysugarat is definiálja a nyílás felől, amely men- 
tén valahol elhelyezkedik a P pont. A P pont távolságát azonban nem ismerjük. Az , ori- 
entáció" fogalmát kétféle értelemben lehet használni: 


1. Az objektum egészének az orientációja. Ezt egy háromdimenziós forgatási függvény- 
ben specifikálhatjuk, az objektum koordináta-rendszerét a kameráéhoz viszonyítva. 

2. Az objektum felületének az orientációja a P pontban. Ez egy n normál vektorral 
adható meg, amely a felületre merőleges irányt határozza meg. A felület orientációját 
sokszor a lejtéssel (slant) és a dőléssel (tilt) fejezzük ki. A dőlés az n és a Z tengely 
által bezárt szög. A lejtés az X tengely és az n képsíkra vett vetülete által bezárt szög. 


Amikor a kamera a tárgyhoz képest elmozdul, az objektumnak mind a távolsága, mind 
az orientációja megváltozik. Ami viszont nem fog változni, az a tárgy alakja (shape). 
Ha a tárgy pl. egy kocka, akkor a kocka jellege nem változik, ha a tárgy mozog. A geo- 
metria kutatói századok óta próbálkoznak az alak fogalmának formalizálásával — abból 
az alapötletből kiindulva, hogy az alak az a valami, ami bizonyos transzformációcsoport 
- pl. a forgatások és a transzlációk kombinációi — hatására nem változik. A nehézség ab- 
ban rejlik, hogy hogyan keressük meg a globális alak egy olyan reprezentációját, amely 
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elegendően általános ahhoz, hogy a valódi világ alakbeli változékonyságát — és nem 
csupán oly egyszerű formákat, mint a hengerek, a kúpok és a gömbök — lefedje, és még- 
is könnyen kinyerhető legyen a vizuális bemenetből. A felület fokáfis alakjának a jellem- 
zése sokkal jobban feltárt. Ez lényegében a görbülettel lehetséges — azaz azzal, hogy 
hogyan változik a felület normálisa, ha a felületen különböző irányokba elmozdulunk. 
A sík esetén egyáltalán nincs változás. A henger esetén sincs, ha a tengely mentén ha- 
ladunk, a rá merőleges irányban azonban a normális, a henger sugarával fordítottan ará- 
nyos ütemben forog. Ezekkel a kérdésekkel a differenciálgeometria foglalkozik. 

A tárgy alakja bizonyos manipulációs feladatok szempontjából fontos, pl. ahhoz, hogy 
eldöntsük, hogy a tárgyat hol fogjuk meg. Legfontosabb szerepe azonban a tárgyak fel- 
ismerésében van, ahol a geometriai alak a színnel és a textúrával egyetemben a legjel- 
lemzőbb vonást jelenti, hogy a tárgyakat azonosíthassuk, a kép tartalmát a korábban 
látott osztályokba besoroljuk és így tovább. 

Az alapvető probléma a következő: ha egyszer a perspektivikus vetítés alatt a három- 
dimenziós világ egy pontból kiinduló sugár mentén található minden pontja a képnek 
ugyanabba a pontjába vetítődött, hogyan nyerjük vissza a háromdimenziós információt? 
A vizuális érzékelésben ehhez számos segítő dolog áll rendelkezésre, a mozgást, a szte- 
reolátást, a textúrát, az árnyalást és a kontúrokat beleértve. Ezek mindegyike, ahhoz 
hogy a kép értelmezését (közel) egyértelmű módon megoldhassa, a jelenetre vonatkozó 
háttér-feltételezéseken alapul. Az alábbiakban ezekkel a módszerekkel foglalkozunk. 


A mozgás 


Eddig egy időpontban csak egy képpel foglalkoztunk. A videokamerák azonban másod- 
percenként 30 képkockát rögzítenek, és a kockák közötti különbségek fontos információk 
forrásai lehetnek. Abban az esetben, ha a kamera a háromdimenziós jelenethez képest mo- 
zog, a képen keletkező látszólagos mozgást optikai folyamnak (optical flow) nevezzük. 
A folyam a képbeli jellegzetességek mozgásirányát és mozgási sebességét írja le, amít a je- 
lenet és a megfigyelő egymáshoz viszonyított relatív mozgásának következtében kapunk. 
A 24.7. (a) és (b) ábrán egy forgó Rubik-kockát ábrázoló videofelvételből látunk két film- 
kockát. A (c) képen az előbbi képekből számított optikai folyam vektorai láthatók. Az op- 
tikai folyam a jelenet struktúrájára nézve tartalmaz hasznos információt. Például egy moz- 
gó kocsiból kinézve a távoli tárgyaknak sokkal lassúbb a látszólagos mozgása, mint a kö- 
zelieknek, így a látszólagos mozgás üteme a távolságról is hordoz valamiféle információt. 

Az optikai folyam vektormezeje az x irányú v,(x, y) és az y irányú v,(x, y) komponen- 
sekkel jellemezhető. Ahhoz, hogy az optikai folyamot megmérhessük, meg kell találni 
az egymásnak megfelelő pontokat a szomszédos képkockákon. Ehhez azt a tényt hasz- 
náljuk fel, hogy az egymásnak megfelelő pontok körüli képrészeknek hasonló a fényes- 
ségmintázata. Tekintsük a p, (xo. yo) képpont körül íg időpillanatban csoportosuló 
képponttömböt. Ezt a tömböt a íg 4- D, időpillanatban a különböző (xpt D,, yot D) 
pozíciójú gy képpontjelöltek körül csoportosuló képponttömbökkel össze kell hasonlíta- 
ni. A hasonlóság egyik szóba jöhető mértéke a különbségek négyzetösszege (sum of 
sguared differences, SSD): 


SSDD.D)- TU0530—KxtDgyt.Dyt4.D))? 
(ay) 
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(a) (b) (9 
24.7. (a) Rubik-kocka egy forgó lemezkorongon. (b) Ugyanaz a kocka 19/30 másodperccel később 
(Richard Szeliski nyomán), (c) Az (a) és (b) képek összehasonlítása alapján számolt optikai folyam vek- 
torok (Joe Weber és Jitendra Malik hozzájárulásával). 


Az (x, y) az 0 , yo) képpont körüli tömb képpontjainak halmazán fut végig. Megkeres- 
sük most azt a (D,, D, )-t, amely az SSD-t minimizálja. Az (xp, yo)-beli optikai folyam 
ilyenkor: (v,., v,)) — (D,/D,, D,/D). Altematívaként maximalizálhatjuk a keresztkorre- 
lációt (cross-correlation): 


Korreláció(D,.,D,) — 3: IGY DIX 4D ay TD, t4D) 
(xy) 
A keresztkorreláció akkor használható a legjobban, ha a jelenet képében textúra talál- 
ható, mert ekkor a vizsgált ablakokban nagy a fényességváltozás a képpontok mentén. 
Ha egy egyenletesen fehér falra nézünk, a különböző g jelöltekre számított kereszt- 
korreláció majdnem azonos lesz, és az algoritmus a gyakorlatban véletlenszerűen fog 
választani. 

Tegyük fel, hogy a megfigyelő T transzlációs és szögsebességgel rendelkezik (ame- 
lyek így a sajátmozgást (egomotion) írják le]. Származtatni tehet olyan összefüggé- 
seket, amelyek a megfigyelő sebességét, az optikai folyamot és a jelenet tárgyainak 
a pozícióját kapcsolják össze. Tegyük fel, hogy f — 1, akkor: 

T, T 
PV (xy)—[——— —wy twyj—x[— 
jéé IZEgYS o] e] ZER) 
T 


1 
Z(xy) Z(xy) 


ahol Z(x, y) az (x, y) képponthoz tartozó jelenetbeli pontnak a z koordinátája. 

A képlet jobb megértését szolgálja, ha az egyszerű transzláció esetét nézzük. Ebben 
az esetben a folyammező: 
-T, XT -T4)T, 

Zty) Z(x,y) 
lesz. Néhány érdekes tulajdonságot figyelhetünk meg. Az optikai folyam mindkét kom- 
ponense, v.(x, y) és v.(x, y) is zérus az x — 7, /T., y — T,/T. pontban. Ezt a pontot a 








— ügy b wya 








— ty ku x 
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v,. (x,y) — vy(x,y) — 
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folyammező expanziófókuszának (focus of expansion) nevezzük. Tegyük fel, hogy az 
xy sík origóját az expanziófókuszba helyezzük át. Ilyenkor az optikai folyam kifejezé- 
sei igen egyszerű formát öltenek. Jelölje (x) y") az x"— x—T, /T,, és azy!— y-T, /T, 
által definiált új koordinátákat. Ekkor: 
XT, yT, 

ZGy) Z(xy) 

Ennek az egyenletnek van néhány érdekes alkalmazása. Tegyük fel, hogy ön egy légy, 
amely egy falra próbál leszállni, és azt szeretné tudni, hogy adott aktuális sebesség mel- 
lett mennyi idő múlva ér a falhoz. Ezt az időt a Z /T, adja meg. Figyeljük meg, hogy 
annak ellenére, hogy a pillanatnyi optikai folyam nem képes sem a Z távolságot, sem 








v,(xy)— vaty) 
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248. ábra. (a) Egy olyan videokép-sorozat négy kockája, amelyben a kamera a tárgyhoz képest mozgott 
És forgott. (b) A sorozat első képkockája, amelyen apró négyzetek jelzik a tulajdonságfelismerő által meg- 
talált tulajdonságokat (Carlo Tomasi hozzájárulásával). 
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249. ábra. (a) A 24.8. ábrán látható kép tulajdonságai elhelyezkedésének háromdimenziós rekonstruk- 
ciója. (b) A valódi ház ugyanabból a perspektívából. 
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a T, sebességi komponenst megadni, a kettő arányát meg tudja adni, és így a leszállás 
irányításában felhasználható. Az élő legyekkel való kísérletek alátámasztják, hogy a le- 
gyek pontosan ezt a mechanizmust használjak. A legyek a legmerészebb repülők az 
állatok és gépek között, és érdekes, hogy ezt egy olyan látórendszerrel teszik, amelynek 
borzasztóan gyenge a térbeli felbontása (körülbelül 600 érzékelője van, összehasonlítva 
az emberek 100 milliójával), de kiemelkedő az időbeli felbontása. 

A mélység kiszámításához több képkocka használata szükséges. Ha a filmre egy merev 
testet veszünk fel, akkor ennek alakja képkockáról képkockára nem fog változni, és így az 
optikai folyam természeténél fogva zajos méréseit jobban kezelhetjük. Az egyik ilyen 
megközelítés eredményét a 24.8. és a 24.9. ábrán láthatjuk (Tomasi és Kanade, 1992). 


Kétkamerás (binokuláris) térbeli látás 


A legtöbb gerincesnek két szeme van. Ez hasznos redundancia arra az esetre, ha elve- 
szítené az egyiket, de más módon is segít. A legtöbb zsákmányállatnak a feje oldalán 
vannak a szemei, hogy nagyobb területet beláthasson. A ragadozóknak elöl, hogy két- 
kamerás térbeli látást (binocular stereopsis) valósíthassanak meg. Maga a gondolat 
a mozgási parallaxisra igen hasonlít, azonban az eltérő időpontokhoz tartozó képek 
helyett két (vagy több), térben szeparált képet használunk, hasonlóan ahhoz, mint ami- 
lyeneket pl. az előrenéző emberi szemek szolgáltatnak. Tekintettel arra, hogy a jelenet 
egy adott jellemzője az egyes képsíkok z koordinátájához képest más helyen lesz a ké- 
pen, ha a két képet egymásra fektetjük, a képjellemző elhelyezkedésében a két kép kü- 
lönbséget - diszparitást (disparity) — fog mutatni. Ez látszik a 24.10. ábrán, ahol a pi- 
ramis legközelebbi pontja balra mozdult el a jobb oldali képen, és jobbra a bal oldalin. 


Az észlelt tárgy 


Jobb kép 








24.10. ábra. A térbeli látás alapgondolata: különböző kamerapozíciók ugyanannak a háromdimenziós 
jelenetnek kissé eltérő kétdimenziós nézeteit eredményezik 
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24L A diszparitás és a mélység összefüggése a sztereolátásban 


Dolgozzuk ki a diszparitás és a mélység geometriai kapcsolatát. Először azt az ese- 
tet vizsgáljuk meg, amikor a két szem (illetve a két kamera) előrenéz, és optikai tenge- 
lyük párhuzamos. A jobb és a bal kamera kapcsolata így egy b nagyságú (bázisvonal) 
transzláció az x koordináta-tengely mentén. A H — v, At vízszintes és V — v Ar függő- 
leges képeltérés számításához az optikai folyam előbb megismert kifejezéseit használ- 
hatjuk, T, — b/At, T, — T, —0 mellett. AZ w,, iwy, ÉS w rotációs paraméterek zérusok. 
Azt kapjuk eredményül, hogy H — b/Zés V — 0. Szavakkal megfogalmazva ez azt jelen- 
ti, hogy a vízszintes képeltérés a bázisvonal és a mélység aránya, a függőleges eltérés 
pedig zérus. 

Normális látási körülmények között az emberek fixálnak, azaz összetartóan néznek 
előre (fixate), vagyis a jelenetben létezik egy olyan pont, amelyben a két optikai 
tengely metszi egymást. A 24.11. ábra egy Po pontra fixáló szemeket mutat, amely 
pont a két szem középvonalától Z távolságban helyezkedik el. Az egyszerűség kedvé- 
ért szögeltérést fogunk számítani radiánban. Az összetartás Pp pontjában az eltérés 
zérus. A jelenet egy ő Z-vel távolabbi P pontja esetén számíthatjuk a P pont P; bal és a 
Ppjobb oldali képének a szögeltolódását. Ha azok mindegyike a Pg -hoz képest 69 /2 
szöggel eltolt, akkor a P, és a Pp eltolódása, ami a P képeltérése, pontosan 60. Egyszerű 
geometriai átalakításokból azt fogjuk kapni, hogy: 


69. -b 
BE -g 


Embereknél a b bázísvonal (baseline) kb. 6 cm. Tegyük fel, hogy Z kb. 100 cm. A legki- 
sebb detektálható 6? (ami a képpont nagyságával függ össze) kb. 5 szögmásodperc, avagy 
242 x 107 radián, amiből a őZ 04 mm-re adódik. Z — 30 cm-re őZ — 0,036 mm-es 
lenyűgöző értéket kapunk. Ez azt jelenti, hogy 30 cm-es távolságban az emberek akár a 
0036 mm-es képmélység különbség megkülönböztetésére is képesek. Ez teszi lehetővé, 
hogy be tudjuk fűzni a cérnát egy tűbe, és hasonló műveleteket tudunk elvégezni. 
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Textúragradiensek 


A mindennapi nyelvben a textúra vagy felületmintázat (texture) a felület kitapintha- 
tó tulajdonságaira vonatkozik (az angol nyelvben ugyanazzal a szótővel rendelkezik, 
mint maga a szövet). A számítógépes látásban a textúra egy ehhez közeli fogalomra, 
egy felületnek a síkban ismétlődő, vizuálisan érzékelhető mintázatára vonatkozik. Pél- 
daként említhetjük egy épület ablakainak a mintázatát, egy szvetter köté: 
a leopárd foltos bundáját, a pázsit fűszálainak a mintázatát, kavicsokat a strandon vagy 
embertömeget egy stadionban. Az elrendezés néha közel periodikus, mint például a kö- 
tési szemek a szvetteren, más esetekben, mint például a strandon lévő kavicsok esetén, 
a szabályosság csak statisztikai értelemben létezik — a kavicsok sűrűsége a strand 
különböző részein nagyjából azonos. 








(b) 


24.12. ábra. (a) A textúragradienseket illusztráló jelenet. Feltéve, hogy a valós mintázat egyforma, lehe- 
tövé teszi a felület irányágának a meghatározását. A számított irányt a képen oly módon elhelyezett fehér 
kör és nyíl jelzi, mintha a kört a felületre festették volna abban a pontban. (b) Egy ívelt felület alakjának 
meghatározása a mintázat alapján. (A képeket Jitendra Malik és Ruth Rosenholtz hozzájárulásával 
közöljük [Malik és Rosenholtz, 1994].) 


Amit most a jelenetre vonatkozóan állítottunk, igaz. A képen a textúraelemek vagy 
texelek (texels) látszólagos nagysága, alakja, távolsága stb. igencsak változik, ahogy ezt 
a 24.12. ábra mutatja. A csempelapok a jeleneten azonosak. A lapok kivetített nagysá- 
gának és alakjának megváltozásában két fő ok játszik szerepet: 


1. Az egyes texeleknek a kamerától vett változó távolsága. Emlékezzünk arra, hogy 
a perspektivikus vetítésben a távoli tárgyak kisebbnek tűnnek. A skálatényező 1/Z. 

2. Az egyes texelek változó rövidülése. Ez a texeleknek a kamerából kiinduló rálátási 
irányhoz viszonyított orientációján múlik. Rövidülés nincs, ha a texel a rálátási 
irányra merőleges. A rövidülés mértéke cos a-val arányos, ahol a c a texel síkjának 
a lejtése. 

Egy kevés matematikai elemzést követően meghatározhatjuk a különböző texeltulaj- 

donságok, mint pl. a terület, a rövidülés és a sűrűség változási mértékének kifejezéseit. 


3 avagy ,textile" (A ford.) 
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Ezek az ún. textúragradiensek (texture gradients) a felület alakjának és a megfigye- 
lőhöz képesti dőlésének és lejtésének a függvényei. 

Ahhoz, hogy az alakot a textúrából kinyerhessük, kétlépcsős eljáráshoz kell folyamod- 
nunk: (a) először mérjük a textúragradienseket; (b) majd becsüljük a mért gradienseket 
okozni látszó felületalakot, azok dőlését és lejtését. A 24.12. ábra mutatja ezen eljárás 
eredményeit, 


Árnyalás 


Az árnyalást (shading) — a jelenethez tartozó felület különböző részeiről kapott meg- 
világítás intenzitásváltozását — a jelenet geometriája és a felület-visszaverési tulajdonságai 
határozzák meg. A számítógépes grafikában a feladat a kép Kx,y) fényességfügg- 
vényének a megadása, ha a jelenet geometriája és a visszaverődési tulajdonságok adottak. 
A számítógépes látásban azt reméljük, hogy ez a folyamat invertálható, vagyis visszaál- 
líthatjuk a jelenet geometriáját és visszaverődési tulajdonságait, ha az Kx, y) képfényesség 
adott. A probléma olyan nehéznek bizonyult, hogy a legegyszerűbb esetektől eltekintve 
e téren nem sikerült eredményeket elérni. 

Induljunk ki egy olyan példából, ahol az alakot tényleg visszanyerhetjük az árnyalás- 
ból. Tekintsünk egy Lambert-féle felületet, amit egy távoli, pontszerű fényforrás világít 
meg. Tételezzük fel azt is, hogy a felület messze van a kamerától, így függőleges síkú 
vetítést fogunk használni a perspektivikus vetítés megközelítésére. A kép fényessége: 


IKx,y) —kníx, y)- s 


ahol k egy skálaegyüttható, n a felület normál egységvektora és s a fényforrás irányába 
mutató egységvektor. Mivel n és s egységvektorok, skalárszorzatuk a kettő közötti szög 
koszinusza. A felület alakját az n felület menti változása tartalmazza. Tételezzük fel, 
hogy k és s ismertek. A problémánk most a felület n normálisának a kiszámítása, ha az 
IKx,y) képfényesség adott. 

Az első megjegyzés, amit meg kell tenni, az az, hogy az n meghatározása az adott 
(x,y) képpontfényesség ismeretében lokálisan alulhatározott. Ki tudjuk ugyan számíta- 
ni az n és a fényforrás közötti szöget, ez azonban az n-et csak annyiban korlátozza, 
hogy egy bizonyos, s irányú és 0 — cos"(Z/k) palástszögű kúp felületén helyezkedik el. 
Hogy továbbléphessünk, jegyezzük meg, hogy képpontról képpontra az n változása 
nem lehet tetszőleges. Egy síma felület normálisa csak sima módon változhat — amely 
korlátozást az integrálhatóság (integrability) szakkifejezéssel jelöljük. Ezt a felisme- 
rést számos módszerben fel is használják. Egy lehetséges eljárás az n átírása a Z(x,y) 
mélység Z, és Z parciális deriváltjainak felhasználásával. Ennek eredménye Z egy parci- 
ális differenciálegyenlete, amit megfelelő határfeltételek figyelembevételével Z(x, y)-ra 
nézve meg lehet oldani. 

Az eljárás általánosítható. Nem szükséges, hogy a felület Lambert-féle legyen, és az 
sem, hogy a fényforrás pontszerű legyen. Lényegében ugyanez a módszer használható, 
ha sikerül a felület R(n) reflektanciatérképét (reflectance map) meghatározni, amely 
a felületelem fényességét annak n normálisa függvényében fejezi ki. 

Az igazi nehézség a kölcsönös visszaverődések kezelése. Egy tipikus belsőtérjelenet 
esetén, mint például egy irodában lévő tárgyak esetén a felületeket nem csupán a fény- 
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források világítják meg, hanem a jelenet más felületeitől visszavert fény is, amelyek 
tényleges másodlagos fényforrásokként szolgálnak. Ezek a kölcsönös megvilágítási ha- 
tások igen jelentősek lehetnek. Az ilyen helyzetben a refiektanciatérkép megközelítés 
teljes mértékben használhatatlan — a kép fényessége nemcsak a normálison múlik, hanem 
a jelenet különböző felületeinek bonyolult térbeli viszonyain is. 

Az ember az árnyalásból képes valamilyen mértékű alakinformáció kinyerésére, így 
ez a probléma — minden nehézsége ellenére — továbbá is érdekes marad. 


Kontúrok 


Amikor egy olyan vonalas rajzot nézünk, mint amilyen a 24.13. ábra, a kép egy három- 
dimenziós elrendezés életszerű benyomását kelti bennünk. Hogyan lehetséges ez? Hiszen 
láttuk korábban, hogy egy és ugyanaz a vonalas kép végtelen sok jelenet konfigurációból 
származhat. Figyeljük meg, hogy még a felszín lejtésének és emelkedésének érzetét is 
megkapjuk. Ez minden bizonnyal (a tipikus alakzatokra vonatkozó) magas szintű tudás és 
valamilyen alacsony színtű kényszerek összekapcsolásának következtében lehetséges. 


a Én 





24.13. ábra. Egy felidéző vonalas rajz (Isha Malik hozzájárulásával) 


A vonalas ábrában rejlő kvalitatív tudással fogunk foglalkozni. Korábban láttuk, 
hogy a rajz vonalainak különféle lehet a fontossága (lásd 24.4. ábra és kísérőszövege). 
Az a folyamat, ahogy a kép minden vonalának a tényleges fontosságát megállapítjuk, 
a vonalcímkézés (line labeling), és ez volt a számítógépes látás által elsőként tanulmá- 
nyozott problémák egyike. Tegyük fel egyelőre, hogy a világ olyan leegyszerűsített 
modelljével dolgozunk, ahol a tárgyaknak nincsenek felületei, és ahol az olyan vonala- 
kat, amelyek megvilágítási diszkontinuitásokból adódnak, mint amilyenek az árnyék- 
élek és a tükrözések, valamilyen előfeldolgozó eljárással a képből kiemeltük. A figyel- 
münket így olyan vonalas ábrákra összpontosíthatjuk, ahol minden vonal vagy mélységi, 
vagy orientáció diszkontinuitáshoz tartozik. 
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Mindegyik vonalat ezek után vagy egy a felület határán megjelenő pszeudoél 
(timb) vetületének (ami a felület azon pontjainak összessége, ahol a rálátás iránya a 
felület érintője), vagy egy élnek (edge) lehet tekinteni (ami a felület normálisának 
egy diszkontinuitása). Az éleket továbbá konvex, konkáv vagy határoló élosztályok- 
ba sorolhatjuk. A pszeudoélek és a határoló élek esetén érdekes annak az eldöntése, 
hogy a vonalas ábrán a görbét határoló két felületből melyik van hozzánk közelebb. 
Ezeket a következtetéseket úgy képzelhetjük el, hogy mindegyik vonalhoz a 6 lehet- 
séges vonalcímkének (line label) az egyikét rendeljük hozzá, ahogy az a 24.14. 
ábrán látható. 


24.14. ábra. Különféle vonalcímkék 


1. A ,-4" és a ,—" címkék rendre a konvex és a konkáv éleket jelentik. Ezeket az olyan 
normális diszkontinuitásokhoz rendeljük, ahol az él mentén találkozó mindkét felü- 
let látható. 

2. A ,—" És a ,—" határoló konvex éleket jelentenek. A kamerával felülről nézve az él 
mentén találkozó mindkét felületelem azonos oldalon fekszik úgy, hogy az egyik elta- 
karja a másikat. Ha a nyíl irányába mozgunk, a felületek hozzánk képest jobbra esnek. 

3. A ,—6" és a , 0—" címkék a pszeudoéleket jelölik. Az ilyen helyeken a felület 
sima módon görbül, és saját magát takarja. Ha a dupla nyíl irányába lépünk, a felü- 
let tőlünk jobbra helyezkedik. A rálátás iránya a pszeudoél minden pontjában a felület 
érintője. Ahogy a nézőpont változik, a pszeudoél a felület mentén mozog. 


Egy ábrán található n számú vonal kombinatorikusan elvileg lehetséges címke-hozzá- 
rendelésből csupán csekély számú hozzárendelés lehetséges fizikailag. Ezeknek a cím- 
kézéseknek a megállapítása az ún. vonalcímkézési probléma. Jegyezzük meg, hogy 
a probléma csak akkor értelmes, ha a címke a vonal mentén nem változik. Ez nem min- 
dig igaz, hiszen a görbült objektumok képein a címke egy vonal mentén igenis változ- 
hat. Ebben a részben ez nem jelent problémát, mert csak poliéderes objektumokkal 
foglalkozunk. 

A poliéderes jelenetelemzéssel először Huffman és tőle függetlenül Clowes próbál- 
koztak (Huffman, 1971; Clowes, 1971). Huffman és Clowes elemzésüket a nem átlátszó 
triéderes (trihedral) testekből — azaz olyan testekből, amelyeknél mindegyik sarok- 
pontjánál pontosan három felület fut össze — álló jelenetek esetére korlátozták. A több 
objektumot tartalmazó jelenetek esetén kizárták a triéderes feltételt megsértő objektum- 
konfigurációkat is, mint amilyen például az egyik élük mentén érintkező két kocka. 
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Nem engedték a repedéseket (cracks) sem, azaz olyan , éleket", amelyek mentén a tan- 
genciális síkok folytonosan változnak. A triéderes világban Huffman és Clowes kimerí- 
tő listát adtak az összes különböző sarokponttípusról meg arról is, hogy azok hogyan 
látszhatnak általános nézőpontból szemlélve. Az általános nézőpont feltétel lényegében 
azt tételezi fel, hogy az összes csatlakozás megtartja a jellegét, ha a szem csak kissé moz- 
dul el. Ha például a képen három vonal metszi egymást, akkor a feltételből következik, 
hogy a jelenet hozzájuk tartozó éleinek szintén metszeniük kell egymást. 





24.15. ábra. A triéderes csúcsok négy fajtája 


A 24.15. ábra mutatja azt a négyféle helyzetet, ahogy a három síkfelület egy sarok- 
pontban találkozhat. Ezeket az eseteket úgy szerkesztettük, hogy egy kockát nyolc 
oktánsra (octant) bontottunk. A triéderes sarokpontok egész választékát szeretnénk ge- 
nerálni a kocka középpontjában úgy, hogy a különböző oktánsokat kitöltjük. Az 1-es 
címkéjű sarokpont az egyetlenegy kitöltött oktánshoz tartozik, a 3-as címkéjű a három 
kitöltött oktánshoz és így tovább. Az olvasónak kellene belátnia, hogy ezek tényleg 
kimerítik az összes lehetséges helyzetet. Ha valaki például a kockában két oktánst 
kitölt, akkor nem lesz képes a középpontban egy érvényes triéderes sarokpontot meg- 
szerkeszteni, Jegyezzük meg azt is, hogy ezen négy eset a sarokpontban találkozó kon- 
vex és konkáv élek különböző kombinációinak felel meg. 

A sarokpontban találkozó három él a körülöttük lévő teret nyolc oktánsra osztja. 
A sarokpontot bármely, anyaggal nem kitöltött oktánsból lehet szemlélni. A nézőpont 
oktánson belüli elmozdítása a képen látható csatlakozások jellegét megváltoztatni nem 
fogja. A 24.15. ábrán látható 1-es címkéjű sarokpontot a maradó hét oktánsból szemlél- 
ve a 24.16. ábrán látható csatlakozáscímkéket kapjuk. 

Annak kimerítő vizsgálata, hogy egy sarokpont milyen módon látható, a 24.17. ábrán 
felsorolt lehetőségekhez vezet. A képen négy különböző csatlakozástípust azonosítha- 
tunk: L, Y, nyíl- és T csatlakozást. Az L csatlakozás a két látható él esete. Az Y és a 
nyílcsatlakozás három élnek felel meg. Az Y csatlakozásban a szögek egyike sem lépi 
túl a 1807-ot. A T csatlakozás a takarással kapcsolatos. Ha egy közeli, nem átlátszó felü- 
let egy távolabbi élt eltakar, egy fél éllel találkozó folytonos élt kapunk. A T csatlakozás 
négy címkéje a négyféle él takarásának felel meg. 
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24.17. ábra. A Huffman-Clowes-címkekészlet 


Ha egy vonalas rajzot ennek a csatlakozásszótárnak a segítségével címkézünk meg, 
a probléma annak a megállapítása, hogy mely csatlakozásinterpretációk lesznek globá- 
lisan konzisztensek. A konzisztenciát az a szabály kényszeríti ki, miszerint a rajzon egy 
vonalnak egy és csakis egy címkéje lehet a vonal egész hosszában. Ezen probléma 
algoritmikus megoldását Waltz adta meg (pontosabban egy olyan kibővített probléma 
megoldását adta meg, amely az árnyékot, a görbületi diszkontinuitásokat (repedéseket) 
és a szétválaszthatóan konkáv éleket is figyelembe veszi (Waltz, 1975]). Az algoritmus 
a kényszerkielégítés egyik legelső alkalmazása volt az MI területén (lásd 5. fejezet). 
A kényszerkielégítés nyelvén a változók a csatlakozások, a változók értékei a csatlako- 
zások címkézése, a kényszer pedig az, hogy minden vonalnak csak egy címkéje van. 
Bár a triéderes vonalcímkézési probléma NP-teljes, a közönséges kényszerkielégítési 
algoritmusok a gyakorlatban jól működnek, 
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A látás lehetővé teszi számunkra, hogy megbízhatóan felismerjünk embereket, állato- 
kat és élettelen dolgokat. Az MI-ben, illetve a számítógépes látásban az objektum- 
felismerés fogalmát szokás szerint mindezen dolgokra alkalmazzák. Ez magában foglalja 
a képen rögzített objektumok osztályának felismerését — például: ez egy arc, illetve adott 
objektumok felismerését is — például: ez Bili Clinton arca. A motivációt ilyen alkalma- 
zási területek jelentik: 


. . Biometrikus azonosítás (biometric identification): a bűnügyi vizsgálatok és a védett 
létesítmények belépésszabályozása megköveteli az egyének azonosítását. Az ujjlenyo- 
matok, az íriszlenyomat és az arcképek olyan képeket eredményeznek, amelyeket 
adott egyénekhez kell rendelni. 

s  Tartalomalapú képkeresés (content-based image retrieval): könnyű egy doku- 
mentumban megtalálni azt a helyet — ha létezik -, ahol a , macska" szó szerepel. Bár- 
melyik szövegszerkesztő képes erre. Most gondoljon arra a feladatra, hogy egy 
képen megtalálja a képpontok azon részhaimazát, amely egy macska képének felel 
meg. Ha valaki rendelkezne ezzel a képességgel, akkor megválaszolhatna olyan 
kereséseket, mint például , Bill Clinton és Nelson Mandela együtt", egy , görkoris 
a levegőben", , az Eiffel-torony éjszaka" stb., anélkül hogy egy gyűjtemény minden 
egyes fényképéhez feliratkulcsszavakat kellett volna rendelnünk. Ahogy a kép- és 
videogyűjtemény növekszik, a kézi feliratozás lehetetlenné válik. 

: . Kézírás-felismerés (handwriting recognítion): például az aláírások, borítékok címme- 
zői, csekkeken szereplő összegek és a kéziszámítógépek tollalapú beviteli megoldása. 


A látást nemcsak objektumok, hanem cselekvések felismerésére is használjuk. Felismer- 
hetünk járásmódokat (egy barát járását), kifejezéseket (egy mosolyt, egy grimaszt), gesz- 
tikulációt (egy integető embert), cselekvéseket (ugrást, táncot) és így tovább. A cselek- 
vésfelismerést célzó kutatás még gyerekcipőben jár, így ebben az alfejezetben az 
objektumfelismerésre koncentrálunk. 

A vizuális objektumok felismerésének feladata általában könnyű az emberek számá- 
ra, de a számítógépek számára igen nehéznek bizonyult. Fel akarjuk ismerni egy ember 
arcát függetlenül a megvilágítás, a kamerához képesti helyzet és az arckifejezés külön- 
böző variációitól. Ezen variációk bármelyike széles körű változásokat eredményez a 
képpontok fényességértékeiben, így a képpontok közvetlen összehasonlítása valószínű- 
leg nem fog működni. Ha valaki egy kategória (például az , autó") példányait szeretné 
felismemi, akkor a kategórián belüli variációkat is figyelembe kell vennie. Még a postai 
irányítószámoknál a kézzel írt számjegyek felismerésének igen korlátozott feladata is 
komoly kihívásnak bizonyult. 

A felügyelt tanulás vagy a mintaosztályozás természetes keretet biztosít az objektum- 
felismerés tanulmányozásához. Pozitív (, arcok") és negatív példaként (, nem arcok") 
adott képek esetében a cél egy olyan függvény megtanulása, amely az új képeket 
felcímkézi az arc és a nem arc jelölésekkel. A 18. és 20. fejezet összes technikája lehet- 
séges jelölt a feladatra: többrétegű perceptronokat, döntési fákat, legközelebbi-szomszéd 
osztályozókat és kemelgépeket alkalmaztak már objektumfelismerési feladatokra. Meg 
kell azonban jegyeznünk, hogy ezen technikák alkalmazása objektumok felismerésére 
távolról sem egyértelmű. 
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Az első kihívás a kép szegmentálása. Minden kép tipikusan több objektumot fog tar- 
talmazni, így először olyan képpontrészhalmazokra kell osztanunk, amelyek egy-egy 
objektumnak felelnek meg. Miután a képet régiókra osztottuk, utána a régiókat vagy 
az azokból összeállított egységeket átadjuk egy osztályozónak, hogy meghatározza az 
objektumok címkéit. Sajnálatos módon a lentről felfelé szegmentáció hibákra érzé- 
keny eljárás, ezért altematív megoldásként kínálkozik a fentről lefelé objektumcsoport 
meghatározása. Eszerint keresni kell egy képpontrészhalmazt, amit arcként lehet osz- 
tályozni, és ha ez sikerült, máris van egy csoportunk! A tisztán fentről lefelé módsze- 
rek nagyon számításigényesek, mivel különböző méretű képablakokat kell megvizs- 
gálni különböző helyszíneken, és az összes különböző objektumhipotézissel össze kell 
vetni őket. Jelenleg a leginkább gyakorlati objektumfelismerő rendszerek ilyen fentről 
lefelé stratégiát alkalmaznak, bár ez megváltozhat, ahogy a lentről felfelé technikák 
fejlődnek. 

A második kihívás annak biztosítása, hogy a felismerés folyamata kellően robusztus 
a megvilágítás és az elhelyezkedés változásaira. Az emberek fel tudnak ismerni objek- 
tumokat a képpontok fényességértékeivel mért pontos megjelenés jelentős változásai 
ellenére is. Például egy barát arcát különböző fényviszonyok mellett vagy különböző 
látószögekből is felismerjük. Egy ennél is egyszerűbb példaként megvizsgálhatjuk a kéz- 
Zel írt 6-os számjegy felismerését. Képesnek kell lenni a 6-os felismerésére KÜlööböZŐ, 
méretekben, a kép különböző pozícióiban és a kép kisebb elforgatásai ellenére i: is4 

A kulcsmomentum azt észrevenni, hogy a geometriai transzformációk, mint például 
az elfordítás, a méretváltás és a forgatás, vagy a kép fényességének megváltozásai a 
fényforrások fizikai mozgatása által, más jellemzőkkel rendelkeznek, mint a kategórián 
belüli variációk, mint például az emberek arcainak különbözőségei. Nyilvánvaló, hogy 
a tanulás az egyetlen mód az emberi arcok különbözőségeinek megtanulására vagy 
a 4-es számjegy különböző írásmódjainak felismerésére. Másrészről a geometriai és 
fizikai transzformációk hatásai szisztematikusak és kiküszöbölhetők a tanuló minták 
paramétereit leíró tulajdonságok megfelelő tervezésével. 

Annak érdekében, hogy a geometriai transzformációkra vonatkozó invarianciát biz- 
tosítsuk, egy egészen hatékonynak bizonyult eljárás a kép régiójának előfeldolgozása 
úgy, hogy standard pozícióba, méretre és orientációra alakítjuk. Egy alternatív megol- 
dás az, ha egyszerűen figyelmen kívül hagyjuk a geometriai és fizikai transzformációk 
alkalmi természetét, és úgy gondolunk rájuk, mint az osztályozó variálhatóságának egy 
újabb forrására. A tanító minták halmazában az összes ilyen variációra példákat kell el- 
helyeznünk, és abban reménykedünk, hogy az osztályozó kikövetkeztet egy megfelelő 
transzformációhalmazt a bemenetre, és így kiszűri a variációkat. 

Vizsgáljunk meg most az objektumfelismerésre szolgáló speciális algoritmusokat! 
Az egyszerfiség érdekében kétdimenziós összeállításban fogjuk a problémát vizsgálni, 
ahol mind a tanuló, mind a tesztminták kétdimenziós fényességábrák formájában adot- 
tak. Olyan területeken, mint például a kézírás-felismerés, ez nyilvánvalóan elegendő. 
Még háromdimenziós objektumok esetében is hatékony stratégia az objektumokat több 
kétdimenziós nézettel reprezentálni (lásd 24.18. ábra), és az új objektumokat a (valami- 
lyen reprezentációjú) tárolt nézetekkel összehasonlítva osztályozni. 





3 A teljes elforgatásínvariancia nem szükséges és nem is kívánatos — ekkor a 9-es és a 6-os összekeverhető 
lenne! 
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24.18. ábra. Két háromdimenziós tárgy többféle nézete 


Az előző alfejezet megmutatta, hogy több tényező vesz részt a háromdimenziós in- 
formáció kinyerésében egy jelenetből. Az objektumfelismerés is több tényezőn alapszik 
— egy tigrist a narancs és fekete színek keveredéséről, csíkos mintázatáról és testének 
alakjáról ismerünk fel. 

A szín és a mintázat hisztogramok vagy empirikus frekvenciaeloszlások segítségével 
reprezentálható. Ha adott egy tigris képe mintaként, akkor megmérhetjük a különböző 
színű képpontok arányát. Ezután, ha egy ismeretlen példát látunk, összevethetjük a szín 
hisztogramját a korábbi tigrispéldákná! látottakkal. A mintázatok elemzéséhez a kép 
különböző irányú és skálázású szűrőkkel történt konvolúciója után kapott eredményei- 
nek hisztogramjait vizsgáljuk, egyezést keresve. 

Az alak felhasználása az objektumfelismerésben sokkal bonyolultabbnak bizonyult. 
Nagyjából két irányzatot különböztethetünk meg: fényességalapú felismerést 
(brightness-based recognition), ahol a képpontok fényességértékeit direkt módon 
használjuk, és jellemzőalapú felismerést (feature-based recognition), ahol kiemelt 
jellemzők, mint például az élek vagy a kulcspontok részteges elrendezését használjuk. 
Miután részletesebben megvizsgáltuk e két megközelítést, tárgyalni fogjuk a pozíció- 
becslést (pose estimation), azaz az objektum helyzetét és irányát a jelenetben. 


Fényességalapú felismerés 


Ha adott egy képponthalmaz, amely egy lehetséges objektumnak felel meg, akkor válasz- 
szuk a jellemzőknek magukat a képpontok fényességeit. Egy másik variáció szerint először 
konvolválhatjuk a képet többféle lineáris szűrővel, és az eredményül kapott kép pontjainak 
értékeit tekinthetjük a jellemzőknek. Ez a megközelítés különösen sikeres olyan feladatok- 
ban, mint a kézzel írt számjegyek felismerése, ahogy azt a 20.7. alfejezetben láthattuk. 
Sokféle statisztikai módszert használtak arra, hogy képeket tartalmazó adatbázisok 
segítségével arcfelismerőket fejlesszenek ki, mint például feldolgozatlan képpontbeme- 
neten működő neurális hálókat képpontbemenettel, vonal- és élszűrők által előállított 
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egy 


24.19. ábra. Egy arcmegtaláló algoritmus eredménye (Henry Schneiderman és 
Takeo Kanade hozzájárulásával) 


jellemzőket használó döntési fákat és wavelet-jellemzőket használó, naiv Bayes-model- 
leket. Az utóbbi módszer néhány eredménye a 24.19. ábrán látható. 

A feldolgozatlan képpontok jellemző vektorként történő használatának egy negatív 
aspektusa az ebben a reprezentációban rejlő hatalmas redundancia. Vegyünk például 
két egymás melletti képpontot az arc pofa részén; valószínűleg igen erős közöttük 
a korreláció, hiszen hasonló a geometriájuk, megvilágításuk stb. Az adatmennyiséget 
csökkentő technikák, mint például a főkomponens-analízis, sikeresen használhatók a 
jellemzővektor dimenziószámának csökkentésére, lehetővé téve az olyan dolgok, mint 
például arcok, nagydimenziós terekben való felismerésénél nagyobb sebességű felis- 
merését. 


Jellemzőalapú felismerés 


A feldolgozatlan képpontok fényességértékei jellemzőként történő felhasználása he- 
lyett felismerhetünk adott helyen levő jellemzőket, mint például régiókat vagy éleket 
(lásd 24.3. alfejezet). Két motivációnk van az élek használatára. Az egyik az adatmennyi- 
ség csökkentése — sokkal kevesebb él van, mint képpont. A másik a megvilágításfügget- 
lenség - a kontraszt egy megfelelő tartományában az éleket nagyjából azonos helyen 
ismerjük fel, függetlenül a tényleges fényforrás-konfigurációtól. Az élek egydimenziós 
jellemzők; kétdimenziós és nulladimenziós tulajdonságokat (régiókat, illetve pontokat) 
szintén használunk. Vegyük észre a térbeli elhelyezkedés kezelésében jelentkező kü- 
lönbséget a fényességalapú és a jellemzőalapú módszerek között! A fényességalapú 
módszerekben az (x,y) hely a jellemző. 

Az élek elrendezése egy objektum tulajdonsága — ez az egyik oka, ami miatt a rajzo- 
kat könnyedén értelmezni tudjuk (lásd 24.13. ábra), még akkor is, ha ilyen képek nem 
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fordulnak elő a természetben! Ezen tudás legegyszerűbb felhasználásának módja egy 
legközelebbi-szomszéd osztályozóval történhet. Előre kiszámítjuk és eltároljuk az is- 
mert objektumok nézeteihez tartozó élkonfigurációkat. Ha adott egy ismeretlen objek- 
tumnak megfelelő élelrendezés a bemeneti képen, akkor meghatározhatjuk az eltárolt 
nézetekhez mért , távolságát". A legközelebbi-szomszéd osztályozó a legközelebbi il- 
leszkedőt választja. 

Sokféle definíciót javasoltak a képek közötti távolságra. Az egyik legérdekesebb 
megközelítés a deformációs illeszkedés (deformable matching) ötletén alapul. 
D" Arcy Thompson klasszikus munkájában (On Growth and Form (D" Arcy Thompson, 
1917) megfigyelte, hogy a hasonló, de nem azonos alakzatok gyakran egybeesésbe 
hozhatók egyszerű koordináta-transzformációkkal." E módszer szerint az alakzatok 
hasonlóságát egy három lépésből álló folyamattal határozzuk meg: (1) megoldjuk a két 
alakzat megfeleltetési problémáját, (2) a megfeleltetést felhasználjuk egy egymásra 
illesztési transzformáció megbecslésére, és (3) kiszámítjuk a két alakzat közötti távol- 
ságot az egymásnak megfelelő pontok illeszkedési hibáinak összegeként, kiegészítve a 
fedésbe hozó transzformáció nagyságával. 

Az alakzatot a belső vagy külső körvonalát alkotó pontok diszkrét halmazaként rep- 
rezentáljuk. Ezeket előállíthatjuk egy éldetektáló által megtalált élképpontok helye 
alapján, így kapunk egy N pontból álló (pi ,..., Pw) halmazt. A 24.20. (a) és (b) ábra 
két alakzat mintapontjait mutatja. 

Most tekintsünk egy p; mintapontra és az onnan induló összes többi mintapontra mu- 
tató vektorra egy alakzaton. Ezek a vektorok kifejezik a teljes alakzat konfigurációját 
a referenciaponthoz viszonyítva. Ez a következő ötlethez vezet: rendeljünk minden 
mintaponthoz egy leírót, az alakzatkontextust (shape context), amely megadja az 
alakzat további részének durva elrendezését az adott ponthoz viszonyítva. Pontosabban 
fogalmazva a p; alakzatkontextusa a maradék N — 1 p, pontra a p, — p; relatív koordiná- 
ták egy közelítő Ah; térbeli hisztogramja. Egy logaritmikus poláris koordináta-rendszert 
használunk a tartók meghatározására annak biztosítása érdekében, hogy a leíró érzéke- 
nyebb legyen a közeli képpontok esetében. A 24.20. (c) ábra mutat erre egy példát. 

Vegyük észre, hogy az alakzat kontextusának definíciója magában hordozza az elfor- 
gatásinvarianciát, hiszen minden mérést az objektum pontjaihoz képest végzünk. A méret- 
invariancia eléréséhez minden sugárirányú távolságot normalizálunk a pontpárok közötti 
átlagos távolsággal. 

Az alakzatkontextus lehetővé teszi, hogy a megfeleltetési problémát megoldjuk két 
hasonló, de nem azonos objektumra, mint ahogy az a 24.20. (a) és (b) ábrán látszik. Az 
alakzatkontextus különböző lesz egy S alakzat különböző pontjaira, de egy S és egy §" 
alakzat megfelelő (homológ) pontjainak alakzatkontextusa hajlamos lesz a hasonló- 
ságra. Ezek után a két alakzat megfeleltethető pontjai megtalálásának problémáját 
akként kezelhetjük, mint hasonló alakzatkontextussal rendelkező párok megtalálását. 

Precízebben fogalmazva: tekintsük a p; pontot az első, a gi pontot a második alakza- 
ton. Jelölje a Cs; — C(p; , g;) a két pont illesztésének költségét. Minthogy az alakzat- 
kontextusok hisztogramokkal reprezentált eloszlások, így természetes a xz távolság 
használata: 


5 A modern számítógépes grafikában erre az ötletre az áttűnéssel, morfolással (morphing) hivatkoznak. 
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(a) (b) (e) 











(0) (e) 
24.20. ábra. Alakzatkontextus-számítás és -illesztés. (a, b) Két alakzat élének mintapontjai, (c) Az alak- 
zatkontextus számítására használt log-polár hisztogram rekeszek ábrája. 5 rekeszt használunk a log r és 
12 rekeszt 8 számára, (d-f) Az (a) és (b) ábrán jelölt referenciaminták alakzatkontextusai: o, Ö, 4. Min- 
den alakzatkontextus a maradék pontbalmaz koordinátáinak log-polár hisztogramja a referenciapontot 
mint origót használva. (A sötét cellák több pontot jelentenek a rekeszekben.) Vegye észre a o és 0 pontok 
alakzatkontextusainak vizuális hasonlóságát, amelyeket a két alakzat relatíve hasonló pontjaira számol- 
tunk! Ezzel ellentétben a a alakzatkontextusa egészen eltérő. (g) Az (a) és (b) között kétoldali illesztéssel 
megtalált megfeleltetések, a hisztogramok X? távolsága által definiált költséget használva, 


c, - 16 l160-rü0f 
"241 hi(k)4-hj(k) 

ahol h(k4) és h4k) a normalizált hisztogram k-adik értékét jelöli a p;, illetve a dj pon- 
tokban. Ha adott az első objektum í és a második objektum j pontjainak összes lehetsé- 
ges párosítására a Ci; költségek halmaza, akkor az illesztés teljes költségét akarjuk mi- 
nimalizálni azzal a kényszerfeltétellel, hogy az illeszkedésnek kölcsönösen megfelelő- 
nek kell lennie. Ez egy példa a súlyozott páros illesztés (weighted bipartite 
matching) problémájára, amely O(N ?) időben megoldható a magyar algoritmussal, 

A mintapontok megfeleltetése alapján a teljes alakzatra kiterjeszthető a megfeleltetés 
annak a fedési transzformációnak a megbecsülésével, amely az egyik alakzatot a másik- 
ra képezi le. A regularizált vékonylemez spline-ok (thin plate spline) különösen hatéko- 
nyak. Ha az alakzatokat fedésbe hoztuk, a hasonlósági mértékek kiszámítása viszonylag 
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kézenfekvő. A két alakzat közötti távolság definiálható az egymásnak megfelelő pontok 
alakzatkontextus-távolságainak és a vékonylemez spline-hoz rendelt kötési energiának 
a súlyozott összegeként. Ezt a távolságmértéket meghatározva egy egyszerű legközelebbi- 
szomszéd osztályozó megoldja a felismerési problémát. A 20. fejezetben írtuk le ezen 
módszer kitűnő teljesítményét a kézzel írt számjegyek osztályozásában. 


Az elhelyezkedés becslése 


Amellett hogy meghatározzuk, mi is az objektum, a helyzetét is szeretnénk megállapí- 
tani, azaz a nézőhöz képesti pozícióját és az irányát. Például egy ipari alkalmazásban 
a robot karja nem tud felvenni egy objektumot, amíg nem tudja a helyzetét. Merev két-, 
illetve háromdimenziós objektumok esetében a problémának egy egyszerű és jól defini- 
ált megoldása van, amely az illesztési módszeren (atignment method) alapszik, amit 
a következőkben fejtünk ki. 

Az objektumot M jellemzővel, avagy mi, mo, ..., my háromdimenziós ponttal rep- 
rezentáljuk - például egy soklapú objektum sarokpontjaival. Ezeket valamilyen, az ob- 
jektumnak természetes koordináta-rendszerben határozzuk meg. Ezek után a pontokat 
egy ismeretlen háromdimenziós forgatásnak, R-nek vetjük alá, amit egy ismeretlen t 
mértékű eltolás követ, végezetül egy vetítés következik, amivel előállnak a képsík 
(Pi. P2:..5 Pw) jellemzői. Általában N 2- M, mivel bizonyos modellpontokat elnyelhet- 
tek, és a jellemződetektor kihagyhat egyes jellemzőket (vagy hamisakat határozhat meg 
a zaj miatt). Ezt egy háromdimenziós m; modellpontra és a neki megfelelő p, képpontra 
a következőképpen fejezhetjük ki: 


P; — IR; 1-t)—— O(m;,) 


Itaz R a rotációs mátrix, t az eltolás, és II jelöli a perspektivikus vetítést vagy annak 
egy közelítését, mint például a skálázott ortografikus vetítést. A végső eredmény a 0 
transzformáció, ami az mm; modellpontot megfelelteti a p; képpontnak. Bár kezdetben 
nem ismerjük a 0 transzformációt, (merev objektumokra) tudjuk, hogy 0-nak minden 
modellpontra azonosnak kell lennie. 

Meghatározhatjuk -t a modellpontjainak és a pontoknak megfelelő kétdimenziós 
projekciók adott háromdimenziós koordinátái alapján. Intuíciónk a következőt súgja: 
felírhatunk olyan egyenleteket, amelyek az rm; modellpontokat és a p; képpontokat ösz- 
szekapcsolják. Ezekben az egyenletekben az ismeretlen mennyiségek az R forgatási 
mátrix és a t eltolási vektor paramétereinek felelnek meg. Ha van elég egyentetünk, ki kell 
tudnunk számolni 0-t. Nem fogjuk bizonyítani itt, hanem csupán állítjuk a következő ered- 
ményt; 

Ha adott három, nem egy egyenesre eső mj, m2 és m3z modelipont, és ezek skálázott 

ortogonális projekciója, pi, pa és pz a képsíkon, akkor létezik pontosan két transz- 

formáció a háromdimenziós modell koordinátakeretből a kétdimenziós képkoordináta- 
keretbe. 


Ezek a transzformációk a képsíkra vonatkozó tükrözésen keresztül kapcsolatban állnak 
egymással, és egy egyszerű zártalakú megoldással meghatározhatók. Ha meg tudnánk 
határozni a kép három jellemzőjének megfelelő három modelijellemzőt, akkor kiszá- 
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function ILLEszrÉs(kép, modell) returns egy megoldás vagy kudarc 
inputs: kép, képjellemző pontok listája 
modell, modelljellemző pontok listája 


for each pp, po, pa in TRIFLETS(kép) do 
for each my, ma, m3 in TRIPLETS(modet!) do 
0 — TRANSZFORMÁCIÓT-KERES(p. Po, Pz, mp, ma, m3z) 
it a 0 szerinti projekció megmagyarázza a képen then 
return 0 
return kudarc 











24.21. ábra. Az illesztésalgoritmus informális leírása 


molhatnánk 0-t, az objektum helyzetét. Az előző alfejezetben tárgyaltunk egy 
alakzatkontextuson alapuló megfeleltetést. Ha az objektumnak vannak jól meghatározott 
sarkai vagy más jellegzetes pontjai, akkor egy még egyszerűbb technika alkalmazása 
válik lehetségessé. Az ötlet lényege a generálás és tesztelés. Egy kezdeti megfeleltetést kell 
találnunk egy képhármas és egy modellhármas között, majd a TRANSZFORMÁCIÓTKERES 
eljárást használjuk € egy hipotézisének előállítására. Ha a úppelt megfelelés helyes volt, 
akkor 0 helyes lesz, és ha a többi modellpontra alkalmazzuk, a képpontok predikcióját 
eredményezi. Ha a tippelt megfelelés helytelen volt, akkor 0 helytelen lesz, és ha a ma- 
radék modellpontokra alkalmazzuk, nem állítja elő a képpontokat. 

Ez a 24.21. ábrán látható ILLESZTÉS algoritmus alapja. Az algoritmus megtalálja egy 
adott modell elhelyezkedését, vagy hibával tér vissza. Az algoritmus időbeli komplexitá- 
Sa a legrosszabb esetben arányos a modell- és képponthármasok kombinációinak szá- 
mával, vagyis (G 43 mal, megszorozva minden egyes kombináció ellenőrzésének költ- 
ségével. Az ellenőrzés költsége M logN, mivel az M modellpont mindegyikére elő kell 
állítanunk a képbeli pozíciót, és meg kell találnunk a legközelebbi képponttól mért 
távolságot, ami egy log A művelet, ha a kép pontjai egy megfelelő adatstruktúrában helyez- 
kednek el. Így legrosszabb esetben az algoritmus időbeli komplexitása OGMÍN ? logN), 





(a) (b) 


24.22. ábra. (a) A tűzőgép fényképén talált sarkok. (b) Az eredeti képre ráhelyezett hipotetikus rekonst- 
rukció (Clark Olson hozzájárulásával). 
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ahol M és N a modell és a kép pontjainak száma. Az elhelyezkedésklaszterezésen alapuló 
technikák randomizálással lecsökkentik a komplexitást O(MN 4; )-re. Ezen algoritmus 
alkalmazásának eredményei a tűzőgépre a 24.22. ábrán láthatók. 


24.6. NAVIGÁLÁS ÉS MANIPULÁLÁS 
A LÁTÁS SEGÍTSÉGÉVEL 


A látás egyik legfontosabb alkalmazása az, hogy információt szolgáltat az objektumok 
manipulálásához — hogy felszedhessük, megfoghassuk, elforgathassuk stb. azokat —, 
valamint hogy akadályok kikerülésével navigálhassunk. Az a képesség, hogy a látást 
ezen célokra használják, a legprimitívebb állati látórendszerekben is jelen van. Sok 
esetben a látórendszer minimális abban az értelemben, hogy a rendelkezésre álló látó- 
mezőből csak annyi információt nyer ki, ami az állat viselkedésének a tájékoztatására 
szükséges. Igen valószínű, hogy a modern látórendszerek a korai, primitív organizmu- 
sokból fejlődtek ki, amelyek egy fényérzékeny foltot használtak az egyik végükön, és 
így tudták magukat a fény felé vagy azzal ellentétes irányba orientálni. A 24.4. al- 
fejezetben láttuk, hogy a legyek egy nagyon egyszerű optikai folyamra alapozó látást 
használnak, hogy le tudjanak szállni a falon. A What the Frog"s Eye Tells the Frog"s 
Brain c. klasszikus tanulmány (Lettvin és társai, 1959) megfigyeli, hogy egy béka , éhen 
fog halni, ha olyan étellel van körülvéve, amely nem mozog. Csak a méret és a mozgás 
alapján állapítja meg, hogy mi élelem." 

Az , organizmusokban?" használt számítógépes látórendszereket robotoknak nevezzük. 
Tekintsünk egy speciális robotfajtát: egy automata járművezetőt egy autópályán (lásd 
24.23. ábra). Először elemezzük a feladatot; azután meghatározzuk a látási algoritmust, 


24.23. ábra. Az út képe egy autóban lévő kamerával lefényképezve. A vízszintes fehér csíkok jelzik azo- 
kat a keresési ablakokat, amiken belül a vezérlő az útvonali jeleket keresi. A gyenge képminőség nem 
szokatlan az alacsony felbontású fekete-fehér videók esetében. 
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amely a feladatok helyes végrehajtásához szükséges. A vezető előtt álló feladatok között 
találjuk az alábbiakat: 


1. Oldalsó irányítás — biztosítani, hogy a kocsi biztonságosan a közlekedési sávon belül 
maradjon, vagy szükség esetén zökkenőmentesen váltson sávot. 

2. Hosszanti irányítás — biztosítani, hogy a kocsi előtt biztonságos távolság legyen. 

3. Akadályelhárítás — a szomszédos közlekedési sávokban haladó kocsik figyelése és 
felkészülés az elkerülő manőverezésre, ha azok valamelyike sávot szeretne váltani. 


A vezető feladata, hogy generálja ezen feladatok legjobb teljesítéséhez alkalmas kor- 
mányzási, gyorsítási vagy fékezési cselekvéseket. 

Az oldalsó irányításhoz szükséges a gépkocsi pozíciójának és irányítottságának a 
sávhoz képesti reprezentálása. A 24.23. ábrán látható kép esetén éldetektáló algoritmu- 
sokkal azonosítjuk a sávhatárokat jelző határoló vonalakhoz tartozó éleket. Ezt köve- 
tően ezekre az élekre sima görbéket illeszthetünk. Ezen görbék paraméterei információt 
hordoznak a gépkocsi oldalsó elhelyezkedésére nézve, az autó haladási irányára a sávon 
belül és a sáv íveltségére. Ez az információ — a gépkocsi dinamikájával együtt - képezi 
mindazt, amire a kormányzást irányító rendszernek szüksége van. Jegyezzük meg azt 
is, hogy mivel képkockáról képkockára a sáv képi vetületének pozíciója csupán csekély 
mértékben változik, tudjuk, hogy a képen a sávhatárjelző vonalakat tol keressük — csak 
azokon a területeken kell keresnünk, amelyek párhuzamos fehér vonalakkal vannak 
megjelölve. 

A hosszanti irányításhoz az előttünk haladó gépkocsik távolságára van szükség. Erre 
a kétkamerás sztereolátás vagy optikai folyam segítségével tehetünk szert. Mindkét 
megközelítést lényegesen egyszerűsíthetjük, ha kihasználjuk a sík felületen történő ha- 
ladásból adódó kényszereket. Ilyen technikák felhasználásával a vizuálisan irányított 
autók nagy sebességgel hosszú ideig tudnak közlekedni. 

A gépkocsi-vezetési példa egy szempontot igencsak világossá tesz: egy konkrét fel- 
adat esetén a képen elvben található összes információ kinyerése nem szükséges. Nem 
szükséges a gépkocsik pontos alakjának a meghatározása, az úttal szomszédos füves 
területekre vonatkozó az-alak-a-textúrából probléma megoldása stb. A feladat informá- 
ciószükséglete csak egy bizonyos típusú információra vonatkozik, és lényeges számítási 
sebességet és robusztusságot lehet biztosítani, ha csak erre az információra ÖSSZpONtosÍ- 
tunk, és a problémából adódó kényszereket teljes egészében kihasználjuk. Az előbbi 
részekben bemutatott általános megközelítések célja az volt, hogy egy általános alapel- 
méletet adhassunk, amit majd a konkrét feladat szükségleteihez lehet specializálni. 


24.7. ÖSSZEFOGLALÁS 


Bár az ember számára az érzékelés könnyed cselekvésnek tűnik, igen nagy mennyisé- 
gű komplex számítást igényel. A látás célja információ kiemelése olyan feladatokhoz, 
mint a manipulálás, a navigálás és az objektumfelismerés. 


NN 
s A képalkotás (image formation) folyamata, a geometriai és fizikai aspektusokat 
tekintve, jól feltárt terület. Ha adott egy háromdimenziós jelenet leírása, ennek vala- 
milyen tetszőleges kamerapozíciónak megfelelő képét könnyűszerrel előállíthatjuk 
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(grafikai probléma). E folyamat megfordítása és a jelenet leírásának a kép alapján 
történő előállítása nehéz. 

séges vizuális információt kiemelhessük, szükség van valamilyen közbülső repre- 
zentáció megkonstruálására. A képekből az olyan primitív elemeket, mint az élek 
és a régiók, a képfeldolgozási algoritmusok (image-processings) emelik ki. 

"s Egy képben többféle segítség rejlik, amely lehetővé teszi, hogy a jelenetről három- 
dimenziós információt kapjunk. Idetartozik a mozgás, a sztereolátás, a textúra, az 
árnyalás és a kontúrelemzés. Ezek mindegyike a fizikai jelenetre vonatkozó háttér- 
feltételezéseken alapul, hogy az interpretációt közel egyértelművé tegye. 

" A teljes körű objektumfelismerés nagyon nehéz probléma. A fényesség- és a jellem- 
zőalapú megközelítéseket tárgyaltuk. Más lehetőségek is vannak. 


Irodalmi és történeti megjegyzések 


Az emberi látás megértésére irányuló szisztematikus próbálkozások az ókorig nyúlnak 
vissza. Eukleidész (kb. i. e. 300) írt a természetes perspektíváról — az olyan leképezés- 
ről, amely a háromdimenziós világ minden P pontjához az OP sugár irányát rendeli 
hozzá, amely sugár a P pontot a vetítés O középpontjával köti össze. Eukleidész ismer- 
te a mozgási parallaxis jelenségét is. A perspektivikus vetítés matematikai megértését, 
egy síkra való vetítés szempontjából, a 15. században az itáliai reneszánsz segítette elő. 
Az első, a háromdimenziós jelenet helyes geometriai vetítésén alapuló festményt általá- 
ban Brunelleschinek tulajdonítják (1413). 1435-ben Alberti fogalmazta meg a szabályo- 
kat, és ő inspirálta a művészek generációit, akik művészi teljesítményét máig csodáljuk. 
A perspektíva tudományának - ahogy akkor nevezték — kidolgozásában kimagaslott 
Leonardo da Vinci és Albrecht Dürer. Leonardo késő 15. századi leírásait a fény és az 
árnyék (chiaroscuro) játékáról, az árnyék umbra és penumbra régióiról, valamint a légi 
perspektíváról még mindig érdemes elolvasni (Kemp, 1989). 

Bár a perspektívát a görögök is ismerték, furcsamód a felfogásuk a szemnek a látás- 
ban betöltött szerepéről zavaros volt. Arisztotelész azt gondolta, hogy a szem — a mai 
lézeres távolságmérők mintájára — fénysugarakat bocsát ki. Ezt a téves elképzelést a 
világnak az arab tudósok közvetítették, többek közt Alhazen a 10. században. Ezután 
különféle kamerák fejlesztése következett. Ezek egy szobából (latinul a camera szobát 
jelent) álltak, ahova a fényt a falon egy kis nyíláson át engedjük be, hogy az átellenes 
falon a kinti jelenet képét kivetítse. Ezen kamerák mindegyikében a kép természetesen 
fordított volt, ami vég nélküli zavart okozott. Ha a szem ilyen elvű berendezés lenne, 
akkor hogyan lehetséges, hogy a képet helyesen látjuk? A probléma a korszak legna- 
gyobb elméit foglalkoztatta (Leonardót is beleértve). A kérdés megválaszolásához Kep- 
ler és Descartes munkássága kellett. Descartes az ablakzsalu nyílásába egy olyan 
szemet helyezett be, amelynek nem átlátszó felhámrétegét eltávolították. A retinára ki- 
terített papíron így egy fordított képet kapott. Bár a retinás kép valóban fordított, ez 
nem okoz problémát, mert az agy helyesen interpretálja a képet. Mai szaknyelven azt 
mondhatnánk, hogy megfelelő módon kezelni keli az adatstruktúrákat. 

A látás megértésében a következő lényeges előrelépés a 19. században történt. Helm- 
holtz és Wundt 1. fejezetben említett munkássága a pszichofizikai kísérleteket szigorú 
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tudományos szintre emelte, Young, Maxwell és Helmholtz munkája megalapította a szí- 
nes látás három színen alapuló elméletét. Azt a tényt, hogy az emberi szem a mélység 
érzékelésére is képes, ha a két szem kissé eltérő képet lát, Wheatstone a sztereoszkóp fel- 
találásával demonstrálta (Wheatstone, 1838). A készüléknek azonnal nagy sikere lett 
a szalonokban Európa-szerte. A kétkamerás sztereolátás lényegét, azaz hogy a jelenet 
két, kissé eltérő látószögből készített képe elegendő információt hordoz a jelenet három- 
dimenziós visszaállításához, a fotogrammetria területén aknázták ki. Megszülettek a 
kulcsfontosságú matematikai eredmények. Kruppa bebizonyította, hogy ha öt külön- 
böző pont két különböző képével rendelkezünk, vissza lehet állítani a két kamera pozí- 
ciója közötti elfordulást és eltolást, valamint a jelenet mélységét (egy skálafaktor erejé- 
ig) (Kruppa, 1913). Bár a sztereolátás geometriáját jó ideje ismerték, a fotogrammetria 
megfeleltetési problémáját általában emberek oldották meg, akik az egymásnak meg- 
felelő pontokat igyekezték egymáshoz illeszteni. Az embereknek a megfeleltetési prob- 
léma megoldásában megmutatkozó csodálatos képességét Julesz Béla demonstrálta 
a véletlen-pont sztereogram feltalálásával (Julesz, 1971). Ezen probléma megoldására 
mind a számítógépes látás területén, mind a fotogrammetriában sok munkát fordítottak 
az 1970-es és az 1980-as években. 

A 19. század második fele volt az a periódus, amikor az emberi látásra vonatkozó 
pszichofizikai kutatásokat megalapozták. A 20. század első felében a látás területén a 
legfontosabb eredményekhez a Max Wertheimer vezette Gestalt pszichológiai iskola 
jutott. , Az egész több, mint a részek összege" jelszóval azt a nézetet hangsúlyozták, 
hogy az észlelés elsődleges elemei a teljes formák legyenek, ne pedig az összetevők, 
mint például az élek. 

A második világháború utáni szakaszt megújult aktivitás jellemezte. A legfontosabb 
J. I. Gibson munkája volt, aki rámutatott az optikai folyam és a textúragradiensek fon- 
tosságára olyan környezeti változók becslésénél, mint a dőlés és a lejtés (Gibson, 1950; 
1979). Ő újból hangsúlyozta az ingerek fontosságát és gazdagságát. Gibson, Olum és 
Rosenblatt rámutattak, hogy az optikai folyammező elegendő információt tartalmaz 
ahhoz, hogy a megfigyelő meghatározhassa saját mozgását a környezetben (Gibson és 
társai, 1955). A számítógépes látásban a kutatás ezen területen és a (matematikailag 
ekvivalens) struktúra-a-mozgásból területen főleg az 1980-as években ment végbe, 
Koenderink, Van Doorn, Ullman és Longuet-Higgins alapozó eredményeit követve 
(Koendrink és Van Doorn, 1975; Ullman, 1979; Longeut-Higgins, 1981) adott lendületet 
e tevékenységnek. A kezdeti aggodalmakat a mozgásból származtatott struktúra stabilitá- 
sával kapcsolatban Tomasi és Kanade munkája (Tomasi és Kanade, 1992) csillapította, 
akik megmutatták, hogy több képkocka felhasználásával és az ebből származó széles 
alapvonallal az alak egészen pontosan felismerhető. 

Chan és társai írják le a légy meghökkentő vizuális apparátusát, amelynek tízszer na- 
gyobb az időbeli vizuális aktivitása, mint az embereké (Chan és társai, 1998). Azaz egy 
légy egy maximum 300 képkocka/másodperc sebességű filmet is úgy tudna nézni, hogy 
felismeri az egyes képkockákat. 

Az 1990-es években megjelent koncepcionális újítás a mozgásból származtatott struktú- 
ra tanulmányozása volt. Egy ilyen beállításban a kamera kalibrációja nem szükséges, 
ahogy azt Faugeras megmutatta (Faugeras, 1992). Ez a felfedezés összefügg az objek- 
tumfelismerésben alkalmazott geometriai invariánsokkal, ahogy azt Mundy és Zisserman 
áttekintették (Mundy és Zisserman, 1992), és a mozgásból származtatott rokon struktúrá- 
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val (Kcenderink és Van Doorn, 1991). Az 1990-es években a számítógépek sebességé- 
nek és tárolási kapacitásának növekedésével a digitális videofelvételekből történő moz- 
gási szekvenciaelemzést sok új területen alkalmazták. Valósvilág-beli jelenetek geo- 





metriai modelljeinek felépítése a számítógépes grafikai technikákkal történő előállítás 
céljából különösen népszerűnek bizonyult, amelyet olyan rekonstrukciós algoritmusok 
vezettek, mint amelyet például Debevec, Taylor és Malik fejlesztettek ki (Debevec, 
Taylor és Malik, 1996). Hartley és Zisserman, valamint Faugeras és társainak könyvei 
átfogóan tárgyalják a többszörös nézetek geometriáját (Hartley és Zisserman, 2000; 
Faugeras és társai, 2001). 

A számítógépes látásban az alak textúrából való kinyerésére vonatkozó legfontosabb 
kezdeti eredményeket Bajcsynak, Liebermannak és Stevensnek köszönhetjük (Bajcsy és 
Lieberman, 1976; Stevens, 1981). Míg ez a munka sík felületekre vonatkozott, a görbült 
felületekre vonatkozóan átfogó elemzéseket Garding, Malik és Rosenholtz végeztek 
(Garding, 1992; Malik és Rosenholtz, 1994). 

A számítógépes látásban az alaknak az árnyékolásból való kinyerését Berthold Horn 
tanulmányozta (Horn, 1970). E terület fő cikkeit a (Horn és Brooks, 1989) tekinti át. Ez 
a megközelítés számos egyszerűsítő feltétellel élt, amelyekből a legkényesebb a kölcsö- 
nös megvilágítás hatásának figyelmen kívüli hagyása volt. A kölcsönös megvilágítás 
fontosságát kellően értékelték a számítógépes grafika területén, ahol éppen ezen hatás 
figyelembevételére fejlesztették ki a fénysugárkövetést és a radiozitást. Egy elméleti és 
gyakorlati kritika a (Forsyth és Zisserman, 1991)-ben található. 

Az alaknak a kontúrból való meghatározása területén Huffman és Clowes kezdeti, 
kulcsfontosságú hozzájárulásai után poliéderes objektumok esetére (Huffman, 1971; 
Clowes, 1971) Mackworth és Sugihara teljessé tették az elemzést (Mackworth, 1973; 
Sugihara, 1984). Malik kifejlesztette a tartományonként sima görbült objektumok cím- 
kézési sémáját (Malik, 1987). Kirousis és Papadimitriou megmutatták, hogy a triéderes 
jelenet vonalcímkézése NP-teljes (Kirousis és Papadimitriou, 1988). 

Ahhoz, hogy a sima görbült objektumok vetületeiből a vizuális eseményeket megértsük, 
szükség van a differenciálgeometria és a szingularitáselmélet együttesére. Ezek tanulmá- 
nyozásához a legjobb irodalom Koenderink Solid Shape c. műve (Koenderink, 1990). 

A háromdimenziós objektumfelismerés területén Roberts az MIT-n benyújtott disz- 
szertációja adott lényegi eredményeket (Roberts, 1963). Sokan úgy tartják, hogy ez 
a számítógépes látás területén az első PRD-disszertáció, amely sok kulcsfontosságú öt- 
letet vezetett be, az éldetektálást és a modellalapú illesztést is beleértve. A Canny-féle 
éldetektálást (Canny, 1986) vezette be. A Roberts által bevezetett illesztés gondolata 
később Lowe, Huttenlocher és Ullman munkájában újra megjelent (Lowe, 1987; Hutten- 
locher és UHman, 1990). A helyzet összerendelési módszer alapján történő becslésének 
hatékonyságát jelentős mértékben Olson növelte (Olson, 1994). A háromdimenziós 
objektumfelismerés kutatásának egy másik nagy vonulata, az alakzatok térfogati primi- 
tívekre, ún. általánosított hengerekre (generalized cylinders) alapuló leírása, amelyet 
Tom Binford vezetett be, különösen népszerűnek bizonyult (Binford, 1971). 

Míg az objektumfelismeréssel foglalkozó számítógépes látás kutatása nagyrészt a há- 
romdimenziós objektumok kétdimenziós képekre történő leképezésével foglalkozott, 
addig a mintafelismeréssel foglalkozó közösségben létezett egy párhuzamos irányzat, 
amely a problémát a mintaosztályozás problémájaként látta. Az ezt motiváló példák 
olyan területekről kerültek ki, mint az optikai karakterfelismerés és a kézzel írt irányító- 
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számok felismerése, ahol az elsődleges probléma egy objektumosztály tipikus variációi- 
nak jellemvonásait megtanulni, és ezek alapján különválasztani őket más osztályoktól. 
A megközelítések összehasonlítását a (LeCun és társai, 1995) tartalmazza. Az objektum- 
felismerésről szóló további munkák között van (Sirovitch és Kirby, 1987; Viola és 
Jones, 2002) arcfelismerésről szóló munkája. Az alakkontextus módszerét (Belongie és 
társai, 2002) írja le. (Dickmanns és Zapp, 1987) demonstrált először nagy sebességgel 
az autópályán haladó, vizuálisan vezérelt járművel; Pomerleau neurális hálózatok segít- 
ségével ért el hasonló teljesítményt (Pomerleau, 1993). 

Stephen Palmer munkája, a Vision Science: Photons to Phenomenology (Palmer, 
1999) a legjobb összefoglaló munka az emberi látás leírására; David Hubel Eye, Brain 
and Vision (Hubel, 1988) és Irvin Rock Perception c. műve (Rock, 1984) rövid beve- 
Zetőt nyújtanak a neuropszichológia, illetve az észlelés területeibe. 

A számítógépes látás területének legjobb összefoglaló jegyzete David Forsyth és 
Jean Ponce munkája, a Computer Vision: A Modern Approach. Sokkal rövidebben tár- 
gyalja a területet (Nalwa, 1993; Trucco és Verri, 1998). A Robot Vision (Horn, 1986) 
és a Three-Dimensional Computer Vision (Faugeras, 1993) régebbi, de még mindig 
hasznos jegyzetek, saját, speciális témájukban. David Marr könyve, a Vision (Marr, 
1982) fontos szerepet töltött be a számítógépes látás (pszichofizika) és a tradicionális 
biológiai látás (neurobiológia) összekapcsolásában. A számítógépes látás témájában a 
két fő folyóirat az IEEE Transactions on Pattern Analysis and Machine Intelligence és 
az International Journal of Computer Vision. A számítógépes látással foglalkozó kon- 
ferenciák többek közt az ICCV (International Conference on Computer Vision), a CVPR 
(Computer Vision and Pattern Recognition) és az ECCV (European Conference on 
Computer Vision). 


Feladatok 


24.1. A sűrű, lombos koronával rendelkező fa árnyékában számos világos foltot lehet 
látni. Meglepetésre mind körkörös. Miért? Hiszen ha úgy vesszük, a levelek kö- 
zötti rések, amelyeken keresztül átvilágít a nap, nagy eséllyel nem ilyenek. 


24.1. Címkézze meg a 24.24. ábrán látható objektumot, azt feltételezve, hogy a külső 
éleket takaró éleknek címkéztük, és az összes sarokpont triéderes. Tegye meg 
ezt a visszalépő algoritmussal, amely a sarokpontokat A, B, C és D sorrendben 
fogja megvizsgálni, mindegyik lépésnél úgy megválasztva a címkéket, hogy 
azok az előbb megcímkézett csatlakozásokkal és élekkel konzisztensek legye- 
nek. Próbálja most a sarokpontokat B, D, A és C sorrendben megcímkézni. 


24.3. Tekintsen egy végtelen hosszú, r sugarú hengert, amelynek tengelye az y ten- 
gellyel párhuzamos. A henger Lambert-féle felülettel rendelkezik, és a pozitív z 
tengely felől irányítjuk rá a kamerát. Mit fog látni a képen, ha a hengert egy 
pontszerű fényforrás világítja meg, amely a pozitív x tengelyen a végtelenben 
helyezkedik el. Magyarázza meg a válaszát úgy, hogy az azonos fényességű 
kontúrokat rajzolja fel a vetített képre. Az azonos fényességű kontúrok azonos 
távolságban helyezkednek-e el? 
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24.24. ábra. A megcímkézendő objektum, amelynek minden sarokpontja triéderes 


244. 


24.5. 


24.6. 


247. 


A képbeli élek a jelenetesemények sokaságának felelhetnek meg. Tekintsen egy 
tetszőleges fényképet, amely valódi háromdimenziós jelenetet ábrázol. Azono- 
sítson a képen tíz élt, és kísérelje meg egyenként eldönteni, hogy az él (a) a 
mélység, (b) a felületi normális, (c) a reflektancia, illetve (d) a megvilágítás sza- 
kadásának felel-e meg. 


Mutassa meg, hogy a konvolúció egy adott függvénnyel felcserélhető a differen- 
ciálással, azaz, hogy: 


(egy — fg 


Egy terület feltérképezéséhez egy sztereorendszer használatát fontolgatjuk. 

A rendszer két CCD kamerából fog állni, mindegyik 512 x 512 pixel felbontású 

egy 10 x 10 cm négyzet alakú érzékelőn. A felhasználandó lencsék fókusztávol- 

sága 16 cm, és a lencsék a végtelenben fixálnak. A bal oldali kép (u, vp) és a 

Jobb oldali kép (u, va) egymáshoz tartozó pontjaira vy — va, hiszen a két kép- 

síkon az x tengelyek az epipoláris vonalakkal párhuzamosak. A két kamera 

optikai tengelye párhuzamos. A két kamera közötti bázisvonal 1 m. 

(a) Ha a legközelebbi mérendő táv 16 m, mi a tapasztalható legnagyobb disz- 
paritás (képpontban)? 

(b) Mi a távmérés pixelfelbontásból adódó felbontása 16 m távolságban? 

(c) Milyen táv tartozik az egy képpontos képeltéréshez? 


Az illesztési algoritmust egy ipari alkalmazásnál szeretnénk használni, ahol la- 
pos alkatrészeket egy szállítószalag visz, a szalag felett pedig egy függőlegesen 
elhelyezett kamera figyel. Az alkatrész elhelyezkedését három változó határoz- 
Za meg, egy az elfordulást és kettő az alkatrész kétdimenziós pozícióját. Ez egy- 
szerűsíti a problémát, és a TRANSZFORMÁCIÓT-KERES függvény az egymásnak 
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megfelelő kép- és modelltulajdonságokból két párt igényel ahhoz, hogy az elhe- 
lyezkedést azonosítsa. Határozza meg csak ebben a környezetben az illesztésnek 
a legrosszabb esetre vett komplexitását. 


24.8. (Pietro Perona nyomán.) A 24.25. ábra X és Y pontban két kamerát mutat, ame- 
lyek megfigyelnek egy jelenetet. Rajzolja le azt a képet, amit az egyes kamerák 
látnak (felteheti, hogy minden jelölt pont ugyanabban a vízszintes síkban he- 
lyezkedik el). Mi tudható meg a két kép alapján az A, B, C, D és E pontok a 
kamera alapvonalától mért relatív távolságáról, és milyen alapon? 





24.25. ábra. Felülnézeti kép egy kétkamerás látórendszerről, amely egy üveget figyel meg, amely mögött 
egy fal van 


24.9. A következő állítások közül melyik igaz és melyik hamis? 

(a) Sztereoképeken az egymásnak megfelelő pontok megtalálása a sztereo- 
mélység-megállapítás folyamatának legegyszerűbb feladata. 

(b) Az alak-mintázatból feladat megoldható egy fénycsíkokat tartalmazó háló 
jelenetre történő vetítésével. 

(c) A Huffman-Clowes címkéző rendszer mindenféle poliéderes objektumot 
tud kezelni. 

(d) Görbéket tartalmazó objektumok vonalas rajzaiban a vonal címkéje változ- 
hat az egyik végétől a másikig. 

(e) Ugyanazon jelenet sztereonézeteiben minél messzebb van a két kamera 
egymáshoz képest, annál pontosabban határozható meg a mélység. 

(0 Egy jelenetben található egyforma hosszúságú vonalak mindig egyforma 
hosszúságra vetítődnek a képen. 

(g) A képen egyenes vonalak szükségszerűen egyenes vonalaknak felelnek 
meg a jelenetben. 


24.10. A 24.23. ábra egy autó nézőpontjából készült egy autópálya kijáratánál. Két 
autó látható a közvetlenül balra levő sávban. Milyen okok miatt kel! a nézőnek 
azt a következtetést levonnia, hogy az egyik közelebb van, mint a másik? 


25. ROBOTIKA 


Ebben a fejezetben az ágenseket fizikai beavatkozó szervekkel látják el, hogy rosszal- 
kodhassanak. 


25.1. BEVEZETÉS 


A robotok (robots) olyan fizikai ágensek, amelyek a fizikai világ megváltoztatásával 
oldanak meg feladatokat. E célból különböző beavatkozó szervekkel (effectors) 
szerelik fel őket, például lábakkal, kerekekkel, karokkal és megfogókkal. A beavatko- 
zók kizárólagos célja, hogy fizikai hatást fejtsenek ki a környezetre.! A robotokat 
érzékelőkkel (sensors) is felszerelik, hogy érzékelhessék környezetüket. Manapság a 
robotikában számtalan különféle érzékelőt használnak: kamerákat és ultrahangradaro- 
kat a környezet mérésére, giroszkópokat és gyorsulásmérőket a robot saját mozgásá- 
nak követésére. 

A legtöbb mai robot három nagy kategória egyikébe sorolható. A manipulátorok 
(manipulators), vagy más néven robotkarok fizikailag a munka helyszínéhez rögzítet- 
tek, például egy ipari szerelősoron egy gyárban vagy a Nemzetközi Űrállomáson. A ma- 
nipulátorok mozgását általában irányítható csuklók sora biztosítja, lehetővé téve, hogy 
a végbeavatkozó szerv a munkatér bármely pontjára eljuthasson. Az ipari robotok 
messze leggyakoribb fajtája a manipulátor, világszerte több mint egymillió működik 
belőlük. Bizonyos mobil robotkarokat kórházakban, műtéteknél használnak. Kevés 
autógyártó tudna ma már meglenni ipari robotok nélkül, és egyes robotkarok még mű- 
alkotások készítésére is képesek. 

A második csoportot a mobil robotok (mobile robots) alkotják. A mobil robotok ke- 
rekek, lábak vagy hasonló szerkezetek segítségével mozognak a fizikai környezetben. 
Használják őket kórházakban ételkihordásra, dokkokban árurakodásra és más, hasonló 
feladatokra. Korábban már említettünk egy példát, a NAVLAB ember nélküli közúti 
járművét (unmanned land vehicle, ULV), amely autópályán képes önállóan, sofőr 
nélkül navigálni. Másfajta mobil robotokat, például az ember nélküli légi járműveket 
(unmanned air vehicles, UAV) katonai felderítésre, mezőgazdasági permetezésre és 
megfigyelésre használnak. Az autonóm víz alatti járművek (autonomous under- 
water vehicles, AUV) nagy szerepet játszanak a mélytengeri felfedezésekben, míg a 
bolygójárók (planetary rovers), mint például a 25.1. (a) ábrán látható Sojourner, az Űr- 
kutatásban segédkeznek. 





1 A 2. fejezetben még beavatkozókról (actuators) beszéltünk. és nem beavatkozó szervekről (effectors). 
A beavatkozó egy vezérlővonal, amely a beavatkozó szervnek közvetíti az utasítást, míg a beavatkozó szerv 
maga a fizikai eszköz. 
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(a) (b) 


25.1. ábra. (a) A NASA Sojourner mobil robotja, amely a Mars felszínét derítette fel 1997 júliusában. 
(b) A Honda P3 és Asimo elnevezésű humanoid robotjai. 


A harmadik típusba tartoznak a hibridek: olyan mobil robotok, amelyekre karokat is 
szereltek. Ezek közé sorolhatjuk a humanoid robotokat (humanoid robots), amelyek 
fizikai felépítése hasonlít az emberéhez. A 25.1. (b) ábrán két ilyen humanoid robot lát- 
ható, mindkettő Japánban készült, a Hondánál. A hibridek a rögzített manipulátoroknál" 
nagyobb távolságokban is képesek beavatkozó szerveiket használni, de általában nehe- 
zebben tudják végrehajtani a feladatukat, mert nem rendelkeznek kellő stabilitással és 
szilárdsággal, amit a lerögzítés biztosít. 

A robotika tárgyköre magában foglalja a protéziseket (emberek részére készített 
mesterséges végtagok, mesterséges fül vagy szem), az intelligens környezeteket (mint 
például egy egész ház felszerelve szenzorokkal és beavatkozó szervekkel) és a több- 
elemű (multibody) rendszereket is, ahol a feladatokat rengeteg apró együttműködő 
robot hajtja végre. 

A valódi robotoknak általában olyan környezetben kell boldogulniuk, amely csak 
részlegesen megfigyelhető, sztochasztikus, dinamikus és folytonos. Néhány, de nem 
mindegyik robotkörnyezet szekvenciális és multiágens jellegű is. A részleges meg- 
figyelhetőség és a sztochasztikusság annak az eredménye, hogy egy meglehetősen nagy 
és komplex világgal kell foglalkozni. A robot nem lát a sarkok mögé, és bizonytalan- 
ság van a mozgásparancsok végrehajtásában a hajtások csúszása, a súrlódás stb. miatt. 
Mi több, a fizikai világ makacsul visszautasítja, hogy valós idejűnél gyorsabb legyen! 
Szimulációs környezetben egyszerűbb tanulási algoritmusok használatával (mint példá- 
ul a 21. fejezetben leírt 0-tanulás) lehetséges mindössze néhány CPU-munkaóra során 
több millió próbát vérgrehajtva tanulni, de valós környezetben éveket vehetnek igénybe 
ezek a kísérletek. Továbbá, az igazi ütközések valóban fájdalmat okozhatnak, ellentét- 
ben a szimuláltakkal. A valódi robotrendszerekbe — ahhoz, hogy a robot gyorsan tanul- 
hasson és biztonságosan üzemelhessen - előzetesen információt kell beépíteni magáról 
a robotról, fizikai környezetéről és az elvégzendő feladatról. 
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Eddig a könyvben adottnak tekintettük az ágensek architektúráját (érzékelőket, beavatko- 
zó szerveket és processzorokat), és csak az ágensek működtető programjára koncentrál- 
tunk. A valóságban a robotok sikere legalább annyira múlik a feladathoz illő, megfelelő 
szenzorok és beavatkozó szervek megválasztásán. 


Érzékelők 


A szenzorok jelentik az érzékelési interfészt a robotok és környezetük között. A pasz- 
szív érzékelők (passive sensors), mint például a kamerák, ténylegesen puszta meg- 
figyelői a környezetüknek: olyan jeleket vesznek, amelyeket a robot környezetében lévő 
más tárgyak generálnak. Az aktív szenzorok (active sensors), mint például a hanglokátor, 
energiát sugároznak környezetükbe, és érzékelik, ha ez az energia visszaverődik. Az aktív 
szenzorok általában több információt szolgáltatnak, de ugyanakkor többet fogyasztanak, és 
interferencia léphet fel, ha egyszerre többet is használunk. Akár aktív, akár passzív érzé- 
kelőkről van szó, három csoportba lehet őket osztani az alapján, hogy távolságot mérnek, 
teljes képet közvetítenek a környezetről vagy a robot egyes saját tulajdonságait figyelik. 

Sok mobi! robot egy adott térrészt lefedő pásztázó távolságmérőt (range finder) 
használ, olyan szenzort, amely a közeli tárgyak távolságát méri. Gyakori típus a szonár- 
szenzor, más néven hanglokátor. A szonárszenzorok irányított hanghullámokat bocsáta- 
nak ki, amelyek egy része visszaverődik a tárgyakról. A visszaverődés ideje és a hullám 
intenzítása információval szolgál a közeli tárgyak helyzetéről. Az AUV-kre (autonóm víz 
alatti jármű) víz alatti hanglokátorokat szerelnek. Szárazföldön a hanglokátorokat — rossz 
irányfelbontásuk miatt — főleg kis távolságon belüli ütközések elkerülésére használják. 
A hanglokátorok alternatíváját jelenthetik (elsősorban légi járműveknél) a radaralapú és a 
lézeres távolságmérők. Egy lézeres pásztázó távolságmérő látható a 25.2. ábrán. 





(a) 
25.2. ábra. (a) A mobil robotoknál népszerű SICK LMS lézeres távolságmérő. (b) Egy horizontálisan 
felszerelt távolságmérő által mért visszaverődési kép 2D-s térképre vetítve. 
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Egyes távolságmérők csak nagyon kicsi vagy nagyon nagy távolságokra használha- 
tók. A kis távolságú szenzorok közé tartoznak a taktilis, vagyis tapintásalapú érzéke- 
lők (tactile sensors), mint például az érzékelőbajusz, lökhárító vagy az érintésérzékeny 
bőr. A skála másik végén a globális helymeghatározó rendszer (Global Positioning 
System, GPS) áll, amely a műholdakból érkező impulzusok alapján számítja a távolsá- 
got. Jelenleg két tucat műhold kering orbitális pályán, és mindegyik két külön frekven- 
cián sugároz jeleket. A GPS-vevőkészülékek a fázistolásból tudják kiszámítani a mű- 
holdtól való távolságukat. Több műholdtól érkező jel alapján háromszögeléssel néhány 
méteres pontossággal meghatározható a Földön elfoglalt tényleges pozíció. A differen- 
ciális GPS (differential GPS) még egy pontosan ismert helyen lévő földi vevő jelét is 
használva — ideális esetben — milliméteres pontosságot ér el. Sajnálatos módon a GPS 
nem használható beltérben vagy víz alatt. 

A szenzorok másik fontos osztályát képezik a képérzékelők (imaging sensors). 
A kamerák képet adnak számunkra a környezetről, valamint — a 24. fejezetben tárgyalt, 
számítógépes gépi látási módszerek alkalmazásával — modellekkel, illetve tulajdonsá- 
gokkal írják le a környezetet. A sztereolátás különösen fontos a robotikában, mivel 
mélységi információt is közvetít. Jövőjük mindamellett elég bizonytalan, mert sikere- 
sen folyik új, aktív távolságleképezési technológiák kidolgozása. 

A harmadik fontos osztályt az önérzékelők (proprioceptive sensors) alkotják, amelyek 
a robot saját állapotáról adnak tájékoztatást. Annak érdekében, hogy a robot csuklóinak 
pontos állásáról információnk legyen, a motorok tengelyét sokszor szöghelyzet-dekódo- 
lókkal (shaft decoders) látják el, amelyek kis lépésekben követik a tengely elfordulását. 
A robotkarokon a tengelyre szerelt dekódolók bármikor pontos helyzetinformációt tud- 
nak szolgáltatni. Mobil robotokon a szöghelyzet-dekódolókat a kerék mozgásának 
figyelésére használják, amely alapján számítható a megtett út. Ezt hívják odometriának 
(odometry). Sajnálatos módon az odometria — a kerekek csúszása és sodródása miatt — 
csak kis távolságokban használható. A külső hatások, mint például az áramlások az 
AUV-knél (autonóm víz alatti jármű) vagy a szél az UAV-k (autonóm légi jármű) ese- 
tében tovább növeli a mérés bizonytalanságát. Az inerciaszenzorok (inertial sensors), 
mint például a giroszkóp, javítanak a pontosságon, de önmagukban még nem küszöbö- 
lik ki a pozíciómérés hibájának elkerülhetetlen halmozódását. 

A robotállapot más fontos jellemzőinek mérésére erő- és nyomatékérzékelőket 
(force, torgue sensors) használnak. Ezek nélkülözhetetlenek, ha a robotnak törékeny 
tárggyal kell dolgoznia, vagy olyannal, amelynek pontos mérete és helyzete nem ismert. 
Képzeljük csak el, amikor egy közel egytonnás manipulátornak egy villanykörtét kell 
becsavarnia. Ha túl nagy erővel fogná meg a körtét, könnyen összeroppanthatná. Az erő- 
érzékelők lehetővé teszik, hogy a robot tudja, milyen nehéz megfogni a körtét, míg a 
nyomatékérzékelők információt szolgáltatnak, hogy milyen nehéz becsavarni. A jó szen- 
zorok képesek erőt mérni mindhárom elmozdulási és mindhárom elfordulási irányban. 







Beavatkozó szervek 


A robotok beavatkozó szerveik segítségével mozognak és változtatják alakjukat. Ah- 
hoz, hogy megértsük a beavatkozó szervek felépítését, először is általános értelemben 
kell beszélnünk a mozgás és az alak elvont értelmezéséről, a szabadságfokok (degree 
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of freedom, DOF) koncepciójának felhasználásával. Szabadságfoknak számít minden 
olyan irány, amelyben a robot vagy egyik beavatkozó szerve mozogni képes. Például 
egy merev, szabadon mozgó robotnak (mint amilyenek az AUV-k) hat szabadságfoka 
van, három az (x, y, 2) térbeli elhelyezkedés, három pedig a szögelfordulás (orientáció). 
Ezeket szokták csavarásnak, billentésnek és forgatásnak is hívni (RPY — roll, pitch, 
yaw). Ez a hat szabadságfok meghatározza a robot kinematikus állapotát, más néven a 
pozícióját és az orientációját együttesen. A robot dinamikai állapota (dynamic state) 
minden egyes kinematikai paraméter változási sebességét is tartalmazza, így minden 
kinematikai dimenziónál egy-egy további dimenziót hoz be. 
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(a) (b) 
25.3. ábra. (a) A Stanford manipulátor: egy korai robotkar öt rotációs (R) és egy transzlációs (prizmatikus) 
csuklóval (P), összesen hat szabadságfokkal. (b) Egy elsőkerék-kormányzású nemholonomikus négykere- 
kű jármű mozgása. 























Nem merev testek esetében magán a roboton belül további szabadságfokok vannak. 
Például az emberi kar esetében a könyök egy szabadságfokú, mert egy irányba képes 
elfordulni. A csukló három szabadságfokú, mert tud fel-le és jobbra-balra mozogni, to- 
vábbá forogni is. Általában minden egyes robotcsuklónak is egy, két vagy három sza- 
badságfoka van. Hat szabadságfok szükséges ahhoz, hogy például egy kezet a térben 
tetszőleges pozícióba és irányba (orientációba) hozzunk. A 25.3. (a) ábrán látható robot- 
karnak pontosan hat szabadsági foka van: öt rotációs csukló (revolute joint), amelyek 
forgást tesznek lehetővé, és egy transzlációs csukló (prismatic joint), amely kinyúlás- 
ra képes. Egy egyszerű kísérlet segítségével könnyedén meggyőződhetünk arról, hogy 
az emberi kéznek valójában hatnál több szabadságfoka van: kezünket az asztalra rakva 
még mindig képesek vagyunk elforgatni a könyökünket, anélkül hogy a kezünk kon- 
figurációja megváltozna. Azokat a manipulátorokat, amelyeknek több szabadságfoka 
van, mint ami minimálisan szükséges ahhoz, hogy végbeavatkozó szervüket (end 
effector) a kívánt helyre vigyék, könnyebb vezérelni, mint azokat, amelyek csak a mi- 
nimálisan szükséges számú szabadságfokkal rendelkeznek. 

Mobil robotoknál a szabadságfokok száma nem feltétlenül egyezik meg a mozgatott 
részek számával. Vegyünk például egy átlagos autót: tud mozogni előre-hátra és tud 
fordulni. Ez így két szabadságfok. Ennek ellenére a kocsi kinematikája háromdimenziós: 
egy szabad lapos felületen könnyedén el tud jutni bármilyen (x, y) pontba, tetszőleges 


2 A .kinematika" szó a görög , cinema" -ból ered. ami mozgást jelent. 
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orientációval (lásd 25.3. (b) ábra). Azaz a kocsinak 3 effektív szabadságfoka (effective 
DOF) van, de 2 irányítható szabadságfoka (controllable DOF). A robotra azt mond- 
juk, hogy nemholonomikus (nonholonomic), ha az effektív szabadságfoka nagyobb, 
mint az irányítható szabadságfoka, míg holonomikus (holonomic), ha ez a kettő meg- 
egyezik. A holonomikus robotokat könnyebb irányítani. Mennyivel egyszerűbb lenne 
olyan kocsival parkolni, amely képes oldal irányban is mozogni, nem csak előre-hátra! 
Viszont a holonomikus robotok jellemző módon mechanikailag sokkal bonyolultabbak. 
A legtöbb robotkar holonomikus, míg a mobil robotok általában nemholonomikusak. 

A mobil robotok számára mozgató mechanizmusok széles tárháza áll rendelkezésre: 
kerekek, lánctalpak, lábak stb. A differenciál hajtású (differential drive) robotoknak 
kétoldalt külön mozgatható kerekeik (vagy lánctalpaik) vannak, ugyanúgy, mint a tankok- 
nak. Ha mindegyik kerék azonos sebességgel mozog, akkor a jármű egyenesen halad 
előre. Ha ellenkező irányba mozognak, akkor a robot képes egy helyben megfordulni. 
A másik alternatívát a szinkrón hajtás (synchro drive) jelenti, amelynél minden kerék 
el tud fordulni a tengelye mentén. Ez könnyen vezethetne káoszhoz, ha nem lenne az a 
kényszer, hogy minden kerék mindig azonos irányba álljon, és azonos sebességgel forog- 
jon. Mind a differenciál, mind a szinkrón hajtás nemholonomikus. Egyes drága robotok 
holonomikus hajtást használnak, általában három vagy több önállóan irányítható kerékkel. 

A kerekekkel ellentétben a lábak még a nagyon nehéz tereppel is megbirkóznak. 
Ugyanakkor a lábak meglehetősen lassúak sík terepen, és mechanikailag nehezebb 
megépíteni őket. Robotikai szakemberek próbáltak már különféle konstrukciókat, egy- 
től akár tucatnyi lábig. Készítettek lábbal rendelkező robotokat sétálásra, futásra, sőt 
még ugrálásra is. Egy ilyen példa látható a 25.4. (a) ábrán: ez a robot dinamikusan sta- 
bil (dinamically stable), ami azt jelenti, hogy képes talpon maradni, miközben körbe 
ugrál. Statikusan stabilnak (statically stabile) hívják azokat a robotokat, amelyek úgy 
képesek állva maradni, hogy nem mozognak a lábaik. A robot statikusan akkor stabil, 
ha a súlypontja a lábai által kifeszített sokszög fölé esik. 





(a) (b) 
25.4. ábra. (a) Marc Raibert egyik lépegető robotja mozgás közben. (b) A Sony AIBO robot focizás köz- 
ben (copyright 2001, The RoboCup Federation). 
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Más típusú mobil robotok teljesen eltérő módszereket használnak a mozgáshoz. A légi 
járműveken általában propellereket vagy turbinákat alkalmaznak. Robot léghajók a me- 
leg áramlatokat használják ki, hogy a levegőben maradjanak. Az autonóm víz alatti jár- 
művek gyakran alkalmaznak a tengeralattjárókon használtakhoz hasonló fúvókákat. 

Szenzorok és beavatkozó szervek önmagukban még nem tesznek ki egy robotot. Egy 
igazi robotnak energiaforrásra is szüksége van, hogy mozgathassa beavatkozó szerveit. 
A legnépszerűbb megoldás mind a manipulátorok mozgatásához, mind a helyváltozta- 
táshoz, a villanymotor. Ugyanakkor a pneumatikus (sűrített gázzal működő) és a hidrau- 
likus (folyadékkal közvetített nyomással működő) hajtásoknak is megvannak a maguk 
alkalmazási területei. A legtöbb robot valamiféle digitális kommunikációs eszközzel is 
rendelkezik, például vezeték nélküli hálózati kapcsolattal. Végezetül szükség van vala- 
mi vázra is, amelyre fel lehet szerelni az alkatrészeket és az eszközöket, valamint egy 
forrasztópákára, ha az alkatrészek és eszközök megszűnnek működni. 
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Az érzékelés az a folyamat, amelynek során a robot a szenzoraiból érkező jeleket kör- 
nyezetének belső reprezentációjára képezi le. Az érzékelés nehéz, mivel általában a 
szenzorok adatai zajjal terheltek, a környezet csak részlegesen megfigyelhető, nem jósol- 
ható viselkedésű és gyakran dinamikus is. Ökölszabály, hogy egy jó belső reprezentá- 
ciónak három tulajdonsága van: elég információt hordoz ahhoz, hogy a robot a megfe- 
lelő döntést meghozhassa; strukturáltsága lehetővé teszi, hogy hatékonyan frissíthető 
legyen; valamint természetes olyan értelemben, hogy a belső állapotváltozók megfelel- 
tethetők egy-egy valós fizikai világbeli állapotváltozónak. 

A 15. fejezetben megmutattuk, hogy a Kalman-szűrők, a rejtett Markov-modellek és 
a dinamikus Bayes-hálók alkalmasak egy részlegesen megfigyelhető környezet állapot- 
átmenet- és érzékelő modelljeinek a reprezentálására. Ismertettünk egzakt és közelítő 
algoritmusokat a belső hiedelmi állapot (belief state) — a környezet állapotváltozói fe- 
lett értelmezett a posteriori valószínűség-eloszlás — frissítésére. Erre számos dinamikus 
Bayes-hálós modellt mutattunk be a 15. fejezetben. Robotikai problémák esetében a mo- 
dellhez általában megfigyelt változóként a robot saját korábbi cselekvéseit is hozzávesz- 
szük, mint ahogy az a 17.9. ábra hálózatán látható. A 25.5. ábra ennek a fejezetnek a je- 
löléseit mutatja: X, a környezet állapota (beleértve a robotot is) a t időpillanatban; Z, a t 
időpontbeli megfigyelés (az érzékelésből származó adatok), az A, pedig az érzékelést kö- 
vetően végzett cselekvés. 

A szűrési (filtering) feladat, vagyis a hiedelmi állapot frissítése alapvetően azonos a 
15. fejezetben tárgyaltakkal, A feladat az új hiedelmi állapot, P(X, , iIZ1:r415 a1:) ki- 
számítása a P(X.IZ1.r a4., 1) aktuális hiedelmi állapotból és az új z, , , megfigyelésből. 
Az alapvető különbség az, hogy (1) explicit feltételekkel élünk mind a döntést, mind a 
megfigyelést illetően, (2) folytonos változókkal kell dolgoznunk diszkrétek helyett. 
Ezért módosítanunk kell a (15.3)-as rekurzív szűrőalgoritmust, integrált használva az 
összegzés helyett: 





PC, iz) — 0PCz al X.412 f PE yalxr ap) PC, IZ say dx, (25.D 
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25.5. ábra. A robotérzékelés felfogható úgy, mint cselekvések és mérések sorozatának időbeli egymásra 
hatása, ahogy ezt a dinamikus Bayes-háló is illusztrálja 


Az egyenlet azt fejezi ki, hogy az X állapotváltozó feletti a posteriori eloszlást a 
t-t 1 időpillanatbani rekurzívan számítjuk az egy időlépéssei korábbi megfelelő 
becslésből. A számításokhoz felhasználjuk a korábbi cselekvést, a,-t, és az aktuális 
szenzoros megfigyelést, z, , 1-et. Például ha célunk egy futballozó robot fejlesztése, 
akkor X,, , lehet a labda relatív helyzete a robothoz képest. A posteriori P(X.IZ1n 
1.1) mindazon állapotok felett értelmezett valószínűség-eloszlás, amelyek megőr- 
zik mindazt, amit a korábbi érzékelő mérésekből és irányításokból tudunk. A (25.1) 
egyenlet megmondja, hogyan becsüljük rekurzívan ezt a pozíciót, folyamatosan fel- 
használva az újabb szenzoradatokat (például kameraképek) és a robot mozgásparan- 
csait. A P(X, 4 1Ixp a,) valószínűséget állapotátmenet-modellnek (transition model) 
vagy más néven mozgásmodellnek (motion model) hívjuk, míg P(z,,1lx.41) az 
érzékelő modell (sensor model). 


Helymeghatározás 


A helymeghatározás (localization) jellemző példa a robotérzékelésre. A probléma lé- 
nyege a dolgok pontos helyzetének meghatározása. A helymeghatározás az egyik leg- 
fontosabb érzékelési feladat a robotikában, mivel a fizikai környezettel való sikeres köl- 
csönhatáshoz feltétlenül szükséges. Például a robotkaroknak tudniuk kell, hol van az 
a tárgy, amivel dolgozni akarnak. A navigáló robotoknak pedig pontosan ismerniük kell 
saját helyzetüket, hogy eljuthassanak a céljukhoz. 

A helymeghatározási feladat három, egyre nehezebb problémaként jeletkezik. Ha a 
tárgy kezdeti pozíciója és iránya (orientációja) ismert, akkor a helymeghatározás tulaj- 
donképpen követési feladatot (tracking) jelent, és ez korlátos bizonytalansággal jelle- 
mezhető. Ennél nehezebb a giobális helymeghatározás (global localization), amikor 
is a kezdeti pozíció egyáltalán nem ismert. A giobális helymeghatározás követési prob- 
lémává egyszerűsödik, ha sikerül lokalizálni a kívánt tárgyat, de itt is előfordulhatnak 
olyan esetek, amikor a robotnak nagyon nagy bizonytalanságokkal kell megbirkóznia. 
Végezetül lehetünk gonoszak is a robotunkkal, ha elvesszük, , elraboljuk" előle az ép- 
pen lokalizálni próbált tárgyat. Ezt elrablásos problémának (kidnapping problem) 
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(a) (b, 
25.6. ábra, (a) Egy mobil robot egyszerűsített kinematikai modellje. A robotot a kör jelképezi, és a 
bevágás mutatja a haladási irányt. Külön-külön láthatjuk a 1-beli és a : -- 1-beli pozíciót és orientációt 
a v, A, és w, A, frissítési értékekkel. Szintén fel van tüntetve egy t időpontban megfigyelt referencia- 
Pont (tereptárgy) az (xy) pontban. (b) A pásztázó távolságmérés modellje. Egy adott távolságú 
méréshez (z4, 22, 3 Z4) tartozó két lehetséges robothelyzet látható. Sokkal valószínűbb, hogy a bal 
oldali helyzetből származnak a távolságmérések. 


hívják, és gyakran tesztelik vele a robot lokatizációs algoritmusának robusztusságát 
extrém körülmények között. 

Azért, hogy egyszerűvé tegyük a dolgot, feltételezzük, hogy a robotunk lassan mo- 
20g sík terepen, és pontos térképe van a környezetéről. (Egy ilyen térkép látható a 25.8. 
ábrán.) Egy mobil robot helyzetét két derékszögű koordinátájával (x, y) és az irányát 
jellemző szöggel írjuk le, ahogy ez a 25.6. (a) ábrán is látható. (Mivel nem foglakoz- 
tunk a hozzá tartozó sebességekkel, ez inkább kinematikai, mint dinamikus modell.) Ha 
8 a három erteket egy vektorba fogjuk össze, akkor bármely állapot megadható 

7 (Ip o" formában. 

Jat közelítésben minden cselekvés felbontható két , pillanatnyi" sebességre: 
egy v,(transzlációs) sebességre és egy w, (rotációs) szögsebességre. Kis A időkre a ro- 
bot mozgásának egy durva determinisztikus modellje az alábbi alakban adható meg: 


v At cosB, 
X1— KAVE X, 4 v,.Arsinő, 
SR At 


Az £ jelölés a determinisztikus állapotbecslésre vonatkozik. Természetesen a fizikai 
robotok valamilyen módon mindig megjósolhatatlanok maradnak. Ezt gyakran model- 
lezik egy f(X,, v,; wy) középértékű, X, kovarianciájú Gauss-eloszlással. (Lásd még az 
A) függelék matematikai definícióit.) 


Pr [X..v ENK aZ) 


A következő lépésben szükségünk van egy érzéklő modellre. Kétféle érzékelő modell- 
ről beszélhetünk. Az első azon alapul, hogy a szenzor referenciapontoknak (land- 
marks) nevezett állandó és felismerhető jellemvonásokat érzékel és azonosít a környe- 
zetében. Minden referenciapontról meghatározza annak távolságát és szögét. Tegyük 


1032 25. ROBOTIKA 


fel, hogy a robot az x, — (X.Y 0)" állapotban van, és érzékel egy ismert (xi, 9)" helyen 
lévő referenciapontot. Ha nem vesszük bele az érzékelés zajosságát, egyszerű geomet- 
riával megkapható a távolság és a szög (lásd a 25.6. (a) ábra). Megfigyelés alapján a 
pontos becslés a távolságra és a szögre: 





A zaj most is torzítja a méréseinket. Egyszerűsítésül Gauss-eloszlású, E, kovarianciá- 
jú i zajt tételezhetünk fel: 


Píz,Ix) — N(g, 2) 


A 25.2. ábrán bemutatott távolságszenzorokhoz kicsit másféle érzékelő modell is megfe- 
lelő lehet. Az ilyen érzékelők egy z, — (z4,..., úg" vektort adnak vissza távolságadatok- 
kal, amelyek a robothoz képest rögzített irányokban lévő tárgyakról hordoznak információt. 
Adott x, pozícióban legyen 2; a j-edik sugár irányába lévő legközelebbi akadály pontos tá- 
volsága. Csakúgy, mint korábban, most is Gauss-zajt tételezünk fel. Általánosan vehetjük 
úgy, hogy a különböző sugárirányokbeli hibák függetlenek és azonos elosztásúak, így: 


Mm Ke 
Píz,x) maf [ee 

ja 
A 25.6. (b) ábra egy példát mutat be négyirányú távolságmérő szkennerre, két különbö- 
ző pozíció esetén. A kettő közül az egyik sokkal nagyobb valószínűséggel adhatta a 
megfigyelés négy értékét. Összehasonlítva a pásztázó távolságméréses modellt a refe- 
renciapontos modellel látható, hogy az előbbinek az az előnye az utóbbival szemben, 
hogy nincs szükség egy referenciapont azonosítására mielőtt egy tartománypásztázás 
értelmezhető lenne. Sőt az ís előfordulhat - ahogy a 25.6. (b) ábra esetében is —, hogy 
a robot egy jellegtelen fallal találkozik. Ugyanakkor, ha van egy tisztán látható, azono- 
sítható referenciapont, akkor abból azonnal megkapható a pontos helyzet. 

A 15. fejezetben már találkoztunk a Kalman-szűrővel, amely a hiedelmi állapotot 
egyetlen többváltozós CGauss-eloszlással reprezentálja, illetve a részecskeszűrővel, 
amely a hiedelmi állapotot az állapotokhoz rendelt részecskeegyüttessel reprezentál- 
ja. A legtöbb modern lokalizáló algoritmus e két módszer egyikét használja a robot 
P(X]Z1.n a1-1) hiedelmi állapotának leképezésére. 

A részecskeszűrős lokalizációs algoritmust Monte Carlo lokalizációnak (Monte 
Carlo localization, MLC) hívják. Az MCL alapvetően megegyezik a 15.15. ábrán be- 
mutatott részecskeszűrős algoritmussal, mindössze annyit kell módosítanunk, hogy 
szükségünk van a megfelelő mozgás és szenzor modellre. A 25.7. ábra bemutat egy vál- 
tozatot, pásztázó távolságméréses modellel. Az algoritmus működését, azt, hogy hogyan 
azonosítja a robot saját tartózkodási helyét az irodaépületben, a 25.8. ábra szemlélteti. 
Az első képen még a részecskék egyenletesen oszlanak el, az előzetes információ alap- 
ján, jelképezve a teljes bizonytalanságot a robot pozícióját illetően. A második képen 
már az első mérések alapján klasztereket alkotnak a részecskék, oda tömörülve, ahol 
valószínűleg tartózkodik a robot. A harmadik esetben pedig már elég információ áll 
rendelkezésre a mérésekből, hogy az összes részecske ugyanoda jusson. 
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25.8. ábra. A Monte Carlo lokalizáció, egy részecskeszűrő algoritmus mobil robotok pozíciójának meg- 
határozására. Felül: a kezdeti, teljes bizonytalanság. Középen: nagyjából kétpólusú bizonytalanság, mi- 
után a robot elindult a középső (szimmetrikus) folyosón. Alul: egyetlen pont köré szűkült bizonytatan- 
ság, miután bement az egyik irodába. 
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function MONTE-CARLO-HELYZETMEGHATÁROZÁS(a, z, N, modett, térkép) returns egy mintahalmaz 
iInputs: a, a megelőző robotmozgás-parancs 
2, egy pásztázó távolságmérés M méréssel 21...., 24 
N, a fenntartandó minták száma 
modell, egy valószínűségi környezet modell a helyzetre vonatkozó P(Xg) priorral 
P(XIX0. Ap) mozgásmodell és pásztázó távolságmérő P(ZIZ) zajmodell 
térkép, a környezet 2D térképe 
static: S, egy N mintából álló vektor, kezdetben a P(Xg) szerint generálva 
local variables: W, egy N elemű súlyvektor 


fori— 1 toN do 
S[0 — minta a P(XII Xg — ST, Ag — a)-ból 
WI —1 
forj— 1 to Mdo 
£ €— EGZAKT-TARTOMÁNYÚ([, S(i), rérkép) 
WIN — WIJ - P(Z — 2-2 
S — SÚLYOZOTT-MINTA-HELYETTESÍTÉSSELN, S, W) 
return § 











25.7. ábra. A Monte Carlo lokalizáló algoritmus, független zajjal terhelt pásztázó távolságméréses mo- 
dellt használva 


A Kalman-szűrő a másik széles körben használt lokalizáló algoritmus. A Kalman-szűrő 
a P(X.Iz1.p a1.-1) posteriort egy Gauss-eloszlással reprezentálja. Az eloszlás középérték- 
Ét stpvel, kovarianciáját pedig 32,-vel jelöljük. A fő probléma a Gauss-hiedelmekkel az, 
hogy csak lineáris mozgási modell, f és lineáris mérési modell, /: mellett zártak. Nem- 
lineáris f vagy it esetén a szűrő frissítésének eredménye általában már nem lesz Gauss- 
eloszlású. Így Kalman-szűrőt használó lokalizációs algoritmusok linearizálják a mozgási 
És az érzékelő modelleket. A linearizálás egy nemlineáris függvény adott lokális lineá- 
ris közelítése. A 25.9. ábra a linearizálás elvét mutatja be egy (egydimenziós) robot- 
mozgási modellen. A bal oldalon fut a mozgás nemlineáris f(x,, ap) modellje (az a, 
vezérlés nem szerepel az ábrán, mert nem játszik szerepet a linearizálásban). A jobb olda- 
lon ezt egy f(x,, a,) lineáris függvénnyel közelítjük. A lineáris függvény a zt, pontban 
érinti az f-et, ami a t időre vonatkozó becslésünk középértéke. Ezt a linearizálást (első 
fokú) Taylor-sorfejtésnek ( Taylor expansion) hívják. Az olyan Kalman-szűrőt, amely 
f-et és h-t Taylor-sorfejtéssel linearizálja, kiterjesztett Kalman-szűrőnek (KKSZ; 
extended Kalman Filter - EKF) hívjuk. A 25.10. ábra egy KKSZ helymeghatározó 
algoritmust használó robot becsléssorozatát mutatja. Ahogy a robot halad, a helyze- 
tére vonatkozó becslés bizonytalansága egyre nő, ahogy azt a hibaellipszis is mutatja. 
A hiba csökken, ahogy a robot egy ismert elhelyezkedésű referenciapont távolsága és 
szöge alapján javítani tudja saját helyzetére vonatkozó becslését. A hiba végül újra nő- 
ni kezd, ahogy a referenciapont kikerül a robot látóköréből. A KKSZ algoritmus jól 
működik, ha könnyen azonosítható referenciapontok vannak. Ellenkező esetben az 
a posteriori eloszlás multimodális is lehet, mint a 25.8. (b) ábrán. A referenciapontok 
azonosításának szükségességét jelentő probléma csak egy példa a 15. fejezet végén tár- 
gyalt adatasszociációs (data association) problémának. 
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(a) (b) 
25.9. ábra. Egydimenziós, linearizált mozgási modell illusztrálása: (a) Az f függvény és ? -- 1 időpont- 
beli u, középértéke és kovarianciája (I, alapján). (b) A lincarizáh változat az / érintője a 4, pontban. 
A középérték ugyanaz marad, ugyanakkor az előrevetített 3 , , kovariancia már különbözik a Dya-től. 





referenciapont 


25.10. ábra. Példa a kiterjesztett Kalman-szűrő használatára lokalizációs problémához, A robot egy 
egyenes mentén mozog. Ahogy halad előre, a saját helyzetének ismeretéhez tartozó bizonytalanság fo- 
koözatosan nő, ahogy azt a hibaellípszisek mutatják. Amikor észrevesz egy ismert pozíciójú referencia- 
pontot, a bizonytalanság csökken. 


Térképezés 


Az előzők során egyetlen tárgy helymeghatározásának problémáját tárgyaltuk meg. A ro- 
botikában azonban általában egyszerre több tárgy helyzetét kell meghatározni. A klasszi- 
kus példa erre a feladatra a térképezés. Képzeljünk el egy robotot, amelyiknek nincs 
pontos térképe a környezetéről, magának kell azt elkészítenie. Az ember fantasztikus 
képességeket fejlesztett ki, hogy feltérképezze környezetét, mára már az egész bolygót. 
Természetesen adódó feladat egy olyan algoritmus kitalálása, amely képessé teszi 
ugyanerre a robotot is. 

Az irodalomban a robottérképezés problémáját gyakran mint szimultán helymeg- 
határozást és térképezést (SZLT; simultaneous localization and mapping, SLAM) 
említik. A robotnak nem csupán egy térképet kell konstruálnia, hanem ezt anélkül kell 
tennie, hogy ismerné, ő maga hol tartózkodik. Az SZLT az egyik alapvető robotikai 
probléma. Azt a változatot fogjuk tekinteni, amikor a környezet állandó. A feladat így is 
meglehetősen bonyolult; és még nehezebbé válik, ha megengedjük, hogy a környezet 
változzon, ahogyan a robot mozog benne. 
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Statisztikai oldalról nézve a térképezés egy Bayes következtetési probléma, csakúgy, 
mint a lokalizáció. Jelöljük M-mel a térképet és X.-vel a robot r pillanatbeli helyzetét, 
mint ahogy azt korábban is tettük. Ekkor átírhatjuk a (25.1) egyenletet, hogy a posterior 
tartalmazza a teljes térképet is: 


PG, pro Mr str) — OPEZ, alX.41. 4) f P(X, ax, .a) P(x, Mizt, agy dx, 


Szerencsére az egyenletből látszik, hogy a feltételes eloszlások, amelyek a cselekvések 
És mérések figylembevételéhez kellenek, alapvetően megegyeznek a helymeghatározás 
problémájánál használtakkal. A fő különbség az, hogy az új állapottér már sokkal több di- 
menziós, mert tartalmazza az összes robothelyzeten kívül az összes térképet is. Képzel- 
jük csak el, ha egy egész épületet akarunk leképezni fotorealisztikusan! Ez esetleg több 
száz millió numerikus adatot igényelne. Minden egyes numerikus adat egy véletlen vál- 
tozó lesz, és hozzájárul, hogy az állapottér elképesztően nagy dimenziós legyen. Ami még 
tovább bonyolítja a problémát, hogy a robot esetleg előre nem is tudja, hogy milyen nagy 
a környezete, ezért M dimenzióját a térképezés során dinamikusan kellene növelni. 

Talán a legszélesebb körben használt módszer az SZLT-probléma megoldására 
a KKSZ. A szűrőhöz általában társítanak még egy referenciapont-érzékelő modellt is, 
valamint kitétel, hogy az összes referenciapont megkülönböztethető legyen. A koráb- 
biakban a posterior becslését egy 41, várható értékű, , kovarianciájú Gauss-eloszlással 
jellemeztük. Az SZLT/probléma KKSZ-megközelítésénél a posterior megint csak Gauss- 
eloszlású lesz, de most a középérték egy sokkal nagyobb vektor. Nemcsak a robot hely- 
Zetét rögzíti, hanem tartalmazza a térkép összes jellemzőjét (vagy referenciapontját) is. 
Amennyiben a ilyen jellemzőnk van, akkor a vektor 2n -- 3 dimenziós lesz (két para- 
méterrel írható le a referenciapontok helyzete és hárommal a robot póza). Következés- 
képpen a E, mátrix (2n -- 3)-szor (2n -t 3)-as lesz, az alábbi struktúrával: 

soBa Hú Ex 

1 loT 
Bxm EMM 

Ahol is a Exy a robot helyzetének a kovarianciája, amit már korábban figyelembe vet- 
tünk a helymeghatározásnál. Eywegy 3-szor 2n-es mátrix, amely a referenciapontok és 
a robotkoordináták közötti korrelációt fejezi ki. Végezetül a E egy 2n-szer 2n-es 
mátrix, ami a térképjellemzők kovarianciáját írja le, beleértve az összes páronkénti kor- 
relációt. Így a KKSZ memóriaigénye kvadratikusan nő n-nel, a térképen lévő jellemzők 
számával, és a frissítési idő szintén kvadratikus s-ben. 

Mielőtt elmerülnénk a matematikai részletekben, tanulmányozzuk grafikusan a KKSZ-t. 
A 25.11. ábra egy robotot mutat, amelynek környezetében nyolc referenciapont helyez- 
kedik el két sorban, mindegyikben négy referenciaponttal. Kezdetben a robotnak nincs 
információja arról, hogy hol helyezkednek el a referenciapontok. Tételezzük fel, hogy 
az összes pont más színű, és a robot ezeket egyértelműen meg tudja különböztetni egy- 
mástól! A robot egy ismert pozícióból balra indul el, de fokozatosan elveszti pontos 
helyének ismeretét. Ezt jelölik a hibaellipszisek a 25.11. (a) ábrán. Az ellipszisek szé- 
lessége növekszik, ahogy a robot halad előre. Ahogy a robot mozog, a közeli referen- 
ciapontok távolságának és szögének érzékelése révén a robot meg tudja becsülni azok 
helyzetét. Természetesen ezeknek a becsléseknek a bizonytalansága nagyban függ a ro- 
bot saját helyzetére vonatkozó becslésének bizonytalanságától. A 25.11. (b) és (c) 
ábrák illusztrálják a robot hiedelmét, ahogy fokozatosan halad előre környezetében. 


(25.2) 
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(c) (d) 

25.11. ábra. A KKSZ alkalmazása a robottérképezés problémájára. A robot pályája a szaggatott vonal, és 
a besatírozott ellipszisek jelentik helyzetére vonatkozó saját becsléseit. Nyolc pont jelenti az ismeretlen 
helyzetű referenciapontokat, míg a helyzetükre vonatkozó becsléseiket a fehér ellipszisek mutatják. Az (a), 
(b) és (c) ábrákon a robot helyzetére vonatkozó becslés bizonytalansága folyamatosan növekszik, ahogy 
azoké a referenciapontoké is, amelyek mellett elmegy. A (d) ábrán a robot újra elérkezik az első referencia- 
ponthoz, így az összes többi pont helyzetének bizonytalansága ís csökken, köszönhetően annak, hogy a 
becslések korreláltak. 


Ezen becslések fontos jellemzője — ami egyáltalán nem magától értetődő az ábrákon —, 
hogy a becsléseket egyetlen Gauss-eloszlás jellemzi. A 25. 11. ábrán látható hibaellipszisek 
csupán ennek az eloszlásnak a vetületei a robot- és referenciakoordináták alterébe. Ez 
a többváltozós Gauss a posteriori eloszlás tartja fenn a korrelációt az összes becslés kö- 
zött. Fontos ez az észrevétel annak megértéséhez, hogy mi történik a 25.11. (d) ábrán. 
Itt a robot észrevesz egy korábban már feltérképezett referenciapontot. Ennek követ- 
keztében saját pozíciójának bizonytalansága drasztikusan csökken, mint ahogy az ösz- 
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szes többi referenciapont bizonytalansága is. Ez annak a következménye, hogy a robot 
és a pontok helyzetének becslése erősen korreláltak a Gauss a posteriori eloszlásban. 
Bármilyen új információ egy változóról (ebben az esetben a robot helyzetéről) automa- 
tikusan csökkenti az összes többi változó bizonytalanságát. 

A térképezéshez használatos KKSZ algoritmus hasonlít a korábban a lokalizá- 
cióhoz használt KKSZ-re. A legfontosabb különbséget a referenciapont-változók 
hozzáadása jelenti a posteriorban. A referenciapontok mozgásmodellje triviális: nem 
mozognak. Így az f függvény azokra a változókra az identításfüggvény. A mérési 
függvény alapvetően megegyezik a korábban használttal. Az egyetlen különbség a 
KKSZ frissítési egyenletben az, hogy a H, Jacobi-mátrixnak nemcsak a robot pozíci- 
óját kell figyelembe vennie, hanem a referenciapontok t-ben megfigyelt helyzetét is. 
Az így kapott KKSZ-egyenletek még ijesztőbbek, mint a korábbiak, ezért itt nem is 
tárgyaljuk őket. 

Ugyanakkor van még egy nehézség, amit szép csöndben figyelmen kívül hagytunk 
eddig: az M térkép méretét nem tudjuk előre. Ebből kifolyólag a végső becsléshez tarto- 
zó ués E, elemeinek száma szintén ismeretlen. Ezeket dinamikusan kell meghatároz- 
ni, ahogy a robot újabb referenciapontokat talál. A probléma megoldása elég egyszerű; 
amikor a robot felfedez egy új referenciapontot, egyszerűen hozzáad egy új elemet 
a posteriorhoz. Ha ennek az új elemnek a varianciáját nagyon nagy kezdeti értékűre vá- 
lasztjuk, akkor az eredményül kapott posterior ugyanaz, mintha a robot már korábban 
is tudott volna annak a referenciapontnak a létezéséről. 


További érzékelési típusok 


Nem minden robotérzékelés helymeghatározás és térképezés. A robotok érzékelhetnek 
hőmérsékletet, szagokat, hangokat stb. Ezek közül sok valószínűségi alapon becsülhe- 
tő, mint ahogyan a lokalizációnál és a térképezésnél láttuk. Mindössze olyan feltételes 
valószínűség-eloszlásokat kell találni, amelyek leírják az állapotváltozók időbeli visel- 
kedését, illetve olyan eloszlásokat, amelyek jellemzik a mérések és az állapotváltozók 
kapcsolatát. 

Azonban nem minden működő robotérzékelési rendszer alapul valószínűségi model- 
lezésen. Valójában nem szükséges, hogy minden belső állapotnak legyen valós fizikai 
interpretációja, ahogy az a mi példáink esetén volt. Például képzeljünk magunk elé egy 
járó robotot, amely éppen az egyik lábát próbálja egy akadály felett átemelni. Feltéte- 
lezzük, hogy a robot olyan szabályt alkalmaz, amely szerint kiindulásként csak kicsit 
emeli fel a lábát, de egyre nagyobb és nagyobb magasságokkal próbálkozik, ha a lába 
folyton beleütközik valamilyen akadályba. Mondhatjuk-e, hogy az emelt láb magassá- 
ga valamilyen valós fizikai paraméter reprezentációja? Esetleg igen, és akkor az az aka- 
dály magasságára, illetve átléphetőségére vonatkozik. Ugyanakkor mondhatjuk azt is, 
hogy a lábmagasság a robot vezérlésének egy segédváltozója, mindenfajta fizikai jelen- 
tés nélkül. Az ilyen reprezentációk nem ritkák a robotikában, és bizonyos feladatok 
megoldására kiválóan alkalmasak. 

A robotika jelenlegi trendjei egyértelműen egy jól definiált szemantikával rendelke- 
ző leírás felé mutatnak. A valószínűség-alapú modellek egyre inkább kiszorítják a töb- 
bi megoldást olyan komplex problémák esetén, mint amilyen a helymeghatározás és 
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a térképezés. Bizonyos esetekben azonban a statisztikai technikák túlságosan körülmé- 
nyesek, és néha a gyakorlatban az egyszerűbb megoldások is éppen olyan hatékonyak. 
A legmegfelelőbb alkalmazandó módszer kiválasztását leginkább a valódi robotokkal! 
történő munka során szerzett tapasztalatok segítik. 


25.4. MOZGÁSTERVEZÉS 


A robotikában a döntések végül is a beavatkozó szervek mozgásában jutnak kifejezés- 
re. A ponttól pontig mozgás (point-to-point motion) esetén a cél a robotnak vagy 
végbeavatkozó szervnek egy megadott helyre való eljuttatása. Nagyobb kihívást jelent 
a követő mozgás (compliant motion), amikor is a robot úgy mozog, hogy közben végig 
fizikai kontaktusban marad egy akadállyal. Példa erre, amikor egy robotkar becsavar egy 
égőt, vagy amikor végigtol az asztalon egy dobozt. 

Azzal kell kezdenünk, hogy keresünk egy megfelelő reprezentációt, amely alkalmas a 
mozgástervezési problémák leírására és megoldására. Kiderül, hogy a konfigurációs tér 
(configuration space) — a robotállapotok tere, amelyet a pozíció, az orientáció és a csukló- 
szögek definiálnak - alkalmasabb a feladatra, mint a 3D tér. A pályatervezés (path plan- 
ning) azt jelenti, hogy meg kell találni az egyik konfigurációtól egy másikig vezető utat. 
A korábbi fejezetekben már számos úttervezési módszert vázoltunk fel. A robotikában 
az úttervezés legfőbb jellemvonása az, hogy folytonos terekkel dolgozik. A szakiro- 
dalom számos különböző technikát tart számon, amelyek kifejezetten olyan esetekre 
alkalmazhatók, ahol a cél útvonalak keresése sokdimenziós folytonos terekben. Két fő 
megközelítés létezik: a celladekompozíció (cell decompisition) és a szkeletonizáció 
(skeletonisation). Mindkettő diszkrét gráf keresési feladatra vezeti vissza és egyszerű- 
síti le a folytonos útkeresési problémát azáltal, hogy kanonikus állapotokat és pályákat 
ír le a folytonos térben. Ebben a fejezetben végig feltételezzük, hogy a mozgás deter- 
minisztikus, és a robot helybéli azonosítása egzakt. A későbbi fejezetek gyengíteni fog- 
ják ezeket a feltételezéseket. 


Konfigurációs tér 


A robotmozgási feladatok megoldásának első lépéseként a problémához ki kell találni 
egy megfelelő reprezentációt. Kezdjük egy egyszerű probléma egyszerű ábrázolásával. 
Vegyük a 25.12. (a) ábrán látható robotkart. Két csuklóval rendelkezik, amelyek egy- 
mástól függetlenül mozoghatnak. Ha a csuklókat mozgatjuk, megváltozik a könyök és 
a megfogó (x, y) koordinátája. (A kar z irányban nem képes elmozdulni.) Mindez azt 
sugallja, hogy a robot konfigurációi leírhatók egy négydimenziós koordináta-rendszer- 
ben, ahol: (Xxönyökr Ikönyök) jelenti a könyök relatív helyzetét a környezethez képest, 
míg (Xxmegfogór Ymegfogó) a megfogó helyzetét. Világos, hogy ez a négy koordináta leírja 
a robot összes lehetséges állapotát. Ezt a leírást munkatér-reprezentációnak (work- 
space representaion) is nevezik, mivel a robot helyzetét ugyanabban a koordináta- 
rendszerben írjuk le, mint a mozgatni (vagy éppen elkerülni) kívánt tárgyakét. A mun- 
katér-reprezentáció jól használható ütközés elkerülésre, különösen akkor, ha a tárgyakat 
egyszerű poligonokként modellezzük. 
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A munkatér-reprezentációval az a probléma, hogy a robot számára nem minden mun- 
katér-koordináta érhető el, még akkor sem, ha nincsenek akadályok. Ez a munkatér el- 
érhető koordinátáira vonatkozó összekapcsolási kényszerek (linkage constrains) miatt 
van. Például a könyök Cgönyök Xkönyöl) ÉS a megfogó (xmegfogós Ymegfogó) Pozíciója egy- 
mástól mindig adott távolságra van, mert egy merev alkar kapcsolja őket össze. Ha a 
robotmozgás-tervezés munkatér-koordinátákban történik, akkor a generált útvonalak- 
nak mindig meg kell felelniük ezeknek a kényszereknek. Ez azért különösen nehéz, 
mert az állapottér folytonos, a kényszerek pedig nemlineárisak. 

Könnyebb a dolgunk, ha konfigurációs térben (configuration space) tervezünk. 
Ahelyett hogy Descartes-koordinátákkal írnánk le a robot helyzetét a térben, a csuklók 
konfigurációját vesszük figyelembe. A példában szereplő robotnak két csuklója van, 
így állapotát a két csukló állásával jellemezhetjük: $, au jelenti a vállcsukló szögét, míg 
Ékönyök a könyökcsuklőét. Ha semmilyen akadály sincs a munkatérben, akkor a robot 
csuklói bármilyen értéket szabadon felvehetnek a konfigurációs térben. Sőt pályater- 
vezés során a kiindulási és a célkonfiguráció egyszerűen összeköthető egy egyenessel. 
A robot ezt az egyenest követve konstans sebességgel mozgatja csuklóit, amíg el nem 
éri a kijelölt helyet. 

Sajnálatos módon azonban a konfigurációs térnek is megvannak a maga problémái. 
A robot feladatai általában a munkatér koordinátáiban adottak, és nem a konfigurációs té- 
rében. Konkrétan például azt akarjuk, hogy a robot végberendezését a munkatérben egy 
adott pontra mozgassa, sőt esetleg még az orientáció is adott. Ez felveti azt a kérdést, hogy 
hogyan képezzük le a munkatér-koordinátákat a konfigurációs térbe. Általában ennek a 
problémának az inverze egyszerfibb, azaz könnyebben képezhetők le a konfigurációs tér 
koordinátái a munkatérbe, hiszen a probléma néhány egyértelmű koordináta-transzformá- 
cióval megoldható. Ezek a transzformációk lineárisak transzlációs, és trigonometrikusak 
rotációs csuklók esetén. A transzformációk sorozatát kinematikának (kinematics) hív- 
ják. Ezzel a kifejezéssel már találkoztunk korábban, a mobil robotoknál. 

Inverz kinematikának (inverse kinematics) hívják egy olyan robot konfigurációjának 
kiszámítását, ahol a robot beavatkozó szerveinek helyzete a munkatér koordinátáiban 
adott. Az inverz kinematikai számítások általában nehezek, különösen sok szabadságfo- 
kú robotok esetében. Sőt a megoldás ritkán egyértelmű. Példarobotunk esetében két kü- 
lönböző konfiguráció is létezik, amikor a megfogó ugyanazt a helyzetet veszi fel a 
munkatérben, mint ami a 25.12. ábrán látható. 

Általában két szabadságfokú (2DOF) robotkar esetén az inverz kinematikai feladat 
megoldásainak száma nulla és kettő között van, bármilyen bemeneti munkatér-koordi- 
nátára. A legtöbb ipari robot esetén végtelen sok megoldás van. Ennek megértéséhez 
képzeljük el, hogy a példarobotunkhoz hozzáadunk még egy rotációs csuklót, aminek 
tengelye párhuzamos a meglévő csuklók egyikével. Így a legtöbb konfiguráció esetén 
szabadon tudjuk mozgatni a közbülső csuklókat, miközben a megfogó pozíciója nem 
változik (az orientációja azonban igen). Néhány további csuklóval (mennyivel?) meg- 
oldható, hogy a kart ugyanígy mozgatva az orientáció se változzon. Már láttunk erre 
példát, amikor letettük kezünket az asztalra, és mégis tudtuk mozgatni a könyökünket. 
A kéz pozíciójából adódó kinematikai korlátozások alapján még nem határozható meg 
egyértelműen az emberi könyök konfigurációja. Más szavakkal, a váll-kar együttes in- 
verz kinematikai problémájára végtelen sok megoldás létezik. 
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25.12. ábra. (a) Egy két szabadságfokú robotkar munkatere. A munkatér egy doboz. amiben egy lapos 
akadály lóg a mennyezetről. (b) Ugyanennek a robotnak a konfigurációs tere. A fehérrel jelzett terület je- 
lenti azokat a konfigurációkat, ahol a robot nem ütközik össze seramivel. A pont az ábrán a robot bal ol- 
dali konfigurációját mutatja. 


























2 Ován 


A másik probléma a konfigurációs térrel kapcsolatosan akkor merül fel, amikor aka- 
dályok is vannak a munkatérben. A 25.12. (a) ábrán látható esetben például számos 
ilyen akadály van; az egyik pont a robot munkaterének közepébe nyúlik bele. A mun- 
katérben ezek az akadályok egyszerű geometriai formákként jelennek meg, különösen 
a robotikai tankönyvekben, ahol a poligonális akadályokra fókuszálnak. De hogyan 
néznek ki ezek a konfigurációs térben? 

Példarobotunk konfigurációs terét mutatja a 25.12. (b) ábra a 25.12. (a) ábrán látható 
akadályok esetére. A konfigurációs teret két altérre bonthatjuk: azoknak a konfigurációk- 
nak a terére, amelyek elérhetők - ez a szabad tér (free space), illetve az elérhetetlen kon- 
figurációk által alkotott térrészre, amit foglalt térnek (occupied space) hívnak. A 25.12. (b) 
ábrán a fehér rész jelenti a szabad teret, míg az összes többi a foglalt tér. A különböző 
árnyalatok jelzik, hogy melyik akadályról is van szó: a szabad teret körbehatároló fekete 
részek jelentik azokat a konfigurációkat, amelyeknél a robot önmagával ütközik össze. 
Könnyű belátni, hogy a váll- és könyökcsuklók szétső állásai ezt eredményezik. A robot 
két oldalán lévő ovális részek az asztalnak felelnek meg, amin a robot áll. A harmadik ová- 
lis terület a bal oldali fal. Végezetül, a konfigurációs térben a legkülönösebb alakzat a robot 
mozgásterébe belelőgó, egyszerű függőleges elem. Ennek igen különös alakja van, erősen 
nemlineáris, és helyenként még konkáv is. Egy kis képzelőerővel felismerhetjük a meg- 
fogó alakját a bal felső szélén. Szakítsunk egy kis időt ennek a fontos ábrának a tanulmá- 
nyozására. Az alakzat egyáltalán nem nyilvánvaló! A 25.12. (b) ábrán a pont a robot 
25.12. (a) ábrán lévő állapotának megfelelő konfigurációt mutatja. A 25.13. ábrán to- 
vábbi három konfigurációt is láthatunk, mind a munkatérben, mind a konfigurációs 
térben. A , conf-1" állásban a megfogó megközelíti a középső akadályt. 

A legtöbb esetben a szabad tér alakja nagyon bonyolult a konfigurációs térben, még ak- 
kor is, ha a munkateret egyszerű poligonokkal reprezentáljuk. Éppen ezért a gyakorlatban 
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25.13. ábra. Három különböző robotkonfiguráció a munkatérben és a konfigurációs térben 


inkább feltérképezik a konfigurációs teret, semmint pontosan kiszámítják. A térképezés 
során generálnak egy konfigurációt, és megnézik, hogy az a szabad térben van-e. Ehhez 
alkalmazzák a robot kinematikáját, és annak alapján már látszik, ha az adott konfiguráció 
ütközéssel jár a munkatérben. 


Celladekompozíciós módszerek 


Első megközelítésben celladekompozíciót (cell decompisition) használunk pályater- 
vezéshez, ami azt jelenti, hogy a szabad teret véges számú folytonos régióra, cellákra 
osztjuk fel. Fontos tulajdonsága ezeknek a régióknak, hogy a pályatervezés egyszerű 
módszerekkel megoldható egy-egy cellán belül (pl. egyenes vonalú mozgással). Ezután 
a pályakeresés diszkrét gráfkeresési problémává egyszerűsödik, nagyon hasonlóvá ah- 
hoz, amit a 3. fejezetben már bemutattunk. 

A legegyszerűbb celladekompozíció egy szabályos osztástávolságú rácsból áll. Ilyen 
négyzethálós dekompozíciót mutat be a 25.14. (a) ábra, az ehhez a sűrűségű felosztás- 
hoz tartozó optimális útvonallal. Különböző árnyalatokat használtunk a szabad tér 
egyes celláihoz tartozó értékek jelölésére. Ez az érték mutathatja például, hogy milyen 
messze van az adott cella a céltól. (Kiszámításához használhatjuk a 17.4. ábrán ismer- 
tetett ÉRTÉKITERÁCIÓ algoritmus egy determinisztikus változatát.) A 25.14. (b) ábrán 
látható a kar mozgása a munkatérben. 

Az ilyen felbontásnak a nagyon könnyű megvalósíthatóság az előnye. Ugyanakkor, 
használatakor két korlátozás is él. Először is, csak kis dimenziójú munkaterek esetén 
működik, mert a cellák száma d-vel, a dimenziók számával exponenciálisan nő. Másod- 
szor, felmerül a kérdés, hogy mit csináljuk azokkal a cellákkal, amelyek vegyesek, vagyis 
részben a szabad térhez, részben a foglalthoz tartoznak. Egy ilyen cellán keresztül menő 
megoldás nem feltétlenül működik, mert lehet, hogy az adott irányban nem lehet át- 
haladni a cellán. Ez az úttervezőt bizonytalanná tenné. Ugyanakkor, ha egyáltalán nem 
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(a) 


25.14. ábra. (a) A költségfüggvény és az előállított trajektória a konfigurációs térben, diszkrét hálós 
celladekompozíciós közelítés esetén. (b) Ugyanaz az útvonal a munkatérben ábrázolva. Érdemes meg- 
figyelni, hogy a robot behajlítja a könyökét, hogy elkerülje a függőleges akadályt. 





engedjük meg, hogy a pálya ilyen , vegyes" cellákon menjen keresztül, tervező algorit- 
musunk hiányos lesz. Előfordulhat, hogy az egyetlen lehetséges út a célhoz egy ilyen 
cellán megy át — különösen akkor, ha a cella mérete összehasonlítható a térközök és át- 
járók fizikai méretével. 

A fenti problémák elkerülése érdekében a celladekompozíciós módszeren kétfélekép- 
pen lehet javítani. Az első, ha megengedjük a vegyes cellák tovább osztását — mondjuk 
az eredeti méret felére. Ezt rekurzívan folytathatjuk, amíg nem találunk olyan utat, ami 
csak szabad térben lévő cellákon megy át. (Természetesen a módszer csak akkor műkö- 
dik, ha egy adott celláról egyértelműen el tudjuk dönteni, hogy vegyes-e. Ez viszonylag 
könnyű, ha a konfigurációs tér határai matematikailag egyszerűen leírhatók.) Akkor tel- 
jes a módszerünk, ha létezik korlát a legkeskenyebb átjáróra, amin az útvonal bejárható. 
Annak ellenére, hogy a konfigurációs téren belül alapvetően a bonyolultabb, trükkösebb 
részekre fókuszálódik a számítási igény, még mindig nem leszünk képesek sokdimen- 
ziós problémák kezelésére, mivel a cellák minden rekurzív újraosztása 27 kisebb cellát 
hoz létre. A másik megoldás során azzal tesszük teljessé az algoritmusunkat, hogy ra- 
gaszkodunk a szabad tér egy egzakt celladekompozíciójához (exact cell decom- 
position). Ez a módszer megengedi, hogy a cellák szabálytalan alakúak legyenek, de 
kizárólag a szabad tér határán. Az alakzatoknak viszonylag egyszerűeknek kell marad- 
niuk, hogy könnyen meg lehessen határozni egy szabad cella átlóját. Ez a technika 
bizonyos magasabb szintű geometriai ismereteket igényel, ezért részletesebben nem 
tárgyaljuk. 

Ha megvizsgáljuk azt a pályát, amit a 25.14. ábrán kaptunk, láthatjuk, hogy még to- 
vábbi nehézségeket kell leküzdenünk. Először is, vegyük észre, hogy a pálya mentén 
nagyon éles kanyarok vannak. A robot bármilyen véges sebesességgel mozog, nem tud- 
ja ezeket , bevenni". Másodszor, az út helyenként nagyon közel halad el az akadályok 
mellett. Mindenki, aki már vezetett autót, tudja, hogy egy olyan parkolóhely, ahol csak 
egy-egy milliméter szabad hely van mindkét oldalon, valójában nem is parkolóhely. 
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(a) (b) 


25.15. ábra. (a) A taszító potenciáltér távol tartja a robotot az akadályoktól. (b) A megoldásként kapott 
Pálya, ha egyszerre minimalizáljuk az úthosszt és a potenciálfüggvényt. 


Éppen ezért olyan megoldásokra törekszünk, amelyek robusztusak a kis mozgási 
hibákra nézve. 

Szeretnénk maximalizálni az útvonal távolságát az akadályoktól, ugyanakkor mini- 
malizálni annak hosszát. Mindezt a potenciáltér (potential field) módszer bevezetésé- 
vel érhetjük el. A potenciáltér az állapottérben definiált függvény, amely nagy értéket 
vesz fel bármely akadály közelében, és attól távolodva egyre csökken. Ilyen potenciál- 
tér látható a 25.15. (a) ábrán: minél sötétebbre van színezve a konfigurációs tér, annál 
közelebb van egy akadályhoz. Pályatervezéshez használva a potenciáltér még egy költ- 
ségfüggvényt jelent az optimalizálás során. Ez érdekes kompromisszumot rejt magá- 
ban. Egyfelől a robot igyekszik lerövidíteni az út hosszát a célig, másfelől próbál minél 
távolabb maradni az akadályoktól, azáltal hogy minimalizálja a potenciálfüggvényt. 
A két szempontot megfelelően súlyozva az eredmény a 25.15. (b) ábrán látható pályá- 
hoz hasonló lesz. Az ábra az egyesített költségfüggvényből értékiterációval számított 
értékfüggvényt is mutatja. Világos, hogy az így kapott megoldási útvonal hosszabb, 
viszont biztonságosabb. 


Szkeletonizációs módszerek 


Az útkereső algoritmusok másik fő csoportja a szkeletonizálás (skeletonization) elvén 
alapul. Ezek a módszerek a robot szabad terének egydimenziós leképezésével dolgoz- 
nak, amely alapján a tervezési probléma már könnyebben megoldható. Ezt az alacso- 
nyabb dimenziójú reprezentációt hívják a konfigurációs tér vázának (skeleton). 

A 25.16. ábrán a szkeletonizációra látható egy példa: a szabad tér Voronoi-gráfja 
(Voronoi graph) azokból a pontokból áll, amelyek kettő vagy több akadálytól egyenlő 
távolságra vannak. Ahhoz, hogy a pályatervezéshez a Voronoi-gráfot lehessen használni, 
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(a) b 


25.16. ábra. (a) A Voronoi-diagram azon pontok halmaza a konfigurációs térben, amelyek egyenlő tá- 
volságra vannak két vagy több akadálytól. (b) A szabad tér 400 véletlenszerűen kiválasztott pontjából 
felépített valószínűségi úthálózat. 


a robotnak először is meg kell változtatnia aktuális konfigurációját úgy, hogy rajta legyen 
a gráfon. Könnyen belátható, hogy a konfigurációs térben ez mindig megoldható egyenes 
vonalú mozgással. Ezután a robot a gráf mentén halad mindaddig, amíg el nem éri a cél- 
konfigurációhoz legközelebb eső pontot. Ekkor elhagyja a Voronoi-gráfot, és elmegy a 
célig. A konfigurációs térben ez egyenes vonalú mozgással ismét megvalósítható. 

Ilyen módon az eredeti útkeresési feladatot a Voronoi-gráfon lévő útvonal megtalálá- 
sára redukáltuk. A Voronoi-gráf (néhány különleges esetet leszámítva) egydimenziós, és 
véges sok olyan pontja van, ahol három vagy több görbe metszi egymást. Így azon a leg- 
rövidebb út megtalálása egy diszkrét gráfkeresési probléma, amilyet a 3. és 4. fejezetek- 
ben már tárgyaltunk. Ha a Voronoi-gráf mentén haladunk, akkor nem a legrövidebb utat 
kapjuk, de az egyik legbiztonságosabbat. A hátránya ennek a módszernek, hogy nehéz 
többdimenziós konfigurációs terekre alkalmazni, és sokszor túl nagy kitérőket tesz, fő- 
leg ha a szabad tér nagyon tág. Ezenfelül a Voronoi-diagram számítása bonyolult lehet 
a konfigurációs térben, különösen ahol az akadályok alakja nagyon összetett. 
babilistic roadmap) módszere. Ez a szkeletonizációs technika több lehetséges útvonallal 
dolgozik, így jobb megoldást jelent nagy, nyitott terek esetén. A valószínűségi úthálózatra 
látható példa a 25.16. (b) ábrán. A gráfot véletlenszerűen generált, a szabad térbe eső, 
nagyszámú konfiguráció alkotja. Ezek után két csomópontot összekötünk egy éllel, 
amennyiben , könnyű" eljutni egyikből a másikba. Alapvetően egyenes élekkel dolgozunk, 
és azok természetesen csakis a szabad térben futhatnak. Eredményül egy véletlenszerű 
gráfot kapunk a robot szabad terében. Ha ehhez még hozzávesszük a kezdeti és a célkon- 
figurációt, az útkeresés diszkrét gráfkeresési problémává válik. Elméletileg a módszer nem 
teljes, mivel rosszul felvett ponthalmazzal lehet, hogy soha nem találunk megoldást. A fel- 
vett pontok száma és a konfigurációs tér alakja alapján korlátozhatjuk a kudarc valószí- 
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nűségét. Azt is megtehetjük, hogy főként azon a területen generálunk pontokat, ahol egy 
előzetes, mindkét végpontból lefuttatott részleges keresés alapján sejtjük, hogy a helyes út 
visz majd. Ezekkel a kiegészítésekkel a valószínűségi úthálózat módszere jobban használ- 
ható más technikáknál magasabb dimenziójú konfigurációs terek esetében is. 


25.5. BIZONYTALAN MOZGÁSOK TERVEZÉSE 


Az eddig tárgyalt pályatervezési algoritmusok közül egyik sem foglalkozott a robotika 
egyik központi problémájával: a bizonytalansággal. A robotikában a bizonytalanság a 
környezet részleges megfigyelhetőségéből és a robot mozgásának sztochasztikus (vagy 
nem modellezett) összetevőiből ered. Hibát okozhat az is, ha valamilyen közelítéses 
módszert, például részecskeszűrést használunk. Ilyen esetekben a robotnak nincs pon- 
tos információja a helyzetéről, még akkor sem, ha a környezet sztochasztikus vonásait 
tökéletesen modelleztük. 

A legtöbb mai robot a döntéshozatalhoz determinisztikus algoritmusokat használ, mint 
például az eddig tárgyalt útkereső algoritmusokat. Gyakori megoldás, hogy a helymegha- 
tározó algoritmus által előállított állapoteloszlásból a legvalószínűbb állapotot (most 
likely state) választják ki. Ennek a módszernek az előnye a számítások során mutatkozik 
meg. A pályatervezés már a konfigurációs térben is kihívás, és még nehezebb lenne, ha 
az állapotok teljes valószínűség-eloszlásával kellene dolgoznunk. Csak akkor tehetjük 
meg, hogy nem veszünk tudomást a bizonytalansági tényezőről, ha az kellően kicsi. 

Sajnálatos módon azonban nem hagyhatjuk mindig figyelmen kívül a bizonytalansá- 
got. Egyes problémák esetén egyszerűen túlságosan nagy! Hogyan is használhatnánk 
determinisztikus pályatervezést egy mobil robot irányításához, ha fogalma sincs a ro- 
botnak arról, hogy hol van? Általában, ha a robot valódi állapota nem egyezik meg a 
maximális valószínűségi szabály által számítottal, akkor az irányító algoritmus nem 
lesz optimális. Az eltérés nagyságától függően ez egy sor nem kívánatos eseményt idéz- 
het elő, például ütközést más tárgyakkal. 

A robotikában számos technikát dolgoztak ki a bizonytalanság kezelésére. Néhányuk 
a 17. fejezetben tárgyalt bizonytalansági döntéshozó algorítmusokból ered, Ha a robot- 
nak csak az állapotátmenetek kapcsán kell bizonytalansággal számolnia, máskülönben 
állapota teljesen megfigyelhető, akkor a problémát legjobban a Markov döntési folya- 
mattal (MDF) lehet modellezni. Az MDF által adott megoldás optimális eljárásmód 
(policy), amely minden lehetséges állapotban megmondja a robotnak, hogy mit csináljon. 
Ezzel a módszerrel képes bármiféle mozgási hiba kezelésére, ahol a determinisztikus út- 
tervező egyetlen megoldása sokkal kevésbé lenne robusztus. Robotikában a stratégiákat 
általában navigációs függvényeknek (navigation functions) hívják. A 25.14. (a) ábrán 
bemutatott értékfüggvény könnyen átalakítható ilyen navigációs függvénnyé, ha egysze- 
rűen követjük a gradienst. 

Csakúgy, mint a 17. fejezetben, a részleges megfigyelhetőség itt is tovább nehezíti a 
problémát. Az így keletkező robotirányítási problémát a részlegesen megfigyelhető 
MDF-fel (RMMDF) modellezzük. Ilyen esetekben a robotnak általában van egy belső 
képe az állapotáról, ahogy azt már a 25.3. alfejezetben megtárgyaltuk. Az RMMDF-re a 
megoldás a robot belső állapotán definiált stratégia. Másképp megfogalmazva, a stratégia 
bemenete egy teljes valószínűség-eloszlás. Ez a robot számára lehetővé teszi, hogy ne csak 
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az alapján tudjon döntést hozni, amit tud, hanem azt is felhasználhassa, amit nem tud. Pél- 
dául ha nem ismeri egy kritikus állapotváltozó értékét, akkor ésszerűen információgyűj- 
tést (information gathering) fog végrehajtani. Az MDF keretein belül erre van lehetőség, 
mivel az MDF teljes megfigyelhetőséget feltételez. Sajnálatos módon azok a technikák, 
amelyek az RMMDF-eket pontosan megoldják, nem alkalmazhatók a robotikában, mint- 
hogy nem ismeretes folytonos idejű változatuk. A diszkretizálás általában olyan hatalmas 
méterű RMMDF-eket eredményez, amelyek messze meghaladják a mai eszközök feldol- 
gozási kapacitását. Jelen esetben a legtöbb, amit tehetünk, hogy megpróbáljuk a helyzet bi- 
zonytalanságát minimumra csökkenteni. A tárgy menti navigálás (coastal navigation) 
heurisztikus módszerével például jól csökkenthető a pozíció ismeretének bizonytalansága, 
ha a robot végig ismert referenciapontok közelében halad. Ugyanakkor fokozatosan csök- 
kenti más, közeli referenciapontok helyzetének bizonytalanságát is, ami aztán lehetővé 
teszi a robot számára, hogy újabb területeket térképezzen fel. 


Robusztus módszerek 


Valószínűségi módszerek helyett kezelhetjük a bizonytalanságot úgynevezett robusztus 
(robust) módszerekkel is. A robusztus módszer csak korlátozott mértékű bizonytalansá- 
got enged meg a probléma minden egyes paraméterével szemben, ugyanakkor nem tár- 
sít valószínűségeket az egyes értékekhez a megengedett határon belül. A robusztus meg- 
oldás a bemeneti értékektől függetlenül megfelelően működik mindaddig, amíg azok 
nem lépnek át egy határt. A robusztus módszerek egy extrém formája a 12. fejezetben 
tárgyalt alkalmazkodó tervezés (conformant planning), ami úgy alakít ki terveket, 
hogy egyáltalán nincs információja az állapotról. 

Itt egy olyan robusztus technikát ismertetünk, amelyet összeszerelési feladatoknál 
finom mozgások tervezésére (FMT; fine motion planning) használnak. FMT-re példá- 
ul akkor van szükség, amikor egy robotkart egy nagy, merev tárgyhoz nagyon közel kell 
mozgatni. A fő probléma az FMT-vel az, hogy a környezet kisméretű, lényeges elemei- 
vel kell dolgozni, nagyon apró mozdulatokkal. Ilyen kis lépték esetén a robot már kép- 
telen pontosan mérni vagy irányítani pozícióját, sőt adott esetben még a környezet alak- 
járól sincs pontos képe. Feltételezzük, hogy ezek a bizonytalanságok mind korlátosak. 
Az FMT-problémákra a megoldást legtöbbször feltételes tervek és irányelvek kidolgozása 
Jelenti, amelyek a végrehajtás közben visszacsatolásként használják a szenzorok adatait, és 
a megadott bizonytalansági korlátokon belül minden esetben megbízhatóan működnek. 

Az FMT-k felügyelt mozgások (guarded motion) sorából tevődnek össze. Minden 
egyes felügyelt mozdulat (1) egy mozgásparancsból és egy (2) leállási feltételből áll, 
ami a robot szenzorainak adatain alapul. A folyamat igaz értékkel tér vissza, ha sikere- 
sen befejeződött a felügyelt mozgás. A mozgásutasítások jellemzően engedékeny, azaz 
önbeálló mozgások (compliant motion), amelyek lehetővé teszik, hogy a robot kitér- 
jen, ha az utasítás végrehajtása ütközést eredményezne. A 25.17. ábrán látható példa 
egy kétdimenziós konfigurációs teret mutat, középen egy szűk, függőleges lyukkal. Ez 
egy olyan feladat konfigurációs tere lehetne, amikor egy szögletes csapot kel! beillesz- 
teni egy nála alig szélesebb lyukba. A mozgásutasítások konstans sebességeket írnak elő. 
A leállási feltétel a felülettel történő érintkezés. A vezérlés bizonytalanságának model- 
lezésénél feltételezzük, hogy a robot nem pontosan az utasításban megadott irányba 
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25.17. ábra. Egy kétdimenziós környezet, a sebesség vektor bizonytalanságát ábrázoló kúppal. A vezér- 
lés bizonytalansága miatt az eredeti szándéknak megfelelő v sebesség valójában bármilyen vektor lehet 
a C, kúpon belül. Ennek eredményeképpen a robot végső konfigurációja bárhol lehet a burkolón (a vilá- 
gosabban árnyalt területen), azaz nem tudjuk, hogy eljutottunk-e a lyukba, vagy sem. 


mozdul el, hanem a körül egy C, kúpon belül, tetszőlegesen. A 25.17. ábra azt mutatja, 
mi történne, ha adott sebességgel elindítanánk a műveletet az s kezdőpontból, A mozgás 
bizonytalansága miatt a robot a szürke területen belül bárhova megérkezhet a felülethez. 
Van rá esély, hogy beletalál a lyukba, de nagyobb valószínűséggel valamelyik oldalán 
áll meg. Mivel a robot nem fogja tudni, hogy a tyuk melyik oldalán van, ezért azt sem 
fogja tudni, hogy merre mozduljon. 

Egy kifinomultabb stratégia látható a 25.18. és a 25.19. ábrán. A 25.18. ábra eseté- 
ben a robot szándékosan a lyuknak az egyik oldala felé mozog. Az ábrán látható a moz- 
gásparancs és a leállás feltétele: valamely felülettel való érintkezés. A 25.19. ábrán 
olyan a mozgásparancs, hogy a robot a felület mentén mozdul el, míg bele nem talál a 
lyukba. Ez önbeálló mozgásvezérlés alkalmazását tételezi fel. Mivel a mozgás iránya 
(a bizonytalansággal együtt is) jobbra mutat, a robot mindig jobbra fog csúszni, vala- 
hányszor érintkezésbe kerül a vízszintes felülettel. Amikor eléri a lyukat, lecsúszik annak 
jobb oldali széle mentén, mivel a függőleges felülethez képest valamennyi lehetséges 
vektor lefelé mutat. Addig fog mozogni, amíg el nem éri a lyuk alját, mivel ez számára 
a leállási feltétel. A vezérlés bizonytalansága ellenére a robot valamennyi lehetséges 
Pályája a lyuk aljával történő érintkezésnél ér véget. Mindenképpen ez történik, hacsak 
a felület szabálytalanságai miatt a robot valahol meg nem akad. 

Láthatjuk, hogy a finom mozgások tervezése nemtriviális; valójában sokkal nehe- 
zebb, mint a pontos mozgások tervezése. Vagy minden egyes mozgáshoz rögzített szá- 
mú diszkrét értéket választunk, vagy a környezet geometriáját használjuk fel azon irá- 
nyok megállapításához, amelyek minőségileg különböző viselkedést eredményeznek. 
A finommozgás-tervező a konfigurációs tér leírását, a sebességbizonytalansági kúp szö- 
gét és azt a specifikációt tekinti inputnak, amely megadja a lehetséges leállásifeltétel- 
érzékeléseket (ebben az esetben a felülettel való érintkezést). Az eredménynek egy olyan 
többlépéses feltételes tervnek vagy stratégiának kell lennie, ami garantálja a sikert, ha 
egyáltalán létezik ilyen terv. 

Példánkban feltételezzük, hogy a tervezőnek pontos képe van a környezetről, de kor- 
látos hiba is bevezethető a modellbe a következők szerint: amennyiben a hibák paramé- 
terekkel leírhatók, úgy azok a paraméterek szabadságfokok formájában hozzáadhatók a 
konfigurációs térhez. 
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25.18. ábra. Az első mozgásparancs és a lehetséges robotmozgások burkolója. A hibától függetlenül 
tudjuk, hogy a végső konfiguráció a lyuk bal oldalán lesz. 


ÖS 


v 


25.19. ábra. A második mozgásparancs és a lehetséges mozgások. Még hibák esetén is végül bele fogunk 
találni a lyukba. 


Az utolsó példában, amennyiben a lyuk mélysége és szélessége bizonytalan, úgy eze- 
ket újabb két szabadságfok formájában hozzávehetjük a konfigurációs térhez. Az nem 
lehetséges, hogy a robotot ezekbe az irányokba elmozdítsuk a konfigurációs térben, és 
a robot pozícióját sem tudjuk közvetlenül érzékelni. Azonban mindkét korlátozást figye- 
lembe vehetjük, amikor ezt egy FMT-problémaként írjuk le, megfelelően specifikálva 
a vezérlés és az érzékelés bizonytalanságait. Ez egy összetett, négydimenziós tervezési 
problémához vezet, azonban azonos tervezési technikák alkalmazhatók. Megjegyezzük, 
hogy a 17. fejezetben ismertetett döntéselméleti módszerektől eltérően ez a fajta meg- 
közelítés a legrosszabb esetre vonatkozó terveket eredményezi ahelyett, hogy a terv vár- 
ható minőségét maximalizálná. A legrosszabb esetre vonatkozó tervek döntéselméleti 
értelemben csak akkor optimálisak, ha a végrehajtás közbeni kudarc sokkal költsége- 
sebb, mint bármely más, a végrehajtás során felmerülő költség. 


25.6. MOZGÁS 


Beszéltünk már arról, hogyan tervezzük meg a mozgást, de arról nem, hogy hogyan 
mozogjunk. Az eddigi terveink — különösen azok, amelyeket determinisztikus pályater- 
vezővel állítottunk elő — feltételezik, hogy a robot egyszerűen képes követni bármilyen 
megtervezett pályát. A valóságban természetesen nem ez a helyzet. A robotoknak van 
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(a) (b) (c) 
25.20. ábra. Robotkarvezérlés (a) egységnyi erősítésű arányos szabályozóval; (b) 0,1-es erősítési ténye- 
zőjű arányos szabályozóval; (c) PD szabályozóval, 0,3-as erősítésű arányos taggal és 0,8-as differenciáló 
komponenssel. Mindhárom esetben a robotkar a szürkével jelölt pályát próbálta követni. 


tehetetlenségük, ezért nem tudnak tetszőleges pályát követni, csak nagyon kis sebesség 
esetén. A legtöbbször erőt kell kifejtenie a robotnak, nem pedig meghatározott pozíció- 
ba eljutnia. Ez a fejezet azokról a módszerekről szól, amelyekkel ki lehet számítani 
ezeket az erőket. 


Dinamika és vezérlés 


A 25.2. alfejezetben már megismerkedtünk a dinamikus állapot (dynamic state) fogal- 
mával, amely a robot sebességmodelljével kiterjeszti a robot kinematikai állapotát. Pél- 
dául egy csukló szögének értéke mellett a dinamika magában foglalja a szög változási 
sebességet is. A dinamikai állapot reprezentálására szolgáló állapotátmenet-modell tartal- 
mazza az erők erre a változási sebességre gyakorolt hatását. Ezek a modellek általában 
differenciálegyenleteket (differentiai eguations) használnak, amelyek egy kinematikai 
mennyiséget (például egy kinematikai állapotot) viszonyítanak annak időbeli megvál- 
tozásához (például a sebességhez) is. Elvileg a mozgástervezéshez a kinematikai helyett 
dinamikai modellt is használhattunk volna. Ez a metodika magasabb szintű teljesítményt 
eredményezne a robotnál, ha egyáltalán meg tudnánk alkotni a terveket. Azonban a dina- 
mikai állapot sokkal bonyolultabb a kinematikainál. A dimenziók magas száma miatt ezt 
a módszert csak a legegyszerűbb robotok esetében lehetne sikeresen alkalmazni, Éppen 
ezért a gyakorlatban leginkább az egyszerűbb kinematikai pályatervező algoritmusokra 
hagyatkoznak. 

A kinematikai pályatervező algoritmusok hiányosságainak kompenzálására gyakran 
használnak különálló szabályozókat (controllers), hogy pontosan a pályán tartsák a robo- 
tot. Szabályozók segítségével a környezetből vett visszacsatolással valós időben generál- 
hatók a vezérlőjelek az irányítási célok eléréséhez. Referenciaszabályozóról (reference 
controller) beszélünk, ha az a feladat, hogy a robot egy előre kitűzött pályán maradjon — 
ezt hívják referenciapályának (reference path). Azokat a szabályozókat, amelyek globá- 
lis költségfüggvényeket optimalizálnak, optimális szabályozóknak (optimal controllers) 
hívjuk. Az optimális stratégiák az MDF-ek számára valójában optimális szabályozók. 
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Első ránézésre egyszerűnek tűnik az a feladat, hogy adott pályán tartsuk a robotot. 
A gyakorlatban azonban még ennek a látszólag könnyű feladatnak is vannak buktatói. 
A 25.20. (a) ábrán láthatjuk, hogy mik adódhatnak. A fekete vonal a robot által befu- 
tott út, ahogy próbálja a kinematikai pályát követni. Ha eltérés keletkezik - zaj vagy a 
robot mozgása során fellépő erőkre vonatkozó korlátozások miatt —, a robot ellenkező 
irányú, az eltéréssel arányos nagyságú erővel igyekszik azt kompenzálni. Elsőre ez 
a megoldás kézenfekvőnek tűnik, mivel az eltéréseket ellenerőkkel kompenzáljuk, így 
a robot a pályán marad. Ugyanakkor mindez azt eredményezi, hogy robotunk erőtelje- 
sen vibrálni kezd, ahogy az a 25.20. (a) ábrán is látszik. Ez a vibráció a robotkar ter- 
mészetes tehetetlenségéből következik: amikor a robot visszaér a referenciapálya adott 
pontjára, túllendül, ami a korábbihoz hasonló, de ellentétes előjelű hibát eredményez. 
Ahogy az ábrán is látható, ez a fajta túllendülés akár az egész trajektória mentén foly- 
tatódhat, és az eredményül kapott mozgás nem Éppen ideális. Világos, hogy jobb sza- 
bályozásra van szükség. 

Mielőtt rátérnénk a megfelelőbb szabályozásra, formálisan írjuk le a túllendülést oko- 
26 szabályozót. Azokat a szabályozókat, amelyek ellentétes irányú, arányos erővel rea- 
gálnak a megfigyelt hibára P szabályozónak (P controller) hívjuk. A P betű arányosat 
(proportional) jelent: a pillanatnyi vezérlés mindig arányos a robotkar hibájával. Még 
formálisabban kifejezve: legyen y(f) a referenciapálya idő (7) szerint paraméterezve. A P 
szabályozó által generált a, vezérlőjel: 

a, KpO(D — xp 
ahol X, a robotkar r időpontbeli állapota. Kp a szabályozó úgynevezett erősítési ténye- 
zője (gain parameter), ami azt határozza meg, hogy milyen hevesen reagál a szabá- 
lyozó az aktuális x, állapot és a kívánt y(t) között lévő eltérésre. A példánkban Kp — I. 
Első pillantásra azt gondolhatja valaki, hogy ha Kp-t kis értékűre választjuk, akkor az 
megoldja a problémát. Sajnos nem így van. A 25.20. (b) ábrán látható Kp — 0,1 esetben 
a trajektória, amely továbbra is oszcillál. A kisebb erősítési tényező csak lelassította az 
oszcillációt, de egyáltalán nem oldotta meg a problémát. Ha elhanyagoljuk a súrlódást, 
a P szabályozó tulajdonképpen egy rugó, és a végtelenségig oszcillál a rögzített egyen- 
súlyi pont körül. 

Hagyományosan az ilyen problémákat az irányításelmélet (control theory) tárgy- 
körébe sorolják. Ennek a tudományágnak egyre nagyobb a jelentősége a mesterséges 
intelligenciával foglalkozó kutatók számára. Évtizedek kutatásai során számos olyan 
szabályozót alkottak meg, amelyek lényegesen bonyolultabbak a fent használt egysze- 
rű szabályozónál. Egy referenciaszabályozó stabil (stable), ha kis megváltozások csak 
korlátos hibát eredményeznek a referenciajelhez képest. Szigorúan stabil (strictly 
stable), ha a robot a kis megváltozások ellenére is vissza tud térni a referenciapályára. 
Látható, hogy a P szabályozónk stabil, de nem szigorúan stabil, mivel képtelen vissza- 
térni a referenciatrajektóriára. 

A legegyszerűbb szabályozó, ami eleget tesz a szigorú stabilítás követelményeinek a 
mi esetünkben a PD szabályozó (PD controller). A P betű továbbra is az arányosat je- 
löli, míg a D a differenciálót. A PD szabályozót az alábbi egyenlet írja le: 


9040—x) 053) 


a, — Kp(y(r)—x,) Kp a 
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Ahogy az már a képletből is látszik, a PD szabályozó egy differenciális taggal egészíti 
ki a P szabályozót, ami az a-t egy olyan taggal bővíti, ami arányos az y(f) — x, hiba idő 
szerinti első deriváltjával. Mi a hatása egy ilyen új tagnak? Általában a derivátor csilla- 
Pítja a szabályozott rendszert. Tegyük fel, hogy egy adott rendszerben időben gyorsan 
változik az (y(2) — x,) hiba, mint ahogyan a fentebb tárgyalt esetben is. A differenciá- 
lis tag ilyenkor az arányos ellenében hat, és összességében csökkenteni fogja a válto- 
Zásra történő reakciót. Ugyanakkor, ha a hiba állandósul, a differenciális tag háttérbe 
szorul, és az arányos tag fogja meghatározni a szabályozást. 

PD szabályozót használva Kp — 0,3 és Kp — 0,8 paraméterekkel a 25.20. (c) ábrán 
lévő trajektóriát kapjuk. A pálya sokkal simább, és nem látható oszcilláció sem. Ahogy 
a példa is mutatja, egy differenciáló tag stabillá tehet egy szabályozót, amely enélkül 
nem az, 

A gyakorlatban a PD szabályozónak is lehetnek hibái. Van úgy, hogy a PD szabályo- 
Zó akkor sem tudja nullára redukálni a hibát, ha a külső eltérítés megszűnik. Ez a pél- 
dánkból nem nyilvánvaló, de néha szükség van egy másik visszacsatolásra is az ará- 
nyoson felül, hogy a hibát meg lehessen szüntetni. A megoldás erre a problémára egy 
harmadik tag hozzáadása a szabályozáshoz, ami a hiba idő szerinti integrálján alapul: 


090(0—x) 
Ör 


Kjegy újabb erősítési tényező. A kifejezés kiszámítja a hiba idő szerinti integrálját, En- 
nek hatására a referenciajel és az aktuális állapot között hosszan fennálló eltérés meg- 
szűnik. Például ha x, hosszabb ideig kisebb, mint y(f), akkor az integrál addig fog nőni, 
amíg az a, el nem tünteti a hibát. Az integrátor biztosítja, hogy a szabályozónak ne 
legyen rendszeres hibája, azon az áron, hogy nő az oszcilláció veszélye. PID szabályo- 
zónak (PID controller) hívjuk azt a szabályozót, amelyik mindhárom tagot tartalmazza. 
Széles körben használják különböző ipari alkalmazásokhoz és irányítási feladatokhoz. 


a, —KpO(1)—x)4.Ky J ((0)—xp)dt 4-Kp (5.4) 


Potenciáltér-vezérlés 


A potenciáltereket mint újabb költségfüggvényeket vezettük be a robotmozgás-tervezés 
során, de alkalmasak arra is, hogy közvetlenül generálják a robot mozgását, kiegészít- 
ve a pályatervezési fázist. Ahhoz, hogy ezt elérjük, definiálnunk kell egy vonzó erőt, 
ami a robotot a célkonfiguráció felé vonzza, valamint egy taszító potenciálteret, amely 
távol tartja az akadályoktól. Egy ilyen teret már bemutattunk a 25.21. ábrán. Az egyetlen 
globális minimumhelye a célkonfiguráció, értéke pedig az e céltól való távolság, valamint 
az akadályok közelségének összege. Az ábrán bemutatott potenciáltér kialakítását nem 
előzte meg tervezés. Éppen ezért a potenciálterek jól alkalmazhatók való: idejű megoldá- 
sokhoz. A 25.21. ábrán két trajektória látható, ahogy egy robot két különböző kezdeti 
konfigurációból megpróbálja megmászni a potenciálteret. Nagyon sok alkalmazás esetén 
a potenciálteret hatékonyan ki lehet számítani bármilyen adott konfiguráció esetében. Sőt 
adott robotkonfiguráció esetén a potenciálok kialakulásával a potenciálgradienst is meg- 
határozhatjuk. Ezek a számítások általában különösen hatékonyak, főleg a pályatervező 
algoritmusokhoz hasonlítva, amelyek mind exponenciálisak a konfigurációs tér dimen- 
ziójában (a szabadságfokokban). 
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(a) (b) 


25.21. ábra. Potenciáltér-vezérlés. A robot egy potenciáltérben halad, amely az akadályoktól taszító 
erőkből és a célkonfigurációhoz vonzókból áll. (a) Sikeres útvonal. (b) Lokális optimum. 


Az a tény, hogy a potenciálteres módszer ilyen hatékonyan megtalálja az utat a célhoz 
a konfigurációs térben még nagy távolságok esetén is, megkérdőjelezi a tervezés szük- 
ségességét. Vajon csak szerencsénk volt a példánk esetében, vagy tényleg elegendő a po- 
tenciálterek használata? A válasz az, hogy szerencsénk volt. A potenciáltereknek számos 
olyan jokális minimumhelye lehet, amely csapdába ejti a robotot. Ebben az esetben a ro- 
bot úgy közelíti meg az akadályt, hogy csak vállcsuklóját mozgatja egészen addig, amíg 
bele nem ütközik az akadályba a rossz oldalon. A potenciáltér nem ad annyi információt, 
hogy a robot behajlítsa a könyökét, hogy átférjen az akadály alatt. Más szavakkal, a po- 
tenciáltéren alapuló technikák nagyon jók lokális robotirányításra, de globális tervezést 
igényelnek. A másik hátulütője ennek a módszernek az, hogy az erők, amiket generál, 
csak az akadályoktól és a céltól való távolságtól függnek, nem veszik figyelembe a robot 
sebességét. Így a potenciáltér-alapú vezérlés tényleg egy kinematikai módszer, és nem 
feltétlenül működik, ha a robot gyorsan mozog. 


Reaktív irányítás 


Eddig olyan irányítási módszerekkel foglalkoztunk, amelyek megkívánták a környezet 
bizonyos fokú ismeretét ahhoz, hogy akár referenciapályát, akár potenciálteret alkothas- 
sunk. Ezzel a megközelítéssel kapcsolatban azonban felmerülnek bizonyos problémák. 
Először is, sokszor nagyon nehéz pontos modellt alkotni a környezetről, különösen ha az 
komplex vagy nagyon távol van, mint mondjuk a Mars felszíne. Másodszor, még ha sike- 
rül is pontos modellt készítenünk, a számítási nehézségek és a lokalizációs technikák hibá- 
ja folytán alkalmazhatatlanná válnak ezek a módszerek. Bizonyos esetekben megfelelőbb 
a reflexszerű ágensek használata, ezt hívják reaktív irányításnak (reactive control). 
Erre példa a 25.22. (a) ábra hexapodja, azaz hatlábú robotja, amelyet nehéz terepen 
való közlekedésre terveztek. A robot szenzorai többnyire alkalmatlanok arra, hogy 
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PP) visszahúzás, magasabbra emelés 


hátratolás 





(a) 


25.22. ábra. (a) Hexapod robot. (b) Kiterjesztett véges automata (KVA) (augmented finite state 
machine, AFSM) egyetlen láb vezérléséhez. Fontos, hogy ez a KVA-szenzoros visszacsatolásra reagál: 
ha a láb megakad az előremozgatás során, akkor magasabbra emeli. 


megfelelő pontosságú modellt alkossanak a környezetről, hogy a robot a korábban tár- 
gyalt pályatervezési algoritmusok bármelyikét használhassa. De hiába látnánk el meg- 
felelő szenzorokkal, a tizenkét szabadságfok (kettő lábanként) túl nagy számítási kapa- 
citást igényelne pályatervezés esetén. 

Mindazonáltal a környezet explicit ismerete nélkül is lehetséges közvetlenül szabá- 
lyozót tervezni a feladathoz. (Már láttuk ezt a PD szabályozó esetében, amely képes 
volt a komplex robotkart a megadott pályán tartani a robot dinamikájának pontos 
ismerete nélkül. Ugyanakkor szükség volt a kinematikai modell alapján megalkotott 
referenciapályára.) A hatlábú robot esetében megfelelő absztrakciós szinten meglepő- 
en könnyű meghatározni az irányítási törvényt. A megfelelő algoritmus cíklusosan 
mozgathatná a lábakat. Egy ideig a levegőben mozognak, utána pedig a földön támasz- 
kodnak. A hat lábat úgy kell koordinálni, hogy egyszerre három (ellentétes oldalakon) 
mindig a földön legyen, biztosítva a robot fizikai stabilitását. Egy ilyen irányítási al- 
goritmust könnyű programozni, és remekül működik sík felületen. Nehéz terepen az 
egyes akadályok meggátolhatják a lábakat az előremozdulásban. Ezen a problémán 
egy egészen egyszerű irányítási szabállyal segíthetünk: ha a láb mozgását valami 
blokkolja, a robot egyszerűen húzza vissza, emelje magasabbra, és próbálja újra! 
Az eredményül kapott vezérlést mint véges automatát mutatja a 25.22. (b) ábra. Egy 
reflexszerű ágenshez állapotokat társít, ahol a belső állapot a gép aktuális állapotának 
indexe (s,-től 54-ig) jelöli. 

Ennek az egyszerű visszacsatoláson alapuló szabályozónak a különböző változatai 
figyelemre méltóan robusztus lépegető vezérlést valósítanak meg, amellyel a robot gö- 
röngyös terepen is képes előrejutni. Világos, hogy ehhez a szabályozóhoz nem kell kör- 
nyezeti modell, és nem kell semmiféle keresést alkalmazni a vezérlés megalkotásához. 
Amikor egy ilyen vezérlőt használunk, a robot viselkedésének kialakításában nagyon 
fontos szerepet kapnak a környezetből visszacsatolásként érkező jelek. A szoftver ma- 
gától még nem határozza meg, hogy éppen mi fog történni a robottal, ha belehelyezik 
az adott környezetbe. Az olyan viselkedést, ami egy (egyszerű) szabályozó és a (komp- 
lex) környezet kölcsönhatásaként jön létre kibontakozó viselkedésnek (emergent 
behavior) hívjuk. Szigorúan véve bármelyik eddig tárgyalt robotra mondhatnánk, hogy 
kibontakozó viselkedést mutat, hiszen egyetlen modell sem tökéletes. Történeti okok 
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miatt azonban ezt a kifejezést csak arra az irányítási technikára mondják, amelyik nem 
használ explicit környezeti modellt. A kibontakozó viselkedés jellemző tulajdonsága 
számos biológiai organizmusnak is. 

Technikailag a reaktív irányítás csak egy implementációja az MDF-ek (illetve ha 
vannak belső állapotok, akkor POMDF-ek) stratégiáinak. A 17. fejezetben számos tech- 
nikát ismertettünk, amelyek alkalmasak a robot modelljéből és a robot környezetének a 
modelljéből stratégiák generálására. A robotikában az ilyen stratégiák kézzel történő 
megszerkesztésének nagy gyakorlati jelentősége van, mivel képtelenek vagyunk töké- 
letes modelleket alkotni. A 21. fejezetben leírt megerősítéses tanulási módszerek segít- 
ségével tapasztalati úton lehet stratégiákat szerkeszteni. Néhány ezen módszerek közül 
— például a 0-tanulás és a stratégiakereső módszerek — nem igényel környezeti modellt, 
hanem a tanulás során összegyűjtött, nagy mennyiségű adatra támaszkodik. Így alkal- 
mas jó minőségű szabályozók létrehozására robotok számára. 


25.7. SZOFTVERARCHITEKTÚRÁK A ROBOTIKÁBAN 


Szoftverarchitektúrának (software architecture) hívják az algoritmusok strukturálásának 
módszertanát. Egy architektúra általában nyelveket és eszközöket tartalmaz programok íÍrá- 
sához, valamint egy átfogó szisztémát, amely alapján a programokat össze lehet illeszteni. 

A modern robotikai szoftverarchitektúráknak sikeresen kell ötvözniük a reaktív irányí- 
tást és a modellalapú, tudatos vezérlést. Sok szempontból a reaktív és a tudatos irányítás 
eltérő előnyökkel és hátrányokkal rendelkezik. A reaktív szabályozás szenzoros informá- 
ción alapul, és nagyon jól használható valós idejű, alacsony szintű döntéshozásra. Ugyan- 
akkor ritkán ad globális szinten elfogadható megoldást, mert a globális döntések olyan in- 
formációt igényelnek, amely a döntés meghozatalakor még nincs a robot birtokában. 
Ilyen esetekben a modellalapú tervezés a megfelelő. 

Következésképpen a legtöbb robotarchitektúra reaktív technikákat használ az alacsony 
szintű irányításhoz, és modellalapút a magasabb szintűhöz. Amikor a PD szabályozóról 
beszéltünk, számításba vettünk egy ilyen kombinációt, ahol a (reaktív) PD szabályozó 
együtt dolgozik a (modeltalapú) pályatervezővel. Hibrid architektúrának (hybrid ar- 
chitecture) hívják általában azokat az architektúrákat, amelyek ötvözik a reaktív és a 
modellalapú technikákat. 





Alárendelt architektúra 


Az alárendelt architektúra (subsumption architecture) (Brooks, 1986) egy olyan 
keretrendszer, amelyen belül lehetőség nyílik reaktív szabályozók véges automatákból 
történő összeállítására. Ezeknél az automatáknál, állapotgépeknél a csomópontok egyes 
szenzoros változók vizsgálatát tartalmazzák olyan esetekben, ahol a véges automatánál 
is a változó vizsgálatának eredménye határozta meg a végrehajtás menetét. Az éleket el 
lehet látni címkékkel, amelyek akkor generálódnak, amikor az éleken áthaladunk, és 
amelyeket a robot motorjához vagy egy másik véges automatához küldünk. Azonfelül 
a véges automatáknak vannak belső időzítőik (óráik), amik irányítják, hogy mennyi idő 
alatt lehet átjutni egy-egy élen. Az így kapott állapotgépet szokás kiterjesztett véges 
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automatának (KVA) - (augmented finite state machine, AFSM) hívni, ahol a kiter- 
jesztés a belső órajel használatára vonatkozik. 

Egy egyszerű AFSM használatára példa a 25.22. (b) ábrán látható négyállapotú gép, 
amely ciklikus mozgást generál a hexapod robot számára. Ez az AFSM ciklikus szabályo- 
zót használ, aminek működése tulajdonképpen nem függ a környezetből jövő visszacsato- 
lástól. Az előrenyújtási szakasz során viszont már használja a szenzoros információt. Ha a 
láb elakad, azaz nem tudja végrehajtani az előremozgást, a robot visszahúzza a lábat, majd 
magasabbra emelve újra próbálkozik. Azaz a szabályozó képes reagálni a robot környe- 
Zettel való fizikai érintkezésére. 

Az alárendelt architektúra további primitíveket szolgáltat az AFSM-ek szinkronizá- 
lásához, és a többszörös, esetleg ellentmondásban lévő AFSM-ek kimenetének össze- 
hangolásához. Ezáltal lehetővé válik a programozó számára, hogy egyre bonyolultabb 
szabályozókat építsen fel bottom-up, alulról felfelé technikával. Példánkban egy-egy 
AFSM-mel kezdhetünk az egyes lábak vezérléséhez, majd a következő AFSM már több 
láb működésének összehangolását végezheti. Mindezekfölött megvalósíthatunk vala- 
milyen magas szintű viselkedést, mondjuk, egy ütközés elkerülését, amely már hátrá- 
lást és visszafordulást is tartalmaz. 

Az ötlet, hogy AFSM-ekkel valósítsuk meg a robot szabályozását, igen nagy előre- 
lépés. Képzeljük el, milyen nehéz lenne ugyanezt a viselkedést leírni a konfigurációs 
térben, bármelyik korábban tárgyalt pályatervező algoritmussal! Először is szükségünk 
lenne a terep pontos modelljére. A hatlábú robot konfigurációs tere összesen tizennyolc 
dimenziós (tizenkét dimenzió a lábankénti két-két motortól származik, hat pedig a ro- 
bot pozíciója és orientációja a környezethez képest). Még ha a számítógépeink elég 
gyorsak is lennének, hogy kiszámoljanak egy pályát egy ilyen kiterjedt térben, további 
problémát jelentenének az egyéb előforduló hatások, mint például az, ha a robot meg- 
csúszik a lejtőn. Az ilyen sztochasztikus hatások miatt egyetlen út a konfigurációs tér- 
ben csaknem bizonyosan túl törékeny lenne, és még egy PID szabályozó sem tudna 
megbirkózni a felmerülő problémákkal. Más szavakkal, a modellalapú mozgástervezés 
túl bonyolult feladat a mai robotok pályatervező algoritmusainak. 

Sajnos azonban az alárendelt architektúrának is megvannak a maga problémái, Elő- 
ször is, az AFSM-ek általában feldolgozatlan szenzoros információt kapnak, ami csak 
akkor elegendő a döntéshozáshoz, ha az adatok megbízhatók, és tartalmazzák az összes 
szükséges információt. De ha a szenzoros adatokat nemtriviális módon kell időben in- 
tegrálni, akkor sikertelen lehet a döntéshozás. Éppen ezért az alárendelt típusú szabályo- 
zókat lokális feladatokra használják, mint például fal mentén haladás vagy egy látható 
fényforrás követése. Másodszor, a modell hiánya nehézkessé teszi a robot feladatának 
megváltoztatását. Az alárendelt típusú robot általában csak egy feladatot hajt végre, és 
nincs is elképzelése arról, hogy hogyan módosíthatná vezérlését úgy, hogy más feladato- 
kat is el tudjon látni (mint a ganajtúró bogár a 2.2. alfejezetben). Végezetül, az alárendelt 
típusú vezérlést elég nehéz átlátni. A gyakorlatban több tucat bonyolult, együttműködő 
AFSM és a környezet kölcsönhatásait a legtöbb programozó már nem tudja követni. Ezen 
okok miatt az alárendelt architektúrát — nagy történeti jelentősége ellenére — ritkán 
szokták kereskedelmi forgalomba kerülő robotoknál használni. Ugyanakkor néhány le- 
származottját már igen. 
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Háromréteges architektúra 





A hibrid architektúra modellbe épített tudással ötvözi a reaktivitást. Messze a legnép- 
szerűbb hibrid architektúra az úgynevezett háromréteges architektúra (three-layer 
architecture), amely egy reaktív, egy végrehajtó és egy modellező rétegből áll. 

A reaktív réteg (reactive layer) alacsony szintű vezérlést biztosít a robot számára. 
Ezt egy szoros szenzorcselekvés-hurok jellemzi. Döntési ciklusa gyakran milliszekun- 
dum nagyságrendű. 

A végrehajtó vagy szekvenciális réteg (executive/seguencing layer) kapcsolja 
össze a reaktív réteget a modellezővel. Direktívákat fogad a modellező rétegtől, és egy- 
más után továbbítja azokat a reaktív réteg számára. A végrehajtó réteg kezelheti például 
a modellező réteg pályatervező algoritmusa által generált útvonalpontokat, és eldönti, 
hogy melyik reaktív viselkedést hívja meg. A döntési idő a végrehajtó réteg esetében át- 
lagosan másodperc nagyságrendű. Ez a réteg felelős továbbá azért is, hogy a szenzoros 
információkat egy belsőállapot-reprezentációba integráljuk. Kezeli például a robot 1o- 
kalizációs és online térképezési rutinjait. 

A modellező réteg (deliberate layer) a beépített tudással komplex feladatokra glo- 
bális megoldásokat generál, tervezéssel. A bonyolult feladatok nagy számítási igénye 
miatt a döntési ciklusidő perc nagyságrendű is lehet. A modellező vagy tervező réteg- 
modelleket használ a döntések meghozásához. Ezek a modellek lehetnek előzetesen 
betápláltak vagy adatokból tanulás útján létrejöttek, és általában a végrehajtó modell 
által gyűjtött állapotinformációt haszhálják. 

A háromrétegű architektúra különböző változatait találhatjuk meg a legtöbb mai robot 
szoftverrendszerében. A három rétegre való bontás nem kötelező. Egyes robotszoítver- 
rendszerek további rétegeket is tartalmaznak, például felhasználói interfész réteget — az 
emberekkel való kommunikálás vezérlésére —, vagy olyan rétegeket, amelyek a cselek- 
vésnek a többi, ugyanabban a környezetben tevékenykedő robottal való összehangolá- 
sáért felelősek. 


Robotprogramozási nyelvek 


Sok robotvezérlőnek megvan a saját külön programozási nyelve. Például az alárendelt ar- 
chitektúra sok programja a Brooks (Brooks, 1990) által megalkotott viselkedési nyelvet 
(behavior language) alkalmazza. Ez egy szabályalapú, valós idejű nyelv AFSM vezérlé- 
sekhez. A LISP-hez hasonló szintaxisú, egyedi szabályokat fordít AFSM-ekra, valamint 
több AFSM lokális és globális üzenetküldő mechanizmussal van integrálva. 

Csakúgy, mint az alárendelt architektúra, a viselkedési nyelv is csak egyetlen AFSM- 
re képes fókuszálni, és relatív alacsony szintű kommunikációt enged meg az egységek 
között. Az újabb kutatások erre az ötletre építve olyan nyelvek sorát fejlesztették ki, 
amelyek alapvetően hasonlítanak a viselkedési nyelvre, de nagyobb teljesítményűek, és 
gyorsabban futnak. Ilyen nyelv például az általános robot nyelv (generic robot 
language, GRL), amely Horswill (Horswill, 2000) nevéhez fűződik. A GRL egy funk- 
cionális programozási nyelv nagyméretű moduláris irányítási rendszerekhez. Ugyan- 
úgy, mint a viselkedési nyelv, a GRL is véges automatákból építkezik. Ezenfelül sok- 
kal nagyobb lehetőséget hagy a különböző modulok közötti kommunikációs formák és 
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szinkronizációs lehetőségek definiálására. A GRL-programok hatékony imperatív nyel- 
vekre fordítódnak le, mint amilyen például a C. 

Egy másik fontos, modern programozási nyelv (és hozzá tartozó architektúra) a Firby 
(Firby, 1994) által megalkotott reaktív akciótervrendszer (reactive action plan system, 
RAPS). A RAPS lehetővé teszi, hogy a programozók célokat és ezekhez tartozó terve- 
ket (vagy részleges stratégiákat) definiáljanak, valamint feltételeket, amelyek esetén az 
adott terv nagy valószínűséggel sikeres lesz. Ami nagyon fontos, hogy a RAPS lehető- 
séget ad az esetleges kudarc kezelésére is, ami szükségszerű velejárója a valódi roboti- 
kai rendszereknek. A programozó számos érzékelő rutint specifikálhat a különböző tí- 
pusú kudarcok esetére, és mindegyikhez definiálhat egy kivételkezelési rutint. Három- 
rétegű architektúráknál gyakran használják a RAPS-ot a végrehajtó rétegben, az újra- 
tervezést nem igénylő kis eltérések, váratlan események kezelésére. 

Számos más nyelv létezik, amely lehetővé teszi a robot számára, hogy mérlegeljen 
és tanuljon. Ilyen például a GoLoG (Levesgue és társai, 1997b), amely akadályok nélkül 
egyesíti a modellalapú problémamegoldást (tervezést) és a reaktív irányítás közvetlen 
megvalósítását. A GOLOG-programok szituációkalkulus (10.3. alfejezet) formájában jut- 
nak kifejezésre, nemdeterminisztikus mozgásoperátorok hozzáadásának a lehetőségével. 
Ha a vezérlőprogramban nemdeterminisztikus mozgások is specifikáltak, a programozó- 
nak teljes modellt kell szolgáltatnia a robotról és környezetéről. Amikor a vezérlőprog- 
ram egy nemdeterminisztikus választási lehetőséghez ér, egy tervező algoritmust hív 
meg (szabálykészítő formában), hogy az meghatározza a következő lépést. Ilyen mó- 
don a programozó részleges vezérlőket ír, és a végső irányítási döntéshozást a beépített 
mechanizmusra bízza. A GOLOG szépsége a modellalapú és a reaktív vezérlés probléma 
nélküli összeillesztésében van. Annak ellenére, hogy a GOLOG alkalmazásának több fel- 
tétele van (teljes megfigyelhetőség, diszkrét állapotok, teljes modell), sok beltéri robot 
számára nyújt megfelelő, magas szintű irányítást. 

A CES, C-H-- beágyazott rendszerekhez (C---t- for embedded systems), a C-t-k 
nyelv kiterjesztése, amely már valószínűségeket és tanulást is tartalmaz (Thrun, 2000). 
A CES adattípusai valószínűségi eloszlások, amelyek a programozó számára lehetővé 
teszik a bizonytalan információk kezelését a korábbi nehézségek nélkül. Ami még fon- 
tosabb, hogy a CES lehetőséget nyújt a robot szoftverpéldákkal való tanítására, nagyon 
hasonlóan a 20. fejezetben tárgyalt tanulási algoritmusokhoz. Ennek kihasználásával 
a programozók hagyhatnak helyet a programban a később megtanulható függvények 
számára — ezek tipikusan differenciálható parametrikus reprezentációk, mint például a 
neurális hálók. Ezeket a függvényeket a külön tanulási fázisban tanulja meg a rendszer, 
ahol a tanító határozza meg a kívánt kimeneti viselkedést. A CES sikeresnek bizonyult 
részlegesen megfigyelhető és folytonos esetekben is. 

Az ALisp (Andre és Russell, 2002) a LISP továbbfejlesztett változata. Az Alisp lehe- 
tővé tesz nemdeterminisztikus döntési pontok megadását, hasonlóan a GOLOG döntési 
pontjaihoz. De ahelyett, hogy a tételbizonyítóra bízná a döntést, az ALisp induktív 
módon, megerősítéses tanulással megtanulja a helyes cselekvést. Az ALisp-ot rugalmas 
eszköznek tekinthetjük a tárgytartományról szóló — főleg a megfelelő döntések szub- 
rutinjainak hierarchikus szerkezetére vonatkozó — tudásnak megerősítéses tanulással 
tanuló rendszerbe való beépítésére. Eddig csak szimulációk során alkalmazták az 
ALisp-ot, de nagyon ígéretes módszernek tűnik olyan robotok építéséhez, amelyek 
tanulnak a környezetükkel való kölcsönhatásból. 
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Most pedig felsorolunk néhányat a robottechnológia fontos alkalmazási területei közül. 

Ipar és mezőgazdaság. Hagyományosan azok az ágazatok használnak robotokat, 
amelyek nehéz, fizikai jellegű emberi munkát igényelnek, de mégis megfelelően struk- 
turálhatók és automatizálhatók. A legjobb példa az összeszerelő üzemi gyártósor, ahol 
a manipulátorok rutinszerűen végzik feladatukat, az összeszerelést, az alkatrészek be- 
helyezését, az anyagkezelést, a hegesztést és a festést. Sok esetben a robotok sokkal 
költséghatékonyabbak, mint a humán munkaerő. 

A szabadban sok nehéz gép helyét robotok vették át a betakarításnál, a bányászatban, 
a földmunkáknál. Például nemrégiben a Carnegie Mellonon, egy projekt során bemu- 
tatták, hogy a robotok 50-szer gyorsabban képesek levakarni a festéket egy hajóról, 
mint az emberek, és sokkal kevesebb kárt tesznek a környezetben. Autonóm bányász- 
robotok prototípusai bizonyították, hogy sokkal gyorsabban és pontosabban képesek 
kitermelni az ércet a föld alatti bányákban, mint az emberek. Robotokat használnak az 
elhagyatott bányák és csatornarendszerek nagy pontosságú feltérképezéséhez is. Ugyan 
sok rendszer még csak kísérleti stádiumban van, pusztán idő kérdése, hogy a robotok 
mikor veszik át az emberektől a félig mechanikus munkák többségét. 

Szállítás, A robotizált szállításnak sok oldala van. Az autonóm helikopterektől kezdve, 
amelyek nehezen megközelíthető helyekre juttathatnak el szállítmányokat, az automata 
kerekes székeken át (amik olyan embereket szállítanak, akik nem tudnák irányítani a ha- 
gyományos kerekes széket), egészen az autonóm rakodógépekig, amelyek felülmúlják a 
dokkokban a szakképzett humán sofőrt ís a konténerek hajókra és teherautókra való 
bepakolásánál. Jó példa a beltéri szállító robotokra a 25.23. (a) ábrán látható Helpmate 
nevű robot. Ezt a robotot kórházak tucatjaiban használják étel és egyéb orvosi felsze- 
relés szállítására. A kutatók olyan autószerű robotot ís kifejlesztettek, amely képes 
önállóan navigálni az autópályán, és terepen is megállja a helyét. Üzemi körülmények 
között a szállítórobotok ma már rutinszerűen látják el a szállítási feladatokat raktárak- 
ban és a gyártósorok között. 

Ezen robotok közül sok igényli, hogy munkája elvégzéséhez változtassunk valamit 
környezetén. A leggyakoribb, hogy tájékozódást segítő elemeket kell felszerelni, például 
induktív köröket a padlóba, aktív fényjeleket, vonalkódokat vagy GPS-adókat. Jelenleg 
még mindig nagy kihívás olyan robotot tervezni, amely képes a természetes környezetben 
tájékozódni, és nem igényel mesterséges eszközöket. Ez különösen fontos olyan esetek- 
ben, mint például a mélytengeri kutatások, ahol a GPS nem elérhető. 

Veszélyes környezet. Robotok segítettek az embereknek a nukleáris hulladékok elta- 
karításában. A legnevezetesebb helyszín Csernobil és Three Mile Island volt. A robotok 
ott voltak a World Trade Center összeomlása után is, és olyan helyekre is bementek, 
amelyek a mentőcsapatok számára túl veszélyesek voltak. 

Néhány országban lőszer szállítására és — ami különösen veszélyes feladat — bombák 
hatástalanítására használnak robotokat. Számos kutatás irányul napjainkban aknaszedő 
robotok kifejlesztésére — mind szárazföldi, mind tengeri használatra. A legtöbb ilyen 
célú robot távirányítással működik, azaz emberek vezérlik messziről őket. Ezen robo- 
tok önállóvá tétele a következő fontos fejlesztési lépés. 

Felfedezés. A robotok eljutottak oda is, ahová az ember még soha, például a Mars 
felszínére (lásd 25.1. (a) ábra). Robotkarok segítik az űrhajósokat a szatellítek befo- 
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(a) (b) 


25.23. ábra. (a) A Helpmate robot élelmiszert és egyéb orvosi felszerelést szállít több tucat kórházban, 
világszerte. (b) Sebészrobotok a műtőben (da Vinci Surgical Systems). 


gásában és pályára állításában, valamint a Nemzetközi Űrállomás (ISS) építésében. 
Robotok segítenek a tenger alatti kutatásokban. Gyakran használják őket elsüllyedt ha- 
jók feltérképezésére. A 25.24. ábrán egy elhagyatott szénbányát feltérképező robot 
látható, a távolságszenzorai által a járatról alkotott 3D modellel együtt. 1996-ban tudó- 
sok egy járórobotot engedtek le egy működő vulkán kráterébe, és fontos adatokat gyűj- 
töttek klimatológiai kutatásokhoz. Ember nélküli légi járműveket, más néven drónokat 
(drones) használnak katonai műveletekhez. A robotok egyre hatékonyabbak az infor- 
mációgyűjtésben olyan területeken, amelyek nehezen megközelíthetők (vagy veszélye- 
sek) az ember számára. 

Egészségügy. A sebészorvosok munkáját segítendő egyre többször használnak robo- 
tokat az orvosi eszközök pontos mozgatásához olyan kényes szerveket érintő műtétek 
esetében, mint az agy, a szív vagy a szem. A 25.23. (b) ábra egy ilyen rendszert mutat 
be. A robotok — nagy pontosságuknak köszönhetően — nélkülözhetetlen eszközökké 
váltak bizonyos csípőprotézisek beültetésénél. Pilottanulmányok kimutatták, hogy vég- 
béltükrözés esetén a robotizált eszközök használata csökkenti a sérülés veszélyét. 
A műtőn kívül, a kutatók megkezdték olyan robotok kifejlesztését, amelyek idős vagy fo- 
gyatékos emberek segítségére lehetnek, mint például az intelligens robotizált járógépek 
vagy intelligens játékok, amelyek figyelmeztetnek a gyógyszerek bevételére. 

Személyi kiszolgálók. A szolgáltatás a robotok nagy, ígéretes alkalmazási területe. 
A szervizrobotok a mindennapi teendők elvégzésében segédkeznek. A kereskedelmi 
forgalomban is kapható szervizrobotok között vannak autonóm porszí" fűnyírók és 
golflabdaszedők. Ezen robotok mindegyike önállóan, emberi segítség nélkül képes na- 
vigálni, és teljesíteni feladatát. Néhány szervizrobot nyilvános helyeken tevékenykedik, 
mint például az idegenvezetőként alkalmazott robotizált információspult a bevásárló- 
központokban, a vásárokon vagy a múzeumokban. A szervizfeladatok ellátása emberi 
interakciót kíván, és azt, hogy a robot megfelelően boldoguljon kiszámíthatatlan és 
dinamikus környezetekben. 
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(a) b 


25.24. ábra. (a) Egy elhagyatott bánya feltérképezése egy robottal. (b) A bányának a robot által kapott 
3D képe. 


Szórakozás. A robotok megkezdték a játék- és szórakoztatóipar meghódítását is. 
A 25.4. (b) ábrán már találkoztunk a Sony AIBO-val, ami bár kutyaszerű játék, világ- 
szerte használják MI-kutatólaborokban különböző projektek platformjaként. Az egyik, 
nagy kihívást jelentő feladat, ahol az AIBO-kat fizikai eszközként használták, a robot- 
foci (robotic soccer): versengés két csapat között, az emberi focihoz hasonló szabá- 
lyokkali, de autonóm mobil robotokkal. A robotfoci nagyon jó lehetőségeket kínál az 
MI-kutatásokhoz, mert sok olyan problémát foglal magában, ami máshol, komolyabb al- 
kalmazásokban is megjelenik. Az évente megrendezésre kerülő robotfoci-bajnokságok 
sok MI-kutatót vonzzanak, és érdekesebbé, izgalmasabbá tették a robotikának ezt az ágát. 

Emberi kiegészítők. Az utolsó alkalmazás, amiről szót ejtünk, az emberi kiegészí- 
tők. A kutatók kifejlesztettek már a kerekes székhez hasonló lépegető járógépet, ame- 
lyek alkalmasak emberek szállítására. Számos helyen jelenleg arra koncentrálnak, hogy 
olyan eszközöket alkossanak, amelyek megkönnyítik az embernek a járást vagy a karok 
mozgatását egy, a testhez kívülről csatlakoztatott vázzal, amely képes pluszerőt kifejte- 
ni. Ha valakire tartósan rögzítenek egy ilyen szerkezetet, akkor mesterséges végtagnak 
is tekinthető. A robotok általi távjelenlét, illetve teleoperáció is felfogható emberi kiegé- 
szítésnek. A teleoperáció azt jelenti, hogy robotikai eszközök segítségével nagy távol- 
ságból tudunk megadott feladatokat végrehajtani. A teleoperáció népszerű megvaló- 
sítása a mester-szolga (master-slave) elvű konfiguráció, amikor is a robot manipulátor 
a távolban lévő, humán operátor mozdulatait követi, egy heptikus (érzetet is közvetítő) 
interfészen keresztül. Ezek a rendszerek mind jobban kiterjesztik az emberi képessége- 
ket a környezettel való tökéletesebb kölcsönhatás érdekében. Néhány projekt azt tűzte 
ki célul, hogy lemásolja az embert, legalábbis felületes szinten. Japánban már számos 
cégnél kaphatók humanoid robotok. 
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A robotika tulajdoképpen nem más, mint intelligens ágensek, amelyek képesek megvál- 
toztatni a fizikai világot. Ebben a fejezetben a következő alapvető ismereteket sajátítottuk 
el a robothardverrel és -szoftverrel kapcsolatban. 
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s A robotok szenzorokkal vannak felszerelve, hogy érzékelhessék az őket körülvevő 
világot, és beavatkozó szervekkel, hogy fizikai erőkkel hathassanak környezetükre. 
A legtöbb robot vagy manipulátor, amely egy adott helyhez van sögzítve, vagy mobil 
robot, ami képes mozogni. 

s A robotikai érzékelés a döntéshez kapcsolódó mennyiségeknek a szenzoros adatok- 
ból való becslése. Ehhez szükségünk van egy belső reprezentációra, valamint egy 
olyan módszerre, amivel azt időnként frissíthetjük. A nehéz érzékelési problémák 
gyakori példái a helymeghatározás és a térképezés. 

s. Valószínűség-alapú szűrő algoritmusok, mint például a Kalman-szűrők és a részecs- 
keszűrők hasznosak a robotérzékelés szempontjából. Ezek a technikák frissítik a belső 
világképet, például az állapotváltozók a posteriori eloszlását. 

s A robot mozgásának tervezése általában a konfigurációs térben történik, ahol minden 
pont egyértelműen meghatározza a robot egy adott pozícióját és orientációját, csuk- 
lóinak szögét. 

s A konfigurációs térben kereső algoritmusok között fontos megemlíteni a celladekom- 
pozíciót, amely a teljes konfigurációs teret véges sok cellára bontja fel, valamint a 
szkeletonizációs technikákat, amelyek az adott konfigurációs teret egy alacsonyabb 
dimenzióba vetítik le. A mozgástervezés problémáját ezután már egyszerűbb struk- 
túrákban való kereséssel is meg lehet oldani. 

e. A kereső algoritmus által megtalált pályán a robot akkor tud végighaladni, ha egy 
PID szabályozót teszünk a rendszerbe, aminek referenciapályája a kívánt útvonal. 

s A potenciáltér-alapú technikák a céltól és az akadályoktól való távolság szerint de- 
finiált potenciálfüggvények segítségével navigálják a robotot. Ezek a technikák 
megakadhatnak lokális minimumhelyeken, de képesek mozgásgenerálásra előzetes 
tervezés nélkül. 

. Néha egyszerűbb egy robotszabályozót közvetlenül megtervezni, mint a pályát a 
környezet explicit modelljéből levezetni. Egy ilyen szabályozót legtöbbször leírha- 
tunk véges automataként. 

s Az alárendelt architektúra a programozók számára lehetővé teszi, hogy belső órajel- 
lel kiegészített véges automaták összekapcsolásával robotvezérlőket alkossanak. 

s A népszerű háromrétegű architektúra olyan robotszoftver fejlesztéséhez is keretet ad, 
amely integrálja a modellalapú tervezést, a részfeladatokra bontást és a szabályozást. 

s Léteznek feladatspecifikus robotprogramozási nyelvek, amelyek megkönnyítik a ro- 
botszoftverek fejlesztését. Ezek a nyelvek kész szerkezetekkel segítik a többszálú 
programok írását, a szabályozási irányelveknek a tervezésbe történő integrálását és 
a tapasztalatalapú tanulást. 


Irodalmi és történeti megjegyzések 


A robot szót a cseh drámaíró, Karel Capek népszerűsítette 1921-ben írt R.U.R. 
(Rossunvs Universal Robots) c. színművével. Az ő robotjait nem mechanikusan szerel- 
ték össze, hanem kémiai úton állították elő. A műben a robotok megharagszanak 
mestereikre, és elhatározzák, hogy átveszik az uralmat. Úgy tűnik (Glanc, 1978), hogy 
valójában Capek bátyja, Josef alkotta meg a robot szót a cseh , robota" (robotolás) és 
, robotnik" (jobbágy) szó összevonásával, 1917-es Opilec c. novellájában. 
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A robotika kifejezést Asimov használta először 1950-ben, ugyanakkor a robotika 
története — más megnevezéssel — sokkal régebbre nyúlik vissza. Az ókori görög mito- 
lógiában Talószt, a mechanikus embert állítólag Héphaisztosz, a kovácsisten készítette. 
Jacgues Vaucanson egy csodálatos automatát épített a 18. században. Az 1738-as me- 
chanikus kacsa a korai robotok egy példája, aminek összetett viselkedése még fixen volt 
beleépítve. Az első programozható, robotszerű alkotás talán Jacguard szövőszéke volt 
(1805), amiről már az 1. fejezetben már szót ejtettünk. 

Az első kereskedelmi forgalomba került robot a Unimate (universal automation) 
manipulátor volt. A Unimate-et Joseph Engelberger és George Devol fejlesztette. 1960- 
ben adták el az első példányt a General Motorsnak, ahol tv-képcsövek gyártásánál hasz- 
nálták. Szintén 1960-ben nyújtotta be Devon az első robotokra vonatkozó szabadalmat 
az Egyesült Államokban. 11 évvel később a Nissan Corp. az elsők között oldotta meg 
egy teljes szerelősor automatizálását. A fejlesztést a Kawasaki végezte Engelberger és 
Devol Unimation nevű cégétől származó robotokkal. Főként Japánban és az USA-ban 
ez az előrelépés jelentős átalakulásnak nyitott utat, amely mind a mai napig tart. A Uni- 
mationt a PUMA robot fejlesztése követte 1978-ban. A PUMA a Programmable Univer- 
sal Machine for Assembly (programozható univerzális gép szereléshez) névből szárma- 
zik, és eredetileg a General Motors számára fejlesztették. A következő évtizedekben ez 
lett a robotmanipulátorok de facto szabványa. Manapság egymillióra becsülik a világon 
dolgozó robotok számát, és ezeknek több mint fele Japánban tevékenykedik. 

A robotikai kutatásokról szóló szakirodalom nagyjából két részre osztható: mobil 
robotokra és rögzített manipulátorokra. A Grey Walter által 1948-ban készített , teknőst" 
tekinthetjük a világ első autonóm mobil robotjának annak ellenére, hogy a rendszer nem 
volt programozható. A "60-as években, a Johns Hopkins Egyetemen készített , Hopkins 
Beast" már sokkal kifinomultabb volt. Mintafelismerő hardverével azonosította a szab- 
ványos fali AC-csatlakozókat, és képes volt mozgása során megtalálni azokat, rácsatla- 
kozni és feltölteni akkumulátorát. Mégis, a Beastnek nagyon limitált képességei voltak. 
Az első általános célú robot a , Shakey" volt, amit a Stanford Research Instítute-ban 
(SRD) fejlesztettek ki az 1960-as évek végén (Fikes és Nilsson, 1970; Nilsson, 1984). 
Shakey volt az első robot, amelybe integrálták az érzékelést, a tervkészítést és a végre- 
hajtást. Ez a jelentős eredmény számos további MI-kutatást inspirált. Szintén jelentős 
hatású projektek voltak még a Stanford Cart és a CMU Rover (Moravec, 1983). A mo- 
bil robotokkal kapcsolatos klasszikus munkákat Cox és Wilfong foglalták össze (Cox, 
és Wilfong, 1990). 

A robottérképezés gyökerei két különböző helyről erednek. Az egyik szál Smith és 
Cheeseman munkásságával kezdődött (Smith és Cheeseman, 1986), akik Kalman- 
szűrőt alkalmaztak szimultán helymeghatározási és térképezési problémákhoz. Az al- 
goritmust először Moutarlier és Chatila implementálta 1989-ben, majd Leonard és 
Durrant-Whyte terjesztették ki (Leonard és Durrant-Whyte, 1992). Dissanayake és tár- 
sai 2001-ben írták le az ágazat jelenlegi fejlettségi szintjét (Dissanayake és társai, 
2001). A másik szál a foglalási hálózat (occupancy grid) reprezentáció megalkotásá- 
val kezdődött, amelyet a valószínűségi térképezésnél használnak. A foglalási hálózat 
minden (x, y) pontra meghatározza annak a valószínűségét, hogy ott egy akadály van 
(Moravec és Elfes, 1985). A modern robottérképezésről Thrun írt összefoglalót (Thrun, 
2002). Kuipers és Levitt (Kuipers és Levitt, 1988) az elsők között voltak, akik metrikus 
helyett topológikus térképezést javasoltak, az ember térbeli tájékozódását véve alapul. 
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A korai mobil robot helymeghatározási technikákat Borenstein és társai tekintették át 
(Borenstein és társai, 1996). Annak ellenére, hogy a Kalman-szűrő évtizedeken át jól 
ismert helymeghatározási módszer volt az irányításelméletben, a helymeghatározás 
problémájához tartozó általános valószínűségi szabály csak jóval később jelent meg az 
MI-irodalomban, Tom Dean és kollégái (Dean és társai, 1990), valamint Simmons 
és Koenig (Simmons és Koenig, 1995) munkássága révén. Ez utóbbi páros vezette be 
a Markov-helymeghatározás (Markov localization) fogalmát. A technika első, va- 
lósvilág-beli alkalmazását Burgard és társai mutatták be (Burgard és társai, 1999) egy 
sor roboton keresztül, amelyeket múzeumokba telepítettek. A részecskeszűrő-alapú 
Monte Carlo helymeghatározás, amelyet Fox és társai fejlesztették ki (Fox és társai, 
1999), manapság széles körben használatos. A Rao-Blackwellized részecskeszűrő 
kombinálja a részecskeszűrést a robot lokalizációval, valamint az egzakt szűrést a tér- 
képalkotással (Murphy és Russell, 2001; Montemerlo és társai, 2002). 

A mobil robotokhoz kapcsolódó kutatások szimulálásának az elmúlt évtizedben két 
jelentős verseny is teret adott. Az AAAI éves robotbajnokságát 1992 óta rendezik meg. 
Az első verseny győztese a CARMEL volt (Congdon és társai, 1992). A fejlődés azóta igen 
jelentős és töretlen: a 2002-es verseny során például a robotoknak be kellett járniuk a kon- 
ferenciaközpontot, megtalálni a regisztrációs pultot, regisztrálni a konferenciára, és végül 
tartani egy beszédet. Az 1995-ben, Kitano és kollégái (Kitano és társai, 1997) által elin- 
dított Robocup kezdeményezés célja, hogy 2050-re olyan teljesen autonóm humanoid 
robotokból álló futballcsapatot fejlesszen, , amely képes megverni az aktuális emberi vi- 
lágbajnokcsapatot". Különböző bajnokságokat szerveznek kerekes, eltérő méretű, szimu- 
lált robotoknak és négylábú Sony Aibóknak. 2002-ben a világbajnokságra több mint 30 
országból érkeztek csapatok, és a rendezvény legalább 100 000 nézőt vonzott. 

A robotmanipulátorok, eredeti nevükön kéz-szem gépek (hand-eye machine) tanul- 
mányozása meglehetősen más vonalon fejlődött. Egy ilyen kéz-szem gép megalkotásá- 
ra az első igazi kísérlet Heinrich Ernst MH-1-ese volt, amelyet PhD-téziseiben írt le az 
MIT-n (Ernst, 1961). Az edinburghi Gépi Intelligencia (Machine Intelligence) program 
már igen korán jelentős eredményeket mutatott fel látásalapú összeszerelő rendszerük- 
kel, amit FREDDY-nek hívtak (Michie, 1972). Ezen úttörő kísérletek után rengetegen 
foglalkoztak geometriai algoritmusokkal determinisztikus és teljesen megfigyelhető 
mozgástervezési problémákhoz. A robotmozgás-tervezés P-TÁR nehézségét Reif egy 
termékenyítő cikke mutatta be (Reif, 1979). A konfigurációstér-reprezentációt Lozano- 
Perez-nek (Lozano-Perez, 1983) köszönhetjük. Nagy befolyást gyakoroltak Schwartz és 
Sharir publikációi az általuk zongoraszállítóknak (piano movers) nevezett problémáról 
(Schwartz és társai, 1987). 

A konfigurációs tér rekurzív cellákra bontásával való tervezés Brookstól és Lozano- 
Perez-től származik (Brooks és Lozano-Perez, 1985), ezt később Zhu és Latombe fej- 
lesztették jelentősen tovább (Zhu és Latombe, 1991). A legkorábbi szkeletonizációs 
algoritmusok a Voronoi-diagramokon (Rowat, 1979) és a láthatósági gráfokon (visi- 
bility graph) alapultak (Wesley és Lozano-Perez, 1979). Guibas és társai (Guibas és 
társai, 1992) hatékony technikát fejlesztettek ki a Voronoi-diagramok inkrementális 
számítására. Choset (Choset, 1996) általánosította sokkal átfogóbb mozgástervezési 
problémákra a Voronoi-diagramokat. John Canny alapozta meg PhD-tézisével (Canny, 
1991) az első különálló exponenciális algoritmust pályatervezésre. Másféle szkeletoni- 
zációs módszert használt, amit szihiett (silhouette) algoritmusnak hívnak. Jean-Claude 
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Latombe írása (Latombe, 1991) a különböző mozgástervezési metódusok széles skálá- 
ját fedi le. Kavraki és társai valószínűségi útitervet fejlesztettek (Kavraki és társai, 
1991), amely még ma is a leghatékonyabb. Lozano-Perez és társai (Lozano-Perez és 
társai, 1984), valamint Canny és Reif (Canny és Reif, 1987) is foglalkoztak a finom 
mozgások tervezésével korlátozott érzékelés esetén, és intervallumra vonatkoztatott 
bizonytalanságot használtak valószínűségi bizonytalanság helyett. A referenciapont- 
alapú navigálás a mobil robotok esetében sok hasonló ötletet használ (Lazanas és La- 
tombe, 1992). 

A robotok mint dinamikus rendszerek irányítása, legyen szó manipulátorról vagy 
mobil robotról, hatalmas irodalommal rendelkezik, amelynek anyagáról ebben a feje- 
zetben alig-alig esett szó. A fontos művek közé tartozik Hogan trilógiája (Hogan, 1985) 
az impedancia szabályozásáról és egy általános tanulmány a robotok dinamikájáról 
Featherstone-tól (Featherstone, 1987). Dean és Wellman az elsők között voltak, akik 
megpróbálták összekötni az irányításelméletet és az MI-tervezőrendszereket (Dean és 
Wellman, 1991). Három klasszikus tankönyv a robotkarok matematikájáról Paultól 
(Paul, 1981), Craigtól (Craig, 1989) és Yoshikawától (Yoshikawa, 1990) származik. 
A megfogás (grasping) tárgyköre szintén nagyon fontos a robotikában: egy stabil meg- 
fogás meghatározásának problémája meglehetősen nehéz (Mason és Salisbury, 1985). 
A megfelelő megfogás érintkezésérzékelőket vagy heptikus visszacsatolást (haptic 
feedback) kíván a fellépő erők és az esetleges csúszás meghatározására (Fearing és 
Hollerbach, 1985). 

A potenciáltér-vezérlést, amely egyszerre próbálja megoldani a mozgástervezés és az 
irányítás problémáját, Khatib vezette be a robotika irodalmába (Khatib, 1986). Mobil ro- 
botok esetében ezt az ötletet részleges megoldásnak tekintették az ütközések elkerülésének 
problémájához. Később Borenstein (Borenstein, 1991) továbbfejlesztette az algoritmust, 
és a vektortérhisztogram (vector field histogram) nevet adta neki. A navigációs 
függvényeket, a determinisztikus MDF-hez tartozó vezérlési irányelvek robotikai meg- 
felelőjét, Koditschek vezette be (Koditschek, 1987). 

A robotokhoz tartozó szoftverarchitektúra témája sok heves vitát váltott ki. Az MI jó 
öreg zászlóshajója — a háromrétegű architektúra - Shakey tervezésének eredménye, 
később Gat újította fel (Gat, 1998). Az alárendelt architektúra Brooks munkája (Brooks, 
1986), bár tőlük függetlenül Braitenberg (Braitenberg, 1984) is fejlesztett hasonlót, 
akinek könyve, a Járművek, egy sor egyszerű viselkedésalapú robotot mutat be. Brooks 
hatlábú lépegető robotjának sikerét sok más projekt követte. Connell PhD-munkája kere- 
tében (Connell, 1989) olyan teljesen reaktív mobil robotot fejlesztett, amely képes volt 
tárgyakért elmenni és azokat elhozni. A viselkedésalapú paradigma többrobotos rend- 
szerekre való kiterjesztését megtalálhatjuk Mataric (Mataric, 1997) és Parker (Parker, 
1996) munkáiban. A GLR (Horswill, 2000) és a COLBERT (Konolige, 1997) robotok 
megvalósították a párhuzamosított viselkedésalapú irányítást általános robotprogramo- 
zási nyelveken. Arkin átfogó képet nyújtott a téma aktuális helyzetéről (Arkin, 1998). 

A 7. fejezetben leírt helyezett automatákat (situated automata) (Rosenschein, 
1985; Kaelbling és Rosenschein, 1990) szintén használják mobil robotok irányítására, 
felderítési és szállítási feladatoknál. A helyezett automaták szorosan kapcsolódnak a 
viselkedésalapú tervezéshez abból a szempontból, hogy véges automatákból állnak, 
amelyek egyszerű kombinációs hálózatokkai nyomon követik a környezet állapotának 
bizonyos aspektusait. Amíg a viselkedésalapú megközelítés az explicit reprezentáció 


1066 25. ROBOTIKA 


hiányát hangsúlyozza, a helyezett automatákat algoritmikusan építik deklaratív környe- 
zeti modellekből, így minden állapotregiszter által reprezentált tartalom jól definiált. 

Számos jó kézikönyv jelent meg mostanában a mobil robotokról. A fent említetteken 
felül Kortenkamp és társai (Kortenkamp és társai, 1998) gyűjtése minden részletre ki- 
terjedő áttekintést nyújt a mai mobil robot architektúrákról és rendszerekről. Két újabb 
könyv, Dudek és Jenkin (Dudek és Jenkin, 2000), valamint Murphy (Murphy, 2000) 
munkája általánosabb megközelítésben tárgyalja a robotikát. Mason könyve (Mason, 
2001) a robotkarokról olyan modern témákat is tárgyal, mint például az önbeálló moz- 
gás. A robotikával foglalkozó legjelentősebb konferencia az IEEE International Confe- 
rence on Robotics and Automation. A témával foglalkozó folyóiratok közül kiemelkedik 
az IEEE Robotics and Automation, az International Journal of Robotics Research és a 
Robotics and Autonomous Systems. 


Feladatok 


25.1. A Monte Carlo-helymeghatározás torzított bármilyen véges méretű mintára. 

Azaz az algoritmus által kiszámolt várható érték a részecskeszűrés működésé- 
ből adódóan eltér a tényleges várható értéktől. Ebben a példában ezt a torzítást 
kell kiszámolni. 
Hogy kicsit egyszerűsítsük a problémát, vegyünk egy teret, amelyben a robot- 
nak négy lehetséges állapota (helyzete) van: X — (xy, x2, xz, x4). Kezdetben 
egyenletes eloszlással választunk N 2 1 mintát a megadott állapotok közül. 
Mint általában, itt is tökéletesen elfogadható, ha egymás után akár több ís gene- 
rálódik bármelyik X állapotból. Legyen Z egy bináris szenzorváltozó, az alábbi 
feltételes valószínűségekkel: 





P(ozh) — 02 
P(-zh2) — 06 
P(-z]x3) —09 
Pízlxg) 701 P(Coz]hx4 — 09 


A Monte Carlo-helymeghatározás ezeket a valószínűségeket használja, hogy ge- 

nerálja a részecskék súlyát, amelyeket azután normalizál és felhasznál az újabb 

mintavételezésnél. Az egyszerűség kedvéért feltételezzük, hogy az újabb minta- 

vételezésnél, N nagyságától függetlenül, csak egyetlen új mintát generálunk. Ez 

A minta korrelálhat bármelyik X állapottal. Így a mintavevő folyamat X-re néz- 

ve meghatároz egy valószínűség-eloszlást. 

(a) Mi az új mintára eredményül kapott valószínűség-eloszlás X-re nézve? Vá- 
laszolja meg a kérdést az N — I, ..., 10 esetekre, valamint N — 00-re. 

(b) AP és 0 két valószínűség-eloszlás közötti különbséget mérhetjük a KL di- 
vergenciával, amelynek definíciója: 


P(x) 
96) 





KI(P,0)— )PCg)log 
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25.2. 














25.3. 


25.4. 


(c) Melyek a KL divergencia értékei az (a)-beli eloszlások és a valódi posterior 
között? 

(d) Milyen változtatást hajtana végre a feladat szövegezésén (nem az algorit- 
muson!) annak érdekében, hogy garantáljuk a fenti specifikus becslő torzí- 
tatlanságát még véges N-ekre is? Legalább két különböző megoldást adjon 
(mindkettőnek elégségesnek kell lennie). 


Alkalmazza egy pásztázó távolságmérővel ellátott szimulált robot esetében a 
Monte Carlo-helymeghatározási algoritmust. A rácstérkép és a távolságadatok 
elérhetők az aima.cs.berkeley.edu kódtárából. A megoldás akkor teljes, ha be- 
mutatja a robot sikeres globális helymeghatározását. 


Vegyük a 25.12. ábrán látható robotkart. Tegyük fel, hogy a robot alapja 60 cm 
hosszú, a felkarja és az alkarja pedig egyaránt 40-40 cm. Ahogy a 25.4. al- 
fejezetben beláttuk, az inverz kinematikai feladat megoldása sokszor nem egy- 
értelmű. Állítson fel egy explicit, zárt alakú megoldást az inverz kinematikára 
erre a robotkarra. Pontosan milyen feltételek mellett egyértelmű a megoldás? 


Implementáljon egy algoritmust, amely kiszámítja egy tetszőleges (n x H-es 10- 


tiágz? gikai tömbbel) adott 2D környezet Voronoi-diagramját. Illusztrálja algorítmusát 


25.§. 


a Voronoi-diagram felrajzolásával 10 érdekes térképen. Mekkora az algoritmus 
komplexitása? 


Ez a feladat feltárja a kapcsolatot a munkatér és a konfigurációs tér között, a 

25.25. ábra példáit használva. 

(a) "Vegyük a 25.25. (a)-tól (c)-ig látható robotkonfigurációkat, nem véve figye- 
lembe a diagramokon feltüntetett akadályokat. Rajzolja fel az ezeknek meg- 
felelő robotkar-konfigurációkat a konfigurációs térben. (Segítség: minden 
egyes karkonfiguráció egyetlen pontra képződik le a konfigurációs térben, 
ahogy ezt a 25.12. (b) ábra is mutatja.) 

(b) Rajzolja meg a konfigurációs teret a 25.25. (a)-(c) ábrákon látható minden 
egyes munkatérdiagramra. (Segítség: a konfigurációs terek megegyeznek 
a 25.25. (a) ábrán lévővel, ami a robot önmagával való ütközését jelentő 
területet illeti, de különbségek adódnak a terület határát jelentő akadályok 
hiányából és az egyes ábrákon lévő akadályok különböző helyzetéből.) 

(c) A 25.25. (e)-4f) ábrákon látható fekete pontok mindegyikéhez rajzolja meg 
a hozzá tartozó konfigurációt a munkatérben. Az árnyékolt részeket hagyja 
figyelmen kívül. 

(d) A 25.25. (e)-(f) ábrákon látható konfigurációs terek mindegyikét egy-egy 
különálló (a munkatérben lévő) akadály generálta (ez a sötétebb terület), 
valamint azok a megszorítások, amelyek a robot önmagával való ütközésé- 
ből erednek (a világosabb árnyalat). Rajzolja meg mindkét diagramhoz a 
sötét területnek megfelelő akadályt a munkatérben. 

(e) A 25.25. (d) ábra azt mutatja be, hogy egyetlen síkbeli (lapos) akadály két 
elválasztott részre tudja bontani a konfigurációs teret. Maximum hány elvá- 
lasztott részre tudja bontani az egybefüggő akadálymentes teret egyetlen 
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25.25. ábra. Diagram a 25.5. feladathoz 


lapos akadály behelyezése egy 2 szabadságfokos robot esetén? Adjon példát 
rá, és indokolja meg, miért nem lehetséges nagyobb számú független terület 
kialakítása. Mi a helyzet, ha nem lapos az akadály? 


25.6. Vegyük a 25.26. ábra egyszerűsített robotját. Tegyük fel, hogy a robot derékszö- 
gű koordinátái ismertek minden időpillanatban, mint ahogy a célhelyzet is. 
Ugyanakkor van egy akadály, amelynek a helyzete nem ismert. A robot csak a 
közvetlen környezetében képes érzékelni az akadályt, mint ahogy azt az ábra is 
illusztrálja. Az egyszerűség kedvéért tételezzük fel, hogy a robot mozgása Zaj- 
jal nem terhelt, és az állapottér diszkrét. A 25.26. ábra csak egy példa. Ebben a 
feladatban azt kérjük, hogy minden lehetséges rácsvilágra gondoljon, ahol van 
érvényes út a start pozíciótól a célig. 

(a) Tervezzen egy modellalapú vezérlőt, amely garantálja, hogy a robot min- 
dig eléri a célt, amennyiben ez lehetséges. A modellalapú vezérlő egy, a 
mozgás során fokozatosan kialakított térkép formájában képes tárolni a te- 
rep jellemzőit. A robot az egyes mozdulatok között tetszőleges időt tölthet 
gondolkodással. 

(b) Most pedig tervezzen egy reaktív vezérlőt ugyanerre a feladatra. Ez a ve- 
zérlő nem tárolhatja a korábbi érzékelések eredményeit. (Azaz nem készít- 
het térképet!) Ehelyett minden döntését az aktuális érzékelő adatai alapján 
hozza meg, amely magában foglalja a saját helyének és a cél pontos hely- 
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25.26. ábra. Egyszerűsített robot egy labirintusban. Lásd 25.6. feladat. 


25.7. 


25.8. 


zetének ismeretét. A döntéshozási időnek függetlennek kel! lennie a kör- 
nyezet méretétől, valamint a már megtett lépések számától. Maximum hány 
lépés kell a robotnak ahhoz, hogy elérje célját? 

(c) Hogy fog viselkedni az (a) és (b) pontban megtervezett vezérlő, ha az aláb- 
bi hat feltétel valamelyike fennáll: folytonos állapottér; zajjal terhelt érzé- 
kelés; zaj a mozgásban; zaj mind a mozgásban, mind az érzékelésben; a cél 
helyzete ismeretlen (csak akkor ismeri fel a célt, ha az az érzékelő hatótá- 
volságán belülre kerül); vagy mozgó akadályok vannak. Minden egyes fel- 
tételre és mindkét vezérlőre adjon egy-egy példát, amikor is a robot elbu- 
kik (vagy magyarázza el, miért nem tud). 


A 25.22. (b) ábrán kiterjesztett véges automatát használtunk a hatlábú robot 
egyetlen lábának vezérléséhez. Ebben a feladatban a cél egy olyan AFSM terve- 
zése, amely a hat külön lábhoz tartozó vezérlővel együttműködve hatékony és 
stabil mozgást eredményez. Ennek eléréséhez ki kell bővíteni az egyes lábakat 
vezérlő AFSM-eket, hogy üzeneteket is küldjenek az új AFSM-nek, és hogy 
várjanak amíg más üzenetek érkeznek. Magyarázza el, hogy miért hatékony a ve- 
zérlője, azaz miért nem fogyaszt feleslegesen energiát (pl. csúszó lábak miatt), és 
hogy miért mozgatja a robotot megfelelően nagy sebességgel! Bizonyítsa be, 
hogy vezérlője megfelel a 25.2. alfejezetben támasztott stabilitási feltételeknek. 


(Ezt a feladatot Michael Genesereth és Nils Nilsson találták ki, és az első éve- 
sektől a végzősökig mindenkinek szól.) Az emberek annyira ügyesek alap- 
feladatok elvégzésében — mint például csészék felemelése vagy dobozok egy- 
másra rakása —, hogy gyakran elfelejtik milyen összetettek ezek a mozdulatok 
valójában. A feladat során felfedezzük e feladatok komplexitását, és összefoglal- 
juk a robotika elmúlt 30 évének fejlődését. Először határozzuk meg a feladatot 
(például egy kapu készítése három dobozból), majd építsünk egy robotot négy 
emberből az alábbiak szerint: 
s — Agy: az Agy feladata a cél elérését biztosító terv kidolgozása és a kezek 
irányítása a terv megvalósítása során. Az Agy információt csak a Szemtől 
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kaphat, közvetlenül nem láthatja a helyszínt! Az Agy az egyetlen, aki tudja, 
mi a cél. 

Szem: a Szem feladata a helyszín rövid leírása az Agy számára. A munka- 
környezettől kb. egy méternyire kell lennie, és vagy kvalitatív leírást (mint 
például: , Az oldalán fekvő zöld doboz tetején egy piros doboz van"), vagy 
kvantitatív leírást (,, A zöld doboz kb. 50 cm távolságra balra van a kék hen- 
gertől") adhat. A Szem az Agytól jövő kérdésekre is válaszolhat, így példá- 
ul: , Van-e hely a Bal Kezem és a piros doboz között?" Ha van kéznél egy 
videokamera, akkor állítsuk rá a munkakörnyezetre, és a Szem ezen keresz- 
tül nézze azt, ne lássa közvetlenül! 

Kezek (Jobb és Bal): mindkét Kezet más ember játssza. A két Kéz egymás 
mellett áll. A Balkéz csak a saját balkezét használja, a Jobbkéz pedig csak 
a jobbat. A Kezek csak egyszerű, az Agytól érkező feladatokat hajthatnak 
végre. Például: , A Balkéz mozduljon 5 cm-t előre", Csak mozgásparancsot 
képesek végrehajtani — például a , vedd fel a dobozt" nem olyan parancs, 
amit a Kéz végre tud hajtani. A csalások megakadályozása végett meg- 
követelhetjük, hogy a kezeken legyen kesztyű vagy használjanak csipeszt. 
A Kezeknek bekötött szemmel kell tevékenykedniük. Egyetlen érzékelési 
képességük az, hogy meg tudják mondani, amikor útjukat valamilyen el- 
mozdíthatatlan akadály, például egy asztal vagy a másik Kéz zárja el. Ilyen 
esetben hangjelzést adhatnak az Agy informálása céljából. 


VIII. RÉSZ — 
KONKLÚZIÓK 
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Ebben a fejezetben arról esik szó, hogy mit jelent gondolkozni, vajon képesek-e erre 
a mesterséges tárgyak, és szeretnénk-e, ha képesek lennének rá. 


Ahogyan az I. fejezetben említettük, a filozófusok sokkal régebb óta vannak jelen, mint 
a számítógépek, és folyamatosan próbálnak válaszokat találni néhány olyan kérdésre, 
amely a mesterséges intelligenciához kötődik: Hogyan működik az elme? Képesek-e 
gépek intelligensen cselekedni; és ha igen, lenne-e elméjük? Milyen etikai következmé- 
nyei lehetnek az intelligens gépeknek? A könyv eddigi huszonöt fejezetében a mester- 
séges intelligencia saját kérdéseiről volt szó, most egy fejezet erejéig a filozófusok 
témáival foglalkozunk. 

Először néhány elnevezés: a filozófiában gyenge MI-hipotézisnek (weak AD) neve- 
zik azt az állítást, miszerint a gépek valószínűleg képesek intelligensen cselekedni 
(vagy jobban mondva, képesek úgy cselekedni, mintha intelligensek lennének), míg azt 
az állítást, hogy a gépek valóban intelligensen cselekszenek, erős MI-hipotézisnek 
(strong AJ) hívják. 

A legtöbb MI-kutató elfogadja a gyenge MI-hipotézist, az erőssel pedig nem törődik: 
amíg a program működik, az nem érdekes, hogy az intelligencia szimulációjának neve- 
zik-e vagy valós intelligenciának. Minden MI-kutatónak foglalkoznia kellene munkája 
etikai következményeivel. 


26.1. GYENGE MI: TUDNAK-E A GÉPEK 
INTELLIGENSEN CSELEKEDNI? 


Néhány filozófus megpróbálta bebizonyítani, hogy a mesterséges intelligencia nem 
lehetséges, azaz a gépek valószínűleg nem tudnak intelligensen cselekedni. Néhányan 
az MI-kutatás leállítását szeretnék elérni érveikkel: 


A számításorientált megközelítés kultuszának részeként űzött mesterséges intelligenciának még 
esélye sincsen arra, hogy tartós eredményeket érjen el (...) itt az ideje, hogy az MI-kutatók erő- 
feszítéseit — és a támogatásukra szánt hatalmas pénzeket — máshova tereljük, mint a számítás- 
orientált megközelítés (Sayre, 1993). 


A mesterséges intelligencia lehetséges mivolta nyilván azon múlik, miként definiáljuk. 
Lényegét tekintve a mesterséges intelligencia egy adott architektúrához a legjobb ágens- 
programot keresi. Ebben a megfogalmazásban már a definíció szerint is lehetséges az 
MI: bármely k tárbitet tartalmazó digitális architektúrához pontosan vaj ágensprogram 
tartozik; ahhoz pedig, hogy megtaláljuk a legjobbat, egyszerűen csak egyesével fel kell 
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sorolni és tesztelni az ágenseket. Ez ugyan nem lenne praktikus nagy k esetén, de a filo- 
zófia az elmélettel, nem pedig a gyakorlattal foglalkozik. 

A mesterséges intelligenciára adott definíciónk jól működik a mérnöki probléma ese- 
tében is, ahol egy adott architektúrához tartozó jó ágenst kell találni. Nagy a kísértés 
tehát, hogy befejezzük itt ezt a szakaszt, és igenlő választ adjunk a címben feltett kér- 
désre. A filozófusok azonban két architektúrát akarnak összehasonlítani: az embert és 
a gépet. Ráadásul a hagyományosan feltett kérdés így hangzik: ,.Tudnak-e a gépek 
gondolkodni?" Sajnos ez egy helytelenül feltett kérdés. Hogy megértsük, miért, néz- 
zük az alábbi kérdéseket: 


s Tudnak a gépek repülni? 
s Tudnak a gépek úszni? 


A legtöbb angolul beszélő ember! egyetért abban, hogy az első kérdésre igennel kell fe- 
lelni: a repülőgépek tudnak repülni; de a második kérdésre az angolban a válasz nemleges: 
a hajók és a tengeralattjárók haladnak ugyan a vízben, de az angolban ezt nem nevezik 
úszásnak. Sem ezeknek a kérdéseknek persze, sem a válaszoknak nincsen semmilyen ha- 
tása a tengerészek, a tengerészeti mérnökök vagy az ezekkel a dolgokkal bármilyen kap- 
csolatba kerülők mindennapi munkájára. A válaszoknak alig van közük a repülőgépek és 
tengeralattjárók tervezéséhez és képességeihez; inkább arról szólnak, hogy a szavak hasz- 
nálatának milyen módjait választottuk ki. Úgy alakult, hogy az , úszni" szó az angolban azt 
jelenti, hogy "testrészeinek mozgásával előrehalad a vízben", míg a , repülni" szó jelentése 
az angolban nem határozza meg a helyváltoztatás módját? A , gondolkodó gépek" gya- 
korlati lehetősége még csak mintegy ötven éve jelent meg, és ez az idő nem volt elég az 
angolul beszélőknek, hogy a , gondolkodni" szó az angolban új jelentést kapjon. 

Alan Turing azt javasolta Computing Machinery and Intelligence c. híres cikkében 
(Turing, 1950), hogy ne azt kérdezzük, tudnak-e a gépek gondolkodni, hanem azt vizs- 
gáljuk, hogy átmennek-e a gépek egy viselkedési intelligenciateszten, amelyet később 
Turing-tesztnek neveztek el. A teszt szerint a programnak öt percen át kell (gépelt 
online üzenetekkel) beszélgetnie egy kérdezővel. A kérdezőnek ezután választania kell, 
hogy egy programmal vagy egy személlyel beszélgetett-e, és egy program akkor felel 
meg a teszten, ha az idő 3096-ában megtéveszti a kérdezőt. Turing azt a sejtést fogal- 
mazta meg, hogy 2000-re egy 10? táregységből álló számítógépet be lehet úgy progra- 
mozni, hogy megfeleljen a teszten, ámde nem lett igaza. Az ugyan megtörtént már, 
hogy néhány embert öt percig becsaptak; például az ELIZA program és az MGONZ 
internetes csevegőrobot becsapott olyan embereket, akik nem gondoltak arra, hogy 
talán egy programmal beszélhetnek, és az ALICE program becsapott egy zsűritagot a 
2001-es Loebner-díjért zajló versenyben. De egyetlenegy program sem került annak 
közelébe, hogy 309-ot érjen el képzett zsűrivel szemben, és az MI-kutatás egésze nem 
is szentel túl nagy figyelmet a Turing-teszteknek. 

Turing az intelligens gépek lehetősége ellen felhozható érvek széles választékát is 
megvizsgálta, beleértve szinte minden olyan ellenérvet, amely a cikk megjelenése óta 
eltelt fél évszázadban felmerült. A következőkben ezek közül nézünk meg néhányat. 


) A kérdések eredeti formája és így az elemzés tárgya az angol nyelv. (A ford.) 
Az orosz nyelvben az úszni" megfelelője hajókra is vonatkozik. A magyar , úszni" ige is vonatkozhat 
hajókra, sőt, ismét csak az angoltól eltérően, még felhőkre is. (A ford.) 
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A képesség hiányából vett érv 


A , képesség hiányából vett érv" azzal a követeléssel lép fel, hogy , a gépek sohasem 
képesek X-et tenni". Az X-ekre Turing a következő példákat hozza: 


Kedvesnek, találékonynak, szépnek és barátságosnak lenni, kezdeményezni, humorérzéket mutatni, 
megkülönböztetni a helyest a helytelentől, hibákat követni el, szerelmesnek lenni, élvezni a tejszínes 
epret, elérni, hogy valaki szerelmes legyen belé, tapasztalatból tanulni, helyesen használni a szava- 
kat, saját gondolatai alanyának lenni, annyira változatosan viselkedni, mint az ember, valami igazán 
újat tenni. 





Turingnak az intuícióját kellett használnia, hogy megsejtse, mi válhat lehetségessé a jö- 
vőben, mi azonban abban a kényelmes helyzetben vagyunk, hogy visszanézhetünk 
a számítógépek eddigi teljesítményére. Senki sem tagadja, hogy a számítógépek ma sok 
olyan dolgot megtesznek, amely korábban kizárólag az emberekhez tartozott. A prog- 
ramok sakkoznak, dámát vagy más játékokat játszanak, alkatrészeket vizsgálnak gyár- 
tósorokon, a szövegszerkesztéskor ellenőrzik a helyesírást, helikoptereket és autókat 
irányítanak, betegségeket diagnosztizálnak és több száz más tevékenységet végeznek 
éppolyan jól, vagy még jobban, mint az emberek. A számítógépek kicsiny, de jelentős 
felfedezéseket tettek a csillagászatban, a matematikában, a kémiában, az ásványtanban, 
a biológiában, a számítástudományban és más területeken. Ezekhez a felfedezésekhez 
az emberi szakértőhöz hasonló szintű teljesítményekre volt szükség. 

Annak fényében, amit most tudunk a számítógépekről, nem meglepő, hogy jól telje- 
sítenek a sakkhoz hasonló kombinatorikai problémákban. De az algoritmusok az ember- 
hez mérhető szinten hajtanak végre olyan tevékenységeket is, amelyek látszólag emberi 
döntést igényelnek, amelyek során, mint Turing mondta, képesnek kell lenni a , tapasz- 
talatból tanulni" és , megkülönböztetni a helyest a helytelentől". Még egészen korán, 
1955-ben Paul Meehl (lásd még Grove és Meehl, 1996) képzett szakértők döntéshoza- 
tali folyamatát tanulmányozta olyan szubjektív esetekben, mint például hogy egy diák 
elvégez-e egy képzési programot, vagy egy bűnöző visszaesik-e. A megvizsgált 20 eset 
közül 19-nél Meehi azt találta, hogy egyszerű statisztikai tanulási algoritmusok (mint 
például a lineáris regresszió vagy a naiv Bayes-tanulás) jobb előrejelzéseket adnak, mint 
az emberi szakértők. Az Educational Testing Service a GMAT-vizsga esszékérdéseinek 
millióit osztályozza 1999 óta egy automatizált programmal. A program osztályzata az 
osztályzást végző emberek minősítésével az esetek 9796-ában egyezik meg, és ez az 
arány hasonló ahhoz, amennyire a különböző emberek által adott minősítések meg- 
egyeznek (Burstein és társai, 2001). 

Világos, hogy sok mindent, köztük olyan dolgokat is, amelyekhez általános meggyő- 
ződésünk szerint komoly emberi éleselméjűség és értelem szükséges, a számítógépek 
ugyanolyan jól el tudnak végezni, mint az emberek, vagy akár még jobban is. Ez per- 
sze nem jelenti azt, hogy a számítógépek éleselméjűséget és értelmet tanúsítanának az 
ilyen dolgok végrehajtásakor: ezek nem részei viselkedésüknek (erről a kérdésről majd 
máshol beszélünk), hanem inkább arról van szó, hogy gyakran téves az első feltételezé- 
sünk az adott tevékenység elvégzéséhez szükséges mentális folyamatról. Ugyanakkor 
az is igaz, hogy számtalan feladatban a számítógépek (finoman szólva) nem járnak az 
élen, és ilyen Turing feladata, a nyíltvégű beszélgetések folytatása is. 
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A matematikai ellenvetés 


Turing (Turing, 1936) és Gödel (Gödel, 1931) munkássága révén közismert, hogy 
egyes matematikai kérdések elviekben is megválaszolthatatlanok bizonyos formális 
rendszerekben. A leghíresebb példa erre Gödel nemteljességi tétele (lásd 9.5. alfeje- 
zet). Ez, röviden összefoglalva, azt mondja ki, hogy bármely F formális rendszerben, 
amelyben az aritmetika megfogalmazható, lehetséges egy G(F) Gödel-mondatot 
konstruálni, amelyre igaz, hogy 


s G(F) egy mondat F-ben, de F-en belül nem bizonyítható. 
s Ha F konzisztens, akkor G(F) igaz. 


Egyes filozófusok, mint például J. R. Lucas (Lucas, 1961) állítása szerint ez a tétel azt 
bizonyítja, hogy a gépek mentálisan alsóbbrendűek az embereknél, mert a gépeket mint 
formális rendszereket korlátozza a nemteljességi tétel (nem tudják megállapítani 
a saját Gödel-mondatuk igazságát), az embereket viszont ilyesmi nem korlátozza. Ez az 
állítás évtizedes, sok könyvet felölelő vitát keltett, például a matematikus Sir Roger 
Penrose két könyvében (Penrose, 1989; 1994) képviseli ezt az állítást kicsit megcsavar- 
"va (például azzal a feltételezéssel, hogy az emberek azért különböznek, mert agyukat a 
kvantumgravitáció működteti). Három problémát fogunk az állítással kapcsolatban 
megvizsgálni. 

Először is Gödel nemteljességi tétele csak olyan formális rendszerekre vonatkozik, 
amelyek elég erősek az aritmetikához. Ezek közé tartozik a Turing-gép ís, és Lucas állí- 
tása részben azon a feltételezésen alapul, hogy a számítógépek Turing-gépek. Ez jó 
közelítés, ám nem teljesen igaz. A Turing-gépek végtelenek, a számítógépek azonban 
végesek, és ezért bármely számítógépet le lehet írni egy nagyon nagy logikai állítás- 
rendszerrel, amelyre már nem vonatkozik Gödel nemteljességi tétele. 

Másodszor is egy ágensnek nem kell túlzottan szégyenkeznie amiatt, hogy egyes állí- 
tások igazságát, másoktól eltérően, ő nem tudja eldönteni. Nézzük például a következő 
mondatot: 


1. R. Lucas nem tudja konzisztensen azt állítani, hogy ez a mondat igaz. 


Lucas ellentmondana önmagának, ha azt állítaná, hogy a fenti (teljes) mondat igaz, 
tehát Lucas nem tudja ezt a mondatot konzisztensen állítani, tehát a mondat mindenkép- 
pen igaz. (A mondat nem lehet hamis, mert ha hamis volna, akkor Lucas nem tudná 
konzisztensen állítani, tehát igaz lenne.) Bebizonyítottuk tehát, hogy van egy mondat, 
amelyet Lucas nem tud konzisztensen állítani, mások viszont (beleértve a gépeket is) 
igen. De ez előttünk semmit sem von le Lucas értékéből. Egyetlenegy ember sem tud- 
ja, hogy egy másik példát vegyünk, élete során kiszámítani tízmilliárd tízjegyű szám 
összegét, egy számítógép viszont másodpercek alatt megteszi ezt. Mégsem tartjuk ezt 
az emberi gondolkodási képesség alapvető korlátjának. Évezredeken át, mielőtt felfe- 
dezték volna a matematikát, az emberek ugyanúgy intelligens viselkedést tanúsítottak, 
nem valószínű hát, hogy a matematika a periferiálisnál fontosabb szerepet játszana az 
intelligencia meghatározásában. 

Harmadszor és legfőképpen, még ha el is fogadjuk, hogy a számítógépek bizonyítá- 
si képessége korlátozott, semmi sem bizonyítja, hogy az emberek mentesek lennének 
az ilyen korlátozásoktól. Túlzottan is egyszerű szigorúan bebizonyítani, hogy egy for- 
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mális rendszer képtelen X-re, majd minden további bizonyíték nélkül azt állítani, hogy 
az emberek a maguk nem formális módján képesek erre az X-re. Azt, hogy az emberek 
nincsenek alávetve Gödel nemteljességi tételének, valóban lehetetlen bebizonyítani, 
mert bármely szigorú bizonyításnak tartalmaznia kellene az állítás szerint formalizálha- 
tatlan emberi tehetség egy formalizálását, tehát a bizonyítás önmagát cáfolná meg. 
Lehet még fellebbezni az intuícióhoz, miszerint az emberek valamilyen módon képesek 
a matematikai belátás emberfeletti cselekedeteire. Ezt a fordulatot fejezik ki az olyan 
érvek, mint például , feltételeznünk kell önnön konzisztenciánkat, hogy a gondolkodás 
egyáltalán lehetséges legyen" (Lucas, 1976). De ha bármiről is, akkor az emberi gondol- 
kodásról mindenképpen tudjuk, hogy inkonzisztens. Ez egyértelműen igaz a mindennapi 
érvelésünkre, de vonatkozik még az elővigyázatos matematikai gondolkodásra is. Híres 
példa erre a négyszín-probléma. 1879-ben Alfred Kempe közzétett egy bizonyítást, 
amelyet széles körben elfogadtak, és amely hozzájárult, hogy a Royal Society tagjává 
választották. 1890-ben azonban Percy Heawood egy hibát fedezett fel a bizonyításban, 
és egészen 1977-ig senki nem tudta a tételt bebizonyítani. 


A meghatározatlanságból vett érv 


A mesterséges intelligencia vállalkozásának legnagyobb hatású és legmakacsabb kríti- 
káját Turing úgy mutatta be, mint ,a viselkedés meghatározatlanságából származó 
érvet", Az állítás lényege az, hogy az emberi viselkedés túl komplex ahhoz, hogy egy 
szabálykészlettel le lehessen írni, és mivel a számítógépek semmi másra nem képesek, 
csak szabályok követésére, ezért nem tudnak az emberekhez hasonló intelligens viselke- 
dést létrehozni. Azt, hogy logikai szabályok egy halmazával képtelenség mindent leírni, 
a mesterséges intelligenciában kvalifikációs problémának (gualification problem) 
nevezik (lásd 10. fejezet). 

Ezt a nézetet főként a filozófus Hubert Dreyfus képviselte, aki számos befolyásos 
MI-kritika szerzője: What Computers Can"t Do (Dreyfus, 1972); What Computers Still 
Can"t Do (Dreyfus, 1992), valamint a testvérével, Stuarttal, közösen írt Mind Over 
Machine (Dreyfus és Dreyfus, 1986). 

Azt az álláspontot, amit kritizáltak, Haugeland (Haugeland, 1985) nyomán elkezdték 
, Jófajta, régivágású MI"-nek nevezni (angol rövidítéssel: GOFAI). A GOFAI azt feltéte- 
lezné, hogy minden intelligens viselkedés megragadható egy olyan rendszerrel, amely 
a tárgyterületet leíró tények és szabályok halmazaiból kiindulva logikai következtetést 
végez. Ezért a GOFAI a 7. fejezetben leírt legegyszerűbb logikai ágensnek felel meg. 
Dreyfusnak igaza van abban, hogy a logikai ágensek ki vannak téve a kvalifikációs prob- 
léma veszélyének. Amint a 13. fejezetben láttuk, a nyílt tárgyterületekhez sokkalta meg- 
felelőbbek a valószínűségi következtető rendszerek. Dreyfus kritikája tehát nem per se 
a számítógépek, hanem csak a programozás egy meghatározott módja ellen irányul. 
Okkal feltételezhetjük persze, hogy nem lenne túl nagy hatású egy könyv Amire az 
elsőrendű logikai szabályalapú, nem tanuló rendszerek képtelenek címmel. 

Dreyfus nézete szerint az emberi szakértelemnek ugyan része néhány szabály ismere- 
te, de ezek csak , holisztikus kontextust" vagy ,.hátteret" alkotnak az emberi tevékeny- 
séghez. Példaként az ajándék adásakor és fogadásakor illő társas viselkedést hozza fel: 
, Általában az ember a megfelelő körülmények között úgy reagál, hogy egy megfelelő 
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ajándékot ad." Az embernek láthatólag , közvetlen érzéke van ahhoz, hogy miként tör- 
ténnek a dolgok, és mit lehet elvárni." Hasonló állítást tehetünk a sakkjáték vonatko- 
zásában is: ,Egy átlagos sakkmesternek lehet, hogy gondolkodnia kell azon, mit 
tegyen, de egy nagymester látja, hogy a tábla egy bizonyos lépést követel (...) a he- 
lyes reakció egyszerűen csak beugrik a fejébe." Minden bizonnyal igaz, hogy egy 
ajándékozó vagy egy sakknagymester gondolati folyamata azon a szinten zajlik, amely 
rejtett a tudatos elme önismerete elől. Ez azonban nem jelenti, hogy ez a gondolati fo- 
lyamat nem létezik. Lényeges, hogy Dreyfus nem válaszolja meg azt, hogy a helyes 
lépés miként kerül a nagymester fejébe. Mindez Daniel Dennett (Dennett, 1984) meg- 
jegyzésére emlékeztet: 


Ez olyan, mintha a filozófusok azt tartanák magukról, hogy szakértő magyarázói a színpadi bűvé- 
szek trükkjeinek, aztán, amikor megkérdezzük tőlük, hogy milyen trükköt használnak a bűvészek 
a nő kettéfűrészelésénél, akkor azt a magyarázatot adják, hogy mindez nagyon is világos: a bűvész 
nem fűrészeli ketté a nőt, ezt csak színleli. Ha azt kérdezzük azonban: , Mégis hogyan színlelí?", a 
filozófusok ezt felelik: , Nem ránk tartozik." 


A két Dreyfus (Dreyfus és Deyfus, 1986) vázolja a szakértelem ötlépcsős elsajátításának 
folyamatát, kiindulva a hasonló szabályalapú feldolgozásból (ahogyan az a GOFAI-ban ís 
szerepel) eljutva a helyes reakció azonnali kiválasztásának képességéhez. A szerzők ez- 
zel a javaslattal tulajdonképpen az MI kritikusaiból az MI elméletalkotóivá válnak: egy 
, eset-könyvtárakba" szervezett neurálisháló-architektúrát vázolnak fel, azonban rámu- 
tatnak néhány problémára is. Ezeket a problémákat szerencsére már mind célba vette 
az MI-kutatás néhányukat részleges, másokat pedig teljes sikerrel oldva meg. Nézzünk 
néhány ilyen problémát: 


1. Háttértudás nélkül nem lehet jól példákból általánosítani. Azt állítják, senki sem tud- 
ja, miként lehetne a háttértudást beépíteni a neuronhálók tanítási folyamatába. Pedig, 
amint a 19. fejezetben mi is láttuk, léteznek módszerek az a priori tudás felhasználá- 
sára a tanítási folyamat során. Ezek a módszerek persze a tudás explicit megadásán 
alapulnak, amelynek lehetőségét a szerzőpáros elszántan tagadja. Nézetünk szerint 
ez a probléma erős indok a neurális feldolgozás jelenlegi modelljeinek olyan újra- 
tervezésére, amely már a többi tanuló algoritmushoz hasonlóan képes lesz felhasz- 
nálni a korábban megtanult tudást. 

2. A neurális hálók tanulása a felügyelt tanulás egyik formája (lásd 18. fejezet), amely 
igényli, hogy előzetesen azonosítsuk a releváns bemeneteket, valamint a megfelelő 
kimeneteket. Ezért azt állítják, hogy nem is képesek ezek a hálózatok autonóm módon, 
emberi betanítás nélkül üzemelni. Valójában a nem ellenőrzött tanulás (unsupervi- 
sed learning) (lásd 20. fejezet) és a megerősítéses tanulás (reinforcement learning) 
(lásd 21. fejezet) éppen a tanító nélküli tanulást teszi lehetővé. 

3. A tanuló algorítmusok nem teljesítenek jól sok jellemző esetén, viszont ha kijelöljük 
a jellemzők egy halmazát, , nem ismeretes olyan módszer, amellyel új jellemzőket 
illeszthetünk be, ha a jelenlegiek nem lennének elegendők a megtanult tényekhez", 
valójában új eljárások, mint például a szupport vektor gépek, jól megbirkóznak a nagy 
jellemzőhalmazokkal is. A 19. fejezetben pedig láthattuk, hogy alapjaikat tekintve 
léteznek módszerek az új jellemzők bevezetésére, habár még sok tennivaló akad ezen 
a területen. 
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4. Az agy képes a szenzorait releváns információk keresésére irányítani, és képes kinyer- 
ni az információkból azt, ami releváns az adott szituációban. Ezzel szemben , jelenleg 
egyetlen részletét sem értjük ennek a működésmódnak - állítják —, és még csak olyan 
hipotézist sem tudunk alkotni róluk, amely útmutatásul szolgálhatna az MI-kutatók- 
nak". Valójában az aktív látás területe, amelyet az információérték-elmélet (lásd 16. 
fejezet) alapoz meg, éppen hogy a szenzorok irányításának problémájával foglalkozik, 
és az elért elméleti eredmények egy részét már át is ültették robotmegvalósításokba. 


Összegezve azt mondhatjuk, hogy számos olyan kérdés, melyet Dreyfus felvetett — a köz- 
napi háttértudás, a kvalifikáció probléma, a bizonytalanság kezelése, a tanulás, a döntés- 
hozatal előre lefordított módjai, annak fontossága, hogy ne testetlen következtetőgépeket 
tekintsünk, hanem szituációjukba ágyazott ágenseket —, ma már bekerült az intelligens 
ágensek tervezésének szokványos menetébe. Véleményünk szerint mindez tehát nem a 
mesterséges intelligencia lehetetlenségét, hanem éppen a fejlődését bizonyítja. 


26.2. ERŐS MI: TUDNAK-E TÉNYLEGESEN 
GONDOLKODNI A GÉPEK? 


Több filozófus álláspontja szerint egy Turing-teszten átmenő gép nem gondolkodna 
ténylegesen, csupán szimulálná a gondolkodást. Ezt az ellenvetést is előre látta Turing. 
Geoffrey Jefferson (Jefferson, 1949) professzor egy beszédét idézi: 
Amíg nem képes egy gép egy szonettet írni vagy egy zenei versenyművet komponálni, pusztán 
a gondolatai és az érzései alapján, és nem szimbólumok véletlen alakulása folytán, addig nem fogunk 
beleegyezni, hogy egy gép egyenlő lehet az aggyal; ehhez az kell, hogy ne csupán megírja, de tudja 
is, hogy megírta. 


Ezt nevezi Turing tudatossági (consciousness) érvnek: a gépnek saját mentális állapo- 
tainak és cselekvéseinek tudatában kell lennie. Ugyan a tudatosság fontos témakör, 
Jefferson megállapítása azonban lényegileg a fenomenológiához (phenomenology), a 
közvetlen tapasztalat tudományához kötődik: a gépnek ténylegesen éreznie kell az érzé- 
seit. Más szerzők az intencionalitásra (intentionality) koncentrálnak, ami azt kérdezi, 
hogy a gép feltételezett hiedelmei, vágyai és más reprezentációi ténylegesen valamilyen 
valósvilág-beli dologra , vonatkoznak"-e. 

Figyelemre méltó Turing válasza erre az ellenvetésre. Felhozhatott volna érveket 
amellett, hogy a gépek valóban rendelkezhetnek tudattal (avagy viszonyulhatnak feno- 
menológiailag, illetve viselkedhetnek intencionálisan). Ehelyett Turing úgy érvel, hogy 
ez a kérdés éppen úgy rosszul lett megfogalmazva, mint a ,Tudnak-e a gépek gondol- 
kodni?" kérdés. Ráadásul miért kellene erősebb kritériumokat várni el a gépek eseté- 
ben, mint az embereknél? A mindennapi életben végső soron nincsen semmilyen 
közvetlen bizonyítékunk a többi ember belső mentális állapotairól. Mégis, amint Turing 
rámutat, , ahelyett hogy állandóan erről vitatkoznánk, azzal az udvarias feltételezéssel 
(polite convention) élünk, hogy mindenki képes gondolkodni". 

Azonban Turing szerint Jefferson hajlandó lenne ezt az udvarias feltételezést a 
gépekre is kiterjeszteni, ha találkozna intelligensen cselekvő gépekkel. Az alábbi dialó- 
gust idézi, amely annyira beépült a mesterséges intelligencia szájhagyományába, hogy 
egyszerűen nem hagyhattuk ki: 
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EMBER: Szonetted első sorában, mely úgy hangzik, hogy , hasonlítanálak téged a nyári naphoz", nem 
lenme legalább ugyanolyan jó, ha , tavaszi nap" szerepelne? 

GÉP: Nem jönne ki az ütem. 

EMBER: De ha , téli nap" lenne? Ez ütemre ugyanolyan jó. 

GÉP: Persze, de hát senki sem szeretné, ha egy téli naphoz hasonlítanák. 

EMBER: Mondanál olyat, hogy Pickwick úr a karácsonyra emlékeztet téged? 

GÉP: Bizonyos értelemben igen. 

EMBER: A karácsony viszont egy téli nap, és én nem gondolom, hogy Pickwick úrnak ellenére lenne 
az összehasonlítás. 

Gép: Nem hiszem, hogy ezt komolyan gondolod. A téli nap alatt egy átlagos téli napot szokás érteni, 
nem pedig egy olyan különlegeset, mint a karácsony. 


Azt ugyan elismeri Turing, hogy a tudatosság megmagyarázása nehéz kérdés, de tagad- 
ja, hogy bármi jelentősége is volna a mesterséges intelligencia gyakorlata számára: 
, Nem szeretném azt a benyomást kelteni, miszerint úgy gondolnám, hogy a tudatosság- 
ban ne volna semmi rejtélyes elem. (...) De nem gondolom azt, hogy ezeket a rejtélye- 
ket meg kellene oldani ahhoz, hogy meg tudjuk válaszolni a cikkemben tárgyalt kérdé- 
seket." Egyetérthetünk Turinggal, hiszen az a fontos számunkra, hogy intelligensen 
viselkedő programokat készítsünk, nem pedig az, hogy mások azt vajon szimulált vagy 
valóságos intelligenciának tartják. Persze másfelől sok filozófusnak igencsak fontos ez 
a kérdés. Ezt megvilágítandó vegyük szemügyre, hogy más eseteken mennyire tartják 
valóságosnak az ember készítette tárgyakat. 

A mesterséges karbamidot 1828-ban sikerült először előállítania Fredrick Wöhlernek. 
A szintézis fontosságát az adta, hogy bizonyítékot szolgáltatott a szerves és szervetlen ké- 
mia akkortájt sokak által vitatott egységére. A vegyület előállítása után a kémikusok 
egyetértettek abban, hogy a mesterséges karbamid valódi karbamid, hiszen az összes 
megfelelő fizikai jellemzőben megegyeznek. Ehhez hasonlít, hogy a mesterséges édesítő- 
ket ugyanúgy édesítőknek nevezzük, és a mesterséges megtermékenyítés (a mesterséges 
intelligencia másik módja) ugyanolyan megtermékenyítés. Azonban a mesterséges 
virágok nem virágok, és, amint Daniel Dennett rámutat, a mesterséges Chateau Latour 
bor sem lenne a különleges Chateau Latour francia bor, még akkor sem, ha kémiailag 
megkülönböztethetetlen volna, mivel nem a rögzített helyen (a francia Bordeaux-i bor- 
vidéken) és nem a rögzített módon készült. Ugyanígy egy mesterséges Picasso-fest- 
mény — akárhogy is néz ki — nem volna igazi Picasso-festmény. 

Megállapíthatjuk tehát, hogy bizonyos esetekben az ember készítette tárgy viselke- 
dése fontos, más esetekben pedig a származása. Úgy látszik, megállapodás kérdése, 
hogy melyik esetben melyiket tartjuk fontosnak. Mesterséges elmék esetében nincsen 
ilyen megállapodás, így az intuíciónkra kell hagyatkoznunk. Egy filozófus, John Searle 
(Searle, 1980), elég határozott intuícióval rendelkezik: 


Senki sem gondolja, hogy egy vihar számítógépes szimulációjától eláznánk. (...) Mi visz rá tehát 
embereket annak feltételezésére, hogy a mentális folyamatok számítógépes szimulációja mentális 
folyamatokat mutatna fel? (37—38. oldal) 


Könnyen elfogadható persze, hogy a viharok számítógépes szimulációi senkit sem áz- 
tatnak el, az azonban kevésbé látható, miként lenne alkalmazható ez az analógia a men- 
tális folyamatok számítógépes szimulációira. Hiszen amikor Hollywoodban locsolók és 
szélgépek segítségével szimulálják a vihart, eláznak a színészek. A legtöbben határo- 
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zottan összeadásnak tartják az összeadás számítógépes szimulációját, és a sakkjáték 
számítógépes szimulációja is sakkjáték. A mentális folyamatok vajon a viharokhoz 
hasonlíthatók-e, vagy inkább az összeadáshoz és a sakkhoz? Olyanok, mint a Chateau 
Latour bor és Picasso, vagy mint a karbamid? Ez teljes egészében azon múlik, hogy 
milyen elméletet vallunk a mentális állapotokról és folyamatokról. 

A funkcionalizmus (functionalism) szerint a mentális állapotok köztes kauzális fel- 
tételek a bemenetek és a kimenetek között. A funkcionalista elmélet szerint ha két rend- 
szer izomorf kauzális folyamatokkal rendelkezik, akkor ugyanazok a mentális állapotai 
is. Egy számítógépes programnak tehát ugyanolyan mentális állapotai lehetnek, mint 
egy embernek. Azt persze még nem határoztuk meg, hogy az , izomorf" pontosan mit 
jelent, de azt tételezzük fel, hogy létezik egy olyan absztrakciós szint, ami fölött nem 
számít a specifikus implementáció; és ha a folyamatok eddig a szintig izomorfak, akkor 
ugyanazok lesznek a mentális állapotok is. 

Ezzel szemben a biológiai naturalizmus (biological naturalism) szerint a mentális 
állapotok magas szintű emergens tulajdonságok, amelyeket a neuronok alacsony szin- 
tű neurológiai folyamatai okoznak, azaz a neuronok (meghatározatlan) tulajdonságai 
a lényegesek. A mentális állapotokat így tehát nem lehet duplikálni valamilyen prog- 
rammal, amelynek azonos a bemenet-kimenet funkcionális struktúrája, hanem az is 
szükséges, hogy a program olyan architektúrán fusson, amelynek kauzális erői meg- 
egyeznek a neuronokéval. Az elmélet nem mond semmit arról, hogy a neuronok miért 
rendelkeznek ilyen kauzális erővel, és arról sem, hogy más fizikai megtestesülések ren- 
delkezhetnek-e ezekkel az erőkkel. 

A két álláspont megvizsgálásához vegyük szemügyre először az elmefilozófia leg- 
régibb problémáját, majd pedig három gondolatkísérletet. 


A test-elme probléma 


A test-elme probléma (mind-body problem) azt kérdezi, hogy a mentális állapotok és 
folyamatok miként kapcsolódnak a testi (specifikusan az agyi) állapotokhoz és folyama- 
tokhoz. Ezt a kérdést, mintha nem lenne elég nehéz, általánosítani fogjuk az , architektú- 
ra-elme" problémává, hogy az elmével rendelkező gépek lehetőségéről beszélhessünk. 

Egyáltalán mi a probléma a test-elme problémában? Az első nehézség René 
Descartes-ra vezethető vissza, aki egy nem halandó lélek interakcióját vizsgálta egy ha- 
landó testtel, és egy dualista (dualist) elméletet állított fel, miszerint a lélek és a test 
két különböző típusú dolog. A monista (monsit), gyakran materialista (materialism) 
névvel is illetett elmélet szerint nincs olyan dolog, hogy halhatatlan lélek, hanem 
csupán az anyagi objektumok léteznek. Ennek megfelelően a mentális állapotok (mint 
például a fájdalom, a lovaglás tudata vagy az a meggyőződés, hogy Bécs Ausztria fővá- 
rosa) csupán agyállapotok. Ezt az elméletet John Searle egy tömör szlogenben foglalta 
össze: , Az agy okozza az elmét." 

A materialistának legalább két komoly ellenvetéssel kell szembesülnie. Az első 
a szabad akarat (free will) problémája: hogyan lehetséges, hogy egy tisztán fizikai 
elme, amelynek minden átalakulását szigorú fizikai törvények irányítják, mégis megőr- 
zi a döntés szabadságát? A legtöbb filozófus szerint ez a probléma ahelyett, hogy a ma- 
terializmusnak jelentene kihívást, inkább a szabad akaratról alkotott naiv fogalmunk 
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gondos újraalkotását igényli. A második probléma a tudatosság (consciousness) általá- 
nos témaköréhez kapcsolódik (a probléma hasonló, mint a megértés (understanding) 
és az öntudat (self-awareness) kérdései, habár nem teljesen ugyanarról van szó). 
A kérdés egyszerűen ez: miért van, hogy bizonyos agyállapotokkal rendelkezni valami- 
féle érzés, viszont másfajta fizikai állapotokkal rendelkezni (például sziklának lenni) 
feltehetően nem érzés. 

Abhoz, hogy elkezdhessük megválaszolni a kérdést, az agyállapotok egy olyan meg- 
fogalmazását kell megtalálni, amely absztraktabb szintű, mint az egy adott személy 
agyát alkotó atomok adott időpontbeli fizikai elhelyezkedése. Például miközben Auszt- 
ria fővárosára gondolok, agyam minden pikoszekundumban milliárd apró változáson 
megy keresztül, mégis ezek a változások nem jelentik az agyállapot kvalitatív változá- 
sát. Ennek megfelelően be kell vezetnünk az agyállapot zípusok fogalmát, amelynek se- 
gítségével elkülöníthetők a különböző típusba tartozó agyállapotok. Az egyes szerzők 
különbözőképpen értik a típus szót ebben az esetben. A legtöbbjük szerint, ha például 
veszünk egy agyat, és néhány szénatomját más szénatomra? cseréljük, a mentális állapot 
még nem változik meg. Ez azért örvendetes, mert valójában az agy atomjai az anyag- 
csere-folyamatok során állandóan cserélődnek, mégsem tűnik úgy, mintha ez nagy 
mentális felfordulást okozna. 

"Vegyük most szemügyre a mentális állapotok egy fajtáját, az intencionális állapotok- 
nak (intentional states) is nevezett ítéletlogikai attitűdöket (propositional attitudes) 
(amelyekről már szó esett a 10. fejezetben). Ezek az állapotok - mint például a véleke- 
dés, a tudás, a vágyakozás, a félelem és társai — olyanok, hogy bizonyos szempontból 
a külső világra utalnak. Az a vélekedés például, miszerint Bécs Ausztria fővárosa, egy 
bizonyos városra és annak státusára vonatkozó vélekedés. Azt fogjuk vizsgálni, hogy 
rendelkezhetnek-e a számítógépek intencionális állapotokkal, ezért hasznos áttekinteni 
ezen állapotok jellemzését. Azt is lehet mondani például, hogy az a mentális állapot, 
hogy egy hamburgerre vágyom, különbözik attól az állapottól, hogy egy pizzát szeret- 
nék, hiszen a hamburger és a pizza a valódi világ különböző tárgyai. Másfelől viszont 
amellett érveltünk éppen néhány bekezdéssel korábban, hogy a mentális állapotok agy- 
állapotok, tehát az azonosságukat meg kellene tudnunk határozni csupán , a fejen belül" 
maradva, minden hivatkozás nélkül a külső világra. A dilemma megoldásához vizsgál- 
junk meg egy olyan gondolatkísérletet, amely megpróbálja az intencionális állapotokat 
elkülöníteni a hozzájuk tartozó külső tárgyaktól. 


Az , agy a tartályban" kísérlet 


Képzeljük el — ha belebocsátkozunk ebbe a gondolatkísérletbe —, hogy az agyunkat 
születésünkkor kiveszik a testünkből, és egy csodálatos szerkezetű tartályba helyezik. 
Ez a tartály táplálja az agyat, lehetővé téve, hogy növekedjen és fejlődjön. Ugyanakkor 
azonban egy teljességgel kitalált világ számítógépes szimulációjának elektromos ingere- 
ít vezetik az agyba, az agy motorikus ingereit pedig elfogják, és hatásukra megfelelően 
módosítják a szimulációt." Ekkor az agy rendelkezhet a HalálosanVágyik(Én, Hamburger) 





3 Esetleg a szénatom más izotópjára. ahogyan ez az agyi képalkotó vizsgálatok során gyakran történik. 
Ez a helyzet ismerős lehet azoknak, akik látták az 1999-ben készült Mátrix (The Matrix) c. filmet. 
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mentális állapottal, akkor is, ha nincs is teste, amely az éhséget érezné, ízlelőbiímbói sin- 
csenek, sőt talán egyáltalán nincs is hamburger a valódi világban. Azonosnak tekintjük-e 
ezt a mentális állapotot egy testben lévő agy megfelelő mentális állapotával? 

Az egyik kiút a dilemmából annak megállapítása, hogy a mentális állapotok tartalma 
két különböző szempontból értelmezhető. A tág tartalom (wide content) nézet kép- 
viselői a mentális állapotok tartalmát a mindentudó külső megfigyelő szemszögéből 
értelmezik, amely megfigyelő átlátja az egész szituációt, és felismeri a világ különb- 
ségeit. Tehát a tág tartalom nézet szerint a tartályba helyezett agy vélekedései külön- 
bözők a , normál" személy vélekedéseitől. A szűk tartalom (narrow content) nézet 
szerint viszont csak a belső, szubjektív nézőpontot kell figyelembe venni, és szerintük 
a két vélekedés megegyezik. 

Annak a vélekedésnek, hogy a hamburger ízletes, benső természete van: van vala- 
mi, amihez az ilyen vélekedés hasonlít. Most már beléptünk a gualiák, a benső élmé- 
nyek birodalmába (a gualia szó a latin nyelvből származik, megközelítő jelentése: 
"ilyen dolgok"). Tegyük fel, hogy a retina és az idegrendszer valamilyen sérülése foly- 
tán X személy úgy érzékeli a vörös színt, mint Y a zöldet, és vice versa. Ebben az eset- 
ben ugyanúgy látják a közlekedési lámpát, és ugyanúgy is cselekszenek, de tapasztala- 
taik valamiképpen különbözni fognak. Mindketten elfogadhatják, hogy tapasztalatuk 
neve: ,a lámpa vörös", de tapasztalatuk különböző érzés lesz. Nem világos, hogy mit 
jelent ez a mentális állapotok megegyezését illetően. A következőkben egy olyan 
gondolatkísérlettel foglalkozunk, amely azt vizsgálja, hogy az emberi neuronokon kí- 
vül más fizikai tárgyaknak is lehetnek-e mentális állapotai. 


Az agyprotézis-kísérlet 


Az agyprotézis-kísérletet Clark Glymour vezette be a hetvenes évek közepén, majd 
John Searle (Searle, 1980) is finomított rajta, de manapság leginkább Hans Moravec 
(Moravec, 1988) munkásságával szokás összefüggésbe hozni. A kísérlet a következő. 
Tegyük fel, hogy a neurofiziológia eljutott odáig, hogy tökéletesen megértette az embe- 
ri agy összes neuronjának bemeneti-kimeneti jellemzőit és összekapcsolódását. Tegyük 
fel továbbá azt is, hogy képesek vagyunk olyan mikroszkopikus méretű elektronikus 
berendezéseket építeni, amelyek utánozni tudják ezeket a jellemzőket, és problémamen- 
tesen hozzáilleszthetők az idegszövethez. Végül pedig tegyük fel azt is, hogy valamilyen 
csodálatos sebészi technikával anélkül tudjuk az egyes neuronokat a megfelelő elektro- 
nikus eszközökkel helyettesíteni, hogy az agy egészében vett működése megszakadna. 
A kísérlet abból áll, hogy valaki fejében az összes neuront elektronikus eszközökkel 
helyettesítik, majd pedig a folyamat visszafordításával visszajuttatjuk az illetőt a nor- 
mális biológiai állapotába. 

A személynek mind a műtét során tanúsított külső viselkedése, mind belső tapasztala- 
tai érdekelnek minket. A kísérlet alanyának külső viselkedésének definíció szerint válto- 
zatlannak kell maradnia az operáció nélkül megfigyelhető viselkedéshez képest. A kísér- 
let alanyának azonban egyben képesnek kell lennie arra, hogy — noha a tudatosság hiányát 


5 EI tudunk képzelni egy azonos kontrollszemélyt, akin egy placebooperációt hajtanak végre, hogy a két 
viselkedést összevethessék. 
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vagy jelenlétét egy harmadik személy nehezen állapíthatja meg — beszámolót adjon a tu- 
datos tapasztalatát ért változásokról. A történtekre vonatkozó különböző intuícióink 
nyilván ellentmondanak egymásnak. Moravec szerint, aki robotkutató és funkcionalista, 
változatlan maradna a tudata. A filozófus és biológiai naturalista Searle azonban ugyan- 
ilyen erősen vallja, hogy a tudata eltűnne: 
Azt fogod észrevenni - legnagyobb megdöbbenésedre —, hogy a külső viselkedésed irányítása mint- 
egy kicsúszik a kezeid közül. Azt veszed észre, hogy például amikor az orvosok vizsgálják a látá- 
sodat, hallod őket, amint azt mondják: , Egy piros tárgyat tartunk ön előtt, kérjük, mondja el, mit 
lát." Ez a kiáltás törne ki belőled: , Semmit sem látok. Teljesen megvakulok." De hallod a saját han- 
godat, amint befolyásodtól teljesen függetlenül ezt mondja: , Egy vörös tárgyat látok magam előtt." 
(...) Tudatos tapasztalatod lassan semmivé zsugorodik, de a külső, megfigyelhető viselkedésed vál- 
tozatlan marad. (Searle, 1992) 


Mindannyian csak intuíciónk alapján tudunk érvelni. Először vegyük észre, ahhoz, 
hogy a külső viselkedés változatlan maradjon, mialatt a kísérlet alanya fokozatosan 
elveszti a tudatát, az akaratnak egyik pillanatról a másikra hirtelen és teljesen kell eltűn- 
nie; különben a tudat zsugorodása befolyásolná a külső viselkedést — például ilyesmi 
szavak hangzanának el: , Segítség, eltűnőben vagyok!" Elég valószínűtlenül hangzik 
azonban, hogy a neuronok egyenkénti lecserélése az akarat hírtelen, egyik lépésről 
Aa másikra történő teljes eltűnéséhez vezetne. 

Másodszor pedig nézzük meg, mi történik akkor, ha a kísérlet alanyát az alatt az idő 
alatt kérdezzük tudatos tapasztalatairól, amikor egyetlen igazi neuron sincs jelen az 
agyában. A kísérlet feltétele szerint olyasféle válaszokat kell kapnunk, mint , Jól érzem 
magam. Meg kell mondanom, egy kicsit meg vagyok lepődve, hiszen elhittem, amit 
Searle mondott". Vagy pedig egy mutatópálcával egy kicsit megszúrhatjuk a kísérleti 
alanyt és megfigyelhetjük válaszát: , Juj, ez fáj." Viszont normál körülmények között a 
mesterséges intelligencia programok ilyen kimeneteit a szkeptikus elutasíthatja mint 
egyszerű látszatválaszokat. Hiszen elég könnyű elképzelni egy olyan szabályt, mint 
például: , Ha a 12-es szenzoron sMagasc érték jelenik meg, adj ki vJuj!-ta. A lényeg 
azonban az, hogy mivel a normál emberi agy összes funkcionális tulajdonságát át- 
másoltuk, feltételezhetjük, hogy elektronikus agyunk nem tartalmaz ilyen látszatválasz- 
mechanizmusokat. Azaz az elektronikus agy által létrehozott tudati megnyilvánulásokra 
olyan magyarázatot kell adnunk, amely csak a neuronok funkcionális tulajdonságaira 
hivatkozik. Ennek a magyarázatnak azonban a valós agyra is vonatkoznia kell, amely- 
nek ugyanazok a funkcionális tulajdonságai. Ezért, úgy tűnik, kétfajta konklúzió lehet- 
séges. 


1. A tudat kauzális mechanizmusai, amelyek ezt a kimenetet a normális agyban létre- 
hozzák, ugyanúgy működnek az elektronikus változatban is, amely tehát tudatos. 

2. A normális agy tudatos mentális eseményeinek semmilyen kapcsolata nincs a visel- 
kedéssel, valamint nincsenek is jelen ezek az események az elektronikus agyban, 
amely tehát nem tudatos. 


A második lehetőséget ugyan nem zárhatjuk ki, de ez arra redukálná a tudatot, amit a 
filozófusok epifenomenális (epiphenomenal) szereplőnek neveznek: valami: ami meg- 
történik ugyan, de mintha nem is vetne árnyákot a megfigyelhető világban. Valamint ha 
a tudat tényleg epifenomén, akkor az agyban lennie kell egy második, nem tudatos 
mechanizmusnak, amelyhez a , Juj!" tartozik. 
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Harmadszor pedig tekintsük az operáció visszacsinálása utáni helyzetet, amikor a 
kísérlet alanyának ismét normális agya van. Emlékezzünk arra, hogy a definíció szerint 
a kísérleti alany külső viselkedésének olyannak kell lennie, mintha az operáció nem is 
történt volna meg. Ennek speciális eseteként fel kelt tudnunk tenni azt a kérdést: , Milyen 
volt az operáció alatt? Emlékszik a mutatópálcára?" A kísérleti alanynak pontos emlék- 
nyomokkal kell rendelkeznie a tudatos tapasztalatai tényleges természetéről, beleértve 
a gualiát is; mindannak ellenére, hogy Searle szerint nem is voltak ilyen tapasztalatai. 

Searle talán azzal válaszolna, hogy nem jól definiáltuk a kísérletet. Ha a valódi 
neuronokat visszahelyezésükkor úgy keltjük életre, ami az eltávolításuk óta eltelt időt 
nem tükrözi, akkor természetesen nem fognak , emlékezni" az operáció alatti tapaszta- 
latokra. Hogy erre az eshetőségre is felkészüljünk, a visszahelyezéskor a mesterséges 
neuronok belső állapotának megfelelően módosítanunk kell az őket helyettesítő neuro- 
nok állapotát. Ha a valódi neuronok feltételezett , nem funkcionális" aspektusai ekkor 
egy olyan viselkedést eredményeznének, amely funkcionálisan különbözik attól, mint 
amely a mesterséges neuronok bent hagyásával megfigyelhető lenne, akkor reductio ad 
absurdumhoz jutnánk, mert ez azt jelenti, hogy a mesterséges neuronok funkcionálisan 
nem ekvivalensek a valódi neuronokkal. (A 26.3. feladat egy lehetséges utat mutat ezen 
érv cáfolatára.) 

Patricia Churchland (Churchland, 1986) rámutat arra, hogy ha a funkcionalista érv 
működik a neuronok szintjén, akkor működnie kell bármely nagyobb funkcionális egy- 
ség szintjén is, legyen az akár neuronok egy halmaza, egy mentális modul, egy lebeny, 
egy agyfélteke vagy akár az egész agy. Ezek szerint ha elfogadjuk, hogy az agyproté- 
zis kísérlet tanulsága a tudat megmaradása az agy kicserélése során, akkor azt is el kell 
fogadnunk, hogy a tudat akkor is megmarad, ha az egész agyat lecserélik egy áramkör- 
re, amely csak annyit tesz, hogy a bemenetekhez tartozó kimeneteteket visszakeresi egy 
óriási táblázatban. Ez zavarba hozza a legtöbb embert (beleértve magát Turingot is), 
akik intuíciója szerint a visszakereső táblák nem tudatosak, vagy legalábbis az általuk 
generált tudati tapasztalatok nem azonosak azokkal a tapasztalatokkal, amelyeket egy 
olyan rendszer generálna, amit le lehetne írni úgy (akár csak az egyszerűen vett számí- 
tási értelemben), mint ami hiedelmeket, önismeretet, célokat és hasonlókat tart nyilván 
és hoz létre. Mindez sugallja, hogy ha meg akarjuk őrizni az agyprotézis-kísérletet mint 
az intuíciónkat vezérlő segédeszközt, akkor nem folyamodhatunk az agy egy lépésben 
történő lecseréléséhez, de azt nem jelenti, hogy kénytelenek lennénk a lépésenkénti 
neuroncseréhez folyamodni, amit Searle szeretne velünk elérni. 





A kínai szoba 


Legutolsó gondolatkísérletünk valószínűleg egyben a leghíresebb ís. John Searle (Searle, 
1980) gondolta ki, és egy olyan hipotetikus rendszert ír le, amely látnivalóan egy prog- 
Tamot futtat, és megfelel a Turing-teszten; de ugyanilyen világos az is (legalábbis Searle 
szerint), hogy semmit sem ért meg a bemenetei és kimenetei közül. Konklúziója szerint 
tehát a megfelelő program futtatása (azaz a megfelelő válaszok megléte) önmagában 
még nem elégséges feltétele az elmemivoltnak. 

A rendszer egy csak angolul értő emberből áll, akinek egy angol nyelven írt szabály- 
könyve és többfajta papírhalmaza van, melyek közül némely papírhalmaz üres, némelyen 
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pedig valamilyen érthetetlen jelsorozat áll. (Tehát az ember a CPU szerepét játssza, a 
szabálykönyv a programnak, a papírhalmazok pedig a tárolóeszköznek felelnek meg.) 
A rendszer egy szobában található, amelynek csak egy kis nyílása van a külvilágra, Ezen 
a nyíláson keresztül érthetetlen feliratú papírcetlik jelennek meg. Az ember megtalálja a 
szabálykönyvben ezeket a szimbólumokat, és követi az ott leírtakat. Az utasítások között 
szerepelhet, hogy írjon le szimbólumokat új papírcédulákra, keressen szimbólumokat a 
papírhalmazokban, rendezze át a halmazokat és hasonlók. Végül, az utasítások következ- 
ményeként, egy vagy több szimbólumot egy papírdarabra másol, és kiadja a külvilágba. 

Eddig minden könnyen követhető. De kívülről nézve azt látjuk, hogy a rendszer kínai 
mondatokat fogad, kínai mondatokat ad vissza, és ez a párbeszéd nyilvánvalóan épp- 
annyira intelligens, mint amit Turing elképzelt." Searle ennek alapján így érvel: a szo- 
bában lévő személy nem ért kínaiul (ez adott). A szabálykönyv és a papírcetlik, lévén 
ezek csak papírok, szintén nem értenek kínaiul. Ebből az következik, hogy a kínai nyelv 
semmiféle megértése nem zajlik le. Tehát Searle szerint a megfelelő program futtatása 
nem vezet szükségszerűen a megértéshez. 

Turinghoz hasonlóan Searle is megvizsgált néhány lehetséges ellenvetést az érvével 
szemben, és meg is próbálta visszautasítani ezeket. Több kommentátor, köztük John 
McCarthy és Robert Wilensky, azt hozta fel, amit Searle rendszerválasznak nevez. 
Az ellenvetés abban áll, hogy ugyan feltehető az a kérdés, miszerint a szobában lévő 
személy ért-e kínaiul, de ez olyan, mint ha azt kérdeznénk, hogy a CPU tud-e köb- 
gyököt vonni. Mindkét esetben nemmel kell felelnünk, de mindkét esetben — állítják a 
rendszetválasz hívei — a rendszer egésze igenis rendelkezik a kérdéses képességgel. 
Az biztos, hogy ha megkérdezzük a kínai szobát, ért-e kínaiul, a válasz igenlő lesz (még- 
hozzá folyékony kínaisággal). Turing udvarias feltételezése szerint ennyi elegendő is. 
Válaszában Searle ismételten rámutat arra, hogy sem az ember, sem a papírhalmaz nem 
tud kínaiul, tehát semmilyen kínaiul értés sem lehetséges. Továbbá hozzáteszi, az is 
elképzelhető, hogy az ember megtanulja a szabálykönyvet, és a cetlik tartalmát is a fejé- 
ben tartja, tehát csupán az ember az, aki kínaiul tudhatna, ha azonban megkérdezzük őt 
(angolul), akkor a válasza nemleges lesz. 

Most már a lényegi kérdésnél vagyunk. A papírok tartalmának memorizálása csak 
elterelő hadművelet, hiszen mindkettő ugyanúgy egy futó program fizikai megtestesü- 
lése. Searle igazi állítása a következő négy axiómán alapszik (Searle, 1990): 





1. A számítógépprogramok formális, szintaktikai entitások. 

2. Az elmének mentális tartalma, azaz szemantikája van. 

3. A szintaktika önmagában még nem elégséges a szemantikához. 
4. Az elmét az agy okozza. 


Az első három axiómából arra a következtetésre jut, hogy a programok nem elégsége- 
sek az elméhez. Másként megfogalmazva: ugyan lehet elme egy programot futtató ágens, 
de nem lesz szükségszerűen elme csupán a program futtatása miatt. A negyedik axiómá- 
ból pedig arra a következtetésre jut, hogy , bármely más rendszernek, amely képes elmét 
okozni, az aggyal (legalább) megegyező kauzális erőkkel kell rendelkeznie". Ebből pedig 


6 Az, hogy a papíthalmaz talán nagyobb, mint az egész bolygó, és hogy a válaszok létrehozása millió éve- 
kig eltarthat, az érv logikai struktúráját nem érinti. A filozófiai képzés egyik célja éppen az, hogy kialakuljon 
egy kifinomult érzék, amellyel különválaszthatók a releváns és az irreleváns ellenvetések. 
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arra jut, hogy bármely mesterséges agynak nem elég csupán egy adott programot fut- 
tatni, hanem duplikálnia kell az agy kauzális erőit, valamint hogy az emberi agy a men- 
tális jelenségeket nem csupán egy program futtatása révén hozza létre. 

Az a végkövetkeztetés, hogy az elmékhez nem elégségesek a programok, igenis 
következik az axiómákból (amennyiben elég nagyvonalúan értelmezzük azokat). De a 
konklúzió nem elégít ki bennünket: Searle csupán azt bizonyította be, hogy ha kifeje- 
zetten elutasítjuk a funkcionalizmust (ahogy ezt a 3. axiómájával teszi), akkor nem 
lehet szükségszerűen állítani azt, hogy a nem-agyak is elmék volnának. Ez teljesen elfo- 
gadható, így hát az egész érv arra jut, hogy elfogadható-e a 3. axióma. Searle szerint 
a kínai szoba érvek éppen az a lényege, hogy intvíciót ad a 3. axióma elfogadásához. 
De az érvére adott reakciók azt mutatják, hogy csak azoknak nyújt intuitív alapot, akik 
már eleve hajlanak annak elfogadására, hogy a programok önmagukban nem hozhatnak 
létre igazi megértést. 

Megismételve tehát, a kínai szoba érv célja az, hogy megcáfolja az erős MI-hipotézist: 
azt az állítást, miszerint a helyes változatú program futtatása szükségszerűen elmét ered- 
ményez. Úgy működik az érv, hogy bemutat egy látszólag intelligens, a megfelelő típu- 
sú programot futtató rendszert, amely Searle szerint bizonyíthatóan nem elme. Ennél 
a résznél azonban Searle az intuícióra és nem egy bizonyítékra támaszkodik: nézzük 
csak a szobát, hol lenne itt az elme? De ez az érv ugyanúgy felhozható az aggyal kap- 
csolatban is: nézzünk rá a sejtek (vagy az atomok) sokaságára, amelyek vakon működ- 
nek a biokémia (vagy a fizika) törvényei szerint — hol lenne itt az elme? Miért tud egy 
nagy darab agy elme lenni, amikor egy nagy darab máj nem? 

Továbbmenve, amikor Searle beismeri, hogy elméletileg a neuronoktól különböző 
anyag is lehet elme, akkor két okból is tovább gyengül az érve: egyrészt csak Searle 
intuícióira (vagy a saját intuíciónkra), támaszkodhatunk, hogy eldöntsük, elme-e a 
kínai szoba; másrészt, még ha úgy is döntünk, hogy a szoba nem elme, ez semmit 
nem mond arról, hogy a programot futtató más fizikai közeg (például a számítógép) 
lehet-e elme. 

Searle megengedi azt a logikai lehetőséget, hogy az agy éppenséggel egy hagyomá- 
nyos típusú logikai programot valósít meg; de ugyanazt a programot egy rosszfajta gé- 
pen futtatva nem kapnánk elmét. Searle tagadja, hogy azt gondolná, , a gépeknek nem 
lehet elméje", sőt azt állítja, hogy bizonyos gépeknek igenis van elméje: az emberek 
elmével rendelkező biológiai gépek. Nem hagy azonban túl sok útmutatást afelől, hogy 
az elmével rendelkezés a gépek milyen csoportjára terjed ki. 


26.3. A MESTERSÉGES INTELLIGENCIA i 
FEJLESZTÉSÉNEK ETIKAI KÉRDÉSEI ÉS KOCKÁZATAI 


Mindeddig arra összpontosítottunk, hogy képesek vagyunk-e kifejleszteni egy mester- 
séges intelligenciát, most azt is meg kell vizsgálnunk, hogy kell-e ezt tennünk. 
Amennyiben az MI-technológiák hatásai többségében inkább negatívak, mint pozití- 
vak lennének, akkor morális felelőssége lenne az ezen a területen dolgozóknak, hogy 
más területekre helyezzék kutatásukat. Sok új technológia járt akaratlanul is negatív 
mellékhatásokkal: a belső égésű motor a légszennyezést hozta és azt, hogy még az 
Édenkertet is leaszfaltozták, a maghasadás felfedezése pedig a csernobili és a Three 
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Mile Island-i? atomkatasztrófákat hozta, és a globális pusztulás veszélyének fenyege- 
tését. Minden tudósnak és mérnöknek szembe kell néznie a munkájukkal kapcsolatos 
etikai kérdésekkel: mely projekteket szabad befejezni, és melyeket nem, és hogyan kell 
ezeket a projekteket kezelni. Még egy Ethics of Computing (Berleur és Brunnstein, 
2001) c. kézikönyv is létezik. A mesterséges intelligencia azonban, úgy tűnik, néhány 
új problémát is felvet, azon túl, hogy olyan hidakat akarunk építeni, amelyek nem dől- 
nek össze: 


Az emberek az automatizáció miatt elveszíthetik a munkájukat. 

Az embereknek túl sok (vagy túl kevés) szabadidejük marad. 

Az emberek elveszíthetik az egyediségérzésüket. 

Az emberek elveszíthetik a személyiségi jogaik egy részét. 

Az MI-rendszerek alkalmazása megszüntetheti a felelősségre vonhatóságot. 
A mesterséges intelligencia sikere az emberi faj végét jelentheti. 


8.6... 


Sorra vesszük mindegyik felvetett problémát. 

Az emberek az automatizáció miatt elveszíthetik a munkájukat. A modem ipari gazda- 
ság általában véve függővé vált a számítógépektől, sőt néhány különleges MI-programtól 
is. A gazdaság nagy része például, különösen az Egyesült Államokban, a fogyasztói hítel- 
től függ. A hitelkártya-kérelmek elbírálását, a lehívások engedélyezését és a visszaélések 
felderítését napjainkban mesterséges intelligencia programok végzik. Azt is mondhatná 
valaki, hogy ezek a programok több ezer dolgozót tettek munkanélkülivé, de valójában, 
ha elvennénk ezeket a mesterséges intelligencia programokat, nem is léteznének ilyen 
állások, mert az emberi munka elviselhetetlen többletköltséget róna ezekre a tranzak- 
ciókra. A mesterséges intelligenciát használó gépesítés mindeddig több állást hozott 
létre, mint ahányat megszüntetett, és ezek az új állások érdekesebbek, és jobban fizet- 
nek. Ma már, amikor a mesterséges intelligencia programokat az embereket segítő , in- 
telligens ágenseknek" tekintik, kevesebben félnek a munkahelyük elvesztésétől, mint 
amikor a mesterséges intelligencia célja az embereket helyettesítő , szakértői rendsze- 
rek" létrehozása volt. 

Az embereknek túl sok (vagy túl kevés) szabadidejük marad. Alvin Toffler a Future 
Shock-ban (Toffler, 1970) ezt írta: , A századforduló óta a munkahét 5096-kal csökkent. 
Nem lóg ki a sorból ha azt jósoljuk, hogy 2000-re ismét felével csökken." Arthur C. 
Clarke (Clarke, 1968b) azt írta, hogy 2001-ben az emberek talán már a , teljes unalom- 
mal néznek szembe, ahol az élet legnagyobb problémája a több száz tv-csatorna közti 
választás lesz". Az egyetlen ezen jóslatok közül, amelyik közel áll a megvalósuláshoz, 
az a tv-csatornák száma (Springsteen, 1992). Valójában a tudásintenzív iparágakban 
dolgozó emberek egy 24 órában működő, integrált számítógépesített rendszer részévé 
válnak, és ahhoz, hogy lépést tartsanak, hosszabb munkaórákra lettek kényszerítve. 
Az ipari gazdaságban a jutalom közelítőleg egyenesen arányos a befektetett idővel; 
1095-kal több munka többé-kevésbé 1096-os bevételnövekedést jelent. Az információs 
gazdaságban, amelyet a nagy sávszélességű kommunikáció és a szellemi tulajdon köny- 
nyű replikációja jellemez (ezt nevezi Frank és Cook ,a-győztes-mindent-visz társada- 


7 Az Egyesült Államok eddigi legsúlyosabb atombalesetének helyszíne Pennsylvania államban. Az 1979- 
ben történt baleset ugyan rendkívül megrázta az amerikai közvéleményt, de káros egészségügyi következmé- 
nyeit tekintve nem mérhető a csernobili esethez. (A ford.) 
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lom"-nak) (Frank és Cook, 1996), nagy jutalom jár azért, ha valaki csak egy kicsit is 
jobb a versenyben: 1096-kai több munka akár 10096-os bevételnövekedést is jelenthet. 
Ezért egyre növekvő nyomás nehezedik mindenkire, hogy keményebben dolgozzon. 
A mesterséges intelligencia növeli a technológiai innováció ütemét, tehát hozzájárul 
ehhez az általános trendhez, de egyben a mesterséges intelligencia tartalmazza annak 
ígéretét ís, hogy az automatizált ágensek kicsit átvállalják a teendőket és egy kis időhöz 
juttatnak minket. 

Az emberek elveszíthetik az egyediségérzésüket. Weizenbaum, az ELIZA program 
szerzője, Computer Power and Human Reason (Weizenbaum, 1976) c. művében rámu- 
tat néhány potenciális veszélyre, amelyeket a mesterséges intelligencia jelent a társada- 
lom számára. Weizenbaum egyik fő érve az, hogy a mesterséges intelligencia kutatása 
lehetővé teszi annak elképzelését, hogy az emberek automaták volnának, amely elgon- 
dolás az autonómia, vagy akár a humanitás érzésének megszűnéséhez vezet. Vegyük 
észre azonban, hogy ez az elképzelés jóval régebb óta van jelen, mint a mesterséges 
intelligencia: legalábbis a --Homme Machine (La Mettrie, 1748) c. könyvig vezethető 
vissza. Azt is vegyük észre, hogy az emberiség túlélte már az egyediségérzésnek más 
csökkenéseit is: A De Revolutionibus Orbium Coelestium (Kopernikusz, 1543) kimoz- 
dította a Földet a Naprendszer központjából, és a Descent of Man (Darwin, 1871) pedig 
a Homo sapienst egy szintre helyezte a többi fajjal. A mesterséges intelligencia, ameny- 
nyiben széles körben sikeres lesz, éppen úgy veszélyt jelenthet a 21. század morális 
feltételezéseire, ahogyan Darwin evolúciós elmélete fenyegette a 19. század morális 
feltételezéseit. 

Az emberek elveszíthetik a személyiségi jogaik egy részét. Weizenbaum arra is rámu- 
tatott, hogy a beszédfelismerési technológia a lehallgatás elterjedéséhez, és így a polgá- 
ri jogok veszteségéhez vezethet. Nem láthatta előre azt a világot, ahol a terrorista fenye- 
getettség megváltoztatja, hogy az emberek mennyi megfigyelést hajlandók elfogadni, azt 
azonban helyesen ismerte fel, hogy a mesterséges intelligencia a tömeges megfigyelés 
eszközévé válhat. Jóslata talán már valóra is vált: az Egyesült Államok kormányának 
titkos Echelon-rendszere , felvevőállomások, antennamezők és radarállomások hálózatá- 
ból áll, a rendszert nyelvek közti fordítást, beszédfelismerést és kulcsszavas keresést 
használó számítógépek támogatják, amelyek a telefon-, az e-mail, a fax- és a telexforgal- 
mat vizsgálják végig."§ Néhányan elfogadják, hogy a számítógépesítés a magánszféra 
veszteségéhez vezet. Scott McNealy, a Sun Microsystems vezetője azt mondta: , Amúgy 
is nulla a magánszférád. Felejtsd el." Mások nem értenek ezzel egyet: Louis Brandeis 
bíró? ezt írta 1890-ben: , A magánszférához való jog minden jogok legalapvetőbbike (...) 
a jog az ember saját személyiségéhez." 

Az Mi-rendszerek alkalmazása megszüntetheti a felelősségre vonhatóságot. Az Egye- 
sült Államokban ma uralkodó pereskedő közhangulat fontos kérdéssé tette a jogi felelős- 
séget. Amikor egy orvos a diagnózis felállításakor egy orvosi szakértői rendszer ítéletére 
hagyatkozik, ki tehető felelőssé a diagnózis hibájáért? Szerencsés módon, és ez részben 
a döntéselméleti megközelítés orvoslásra gyakorolt egyre növekvő befolyásának 
köszönhető, ma már elfogadott alapelv, hogy az orvos, aki végrehajtja a nagy várható 
hasznossági értékű beavatkozásokat, akkor sem vádolható hanyagsággal, ha ezeknek a 


§ ásd , Eavesdropping on Europe", Wired hírmagazin, 9/30/1998 és a hivatkozott EU-jelentéseket, 
Amerikai jogász és jogi közíró, a múlt század első felében a Legfelsőbb Bíróság tagja. (A ford.) 
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beavatkozásoknak katasztrofálisak a tényleges következményei a páciensnél. A kérdés 
ezek után a következő: , Kinek a hibája, ha a diagnózis nem plauzíbilis?? Mindeddig a bí- 
róságok úgy tartották, hogy az orvosi szakértői rendszerek ugyanazt a szerepet töltik be, 
mint az orvosi tankönyvek és kézikönyvek: az orvosoknak felelőssége, hogy megértsék 
a döntések indoklását, és saját megítélésük alapján keli határozniuk, hogy elfogadják-e 
a rendszer javaslatát. Tehát ha az orvosi szakértői rendszereket ágensekként tervezzük, 
akkor cselekvéseiket nem úgy kell tekinteni, mint ami közvetlenül kihat a páciensre, 
hanem mint ami befolyásolja az orvos viselkedését. Ha a szakértői rendszerek megbíz- 
batóbban pontosabbak lesznek, mint a diagnózisokat felállító emberek, akkor az orvo- 
sok akár jogilag is felelősek lehetnek, ha nem használják fel a rendszer javaslatait. 
Gawande (Gawande, 2002) ezt a feltételezést térképezi fel. 

Hasonló kérdések kezdenek megjelenni az interneten használt intelligens ágensekkel 
kapcsolatban. Már elértek egy kis haladást kényszerfeltételek beépítésével az ágensekbe, 
hogy például ne okozhassanak károkat más felhasználók állományaiban (Weld és Etzioni, 
1994). Amikor pénz is gazdát cserél, a probléma már nagyobb. Amikor egy pénzügyi 
tranzakció során egy intelligens ágens , valaki nevében" jár el, felelős-e ez a személy a 
keletkező adósságokért? Lehetségessé válhat-e, hogy egy intelligens ágensnek pénzügyi 
kintlévősége legyen, és a saját nevében eljárva elektronikus tranzakciókat hajtson végre? 
Mindeddig nem látszanak világosnak ezek a kérdések. Tudomásunk szerint eddíg egy 
program sem kapta meg azt a jogi státust, hogy individuumként pénzügyi tranzakciókat 
hajthasson végre, és jelenleg ez nem is látszik indokoltnak. A valódi autópályákon sem 
tekintik a közlekedési szabályok betartatásakor , vezetőnek" a programokat. A kalifor- 
niai jogban legalábbis semmilyen jogi szankció nincsen, amely megakadályozhatná, 
hogy egy automata jármű túllépje a sebességhatárt, noba baleset esetén felelőssé tehető 
a jármű vezérlőmechanizmusának tervezője. Csakúgy, mint az emberi megtermékenyí- 
tési technológia esetén, a jog még nem vette fel a lépést az új fejleményekkel. 

A mesterséges intelligencia sikere az emberi faj végét jelentheti. Gyakorlatilag bármely 
technológiában benne rejlik a lehetőség, hogy kárt okozzon rossz kezekben, de a mester- 
séges intelligencia és a robotika esetében ezek a rossz kezek akár magához a technológi- 
ához is tartozhatnak. Számtalan sci-fi szól figyelmeztető jelként arról, hogy robotok vagy 
robot-ember kiborgok ámokfutást rendeznek. Marry Shelley Frankenstein, or the Modern 
Prometheus (Shelley, 1818)"9 c. műve és Karel Capek R.U.R. c. drámája, amelyben a ro- 
botok meghódítják a világot, korai példái az ilyen történeteknek. Mozifilmek is szólnak 
erről: a The Terminator (1984) a robotok-leigázzák-a-világot kliséit az időutazással ötvözi, 
a The Matrix (1999) pedig ugyanezt az agyak-a-tartályban-nal kombinálja. 

Úgy tűnik, legtöbb esetben a robotok azért főszereplői olyan sok világ-leigázása törté- 
netnek, mert az ismeretlent jelképezik, csakúgy, mint a korábbi mesék boszorkányai és 
szellemei, Jelentenek-e a boszorkányoknál és a szellemeknél komolyabb veszélyt? Való- 
színűleg nem: ha a robotokat megfelelően, azaz olyan ágensekként tervezik, amelyek 
a gazdáik céljait teljesítik, akkor a jelenlegi tervezés lépésenkénti előrehaladásából szár- 
mazó robotok szolgálni fognak, nem pedig leigázni. Az emberek azért használják ag- 
resszíven az intelligenciájukat, mert a természetes kiválasztódás miatt velük született 
agresszivitással rendelkeznek. De a gépek, amiket magunk építünk, nem születnek 
agresszívnak, hacsak nem döntünk úgy, hogy ilyennek építjük őket. Másrészt viszont 









10 Charles Babbage-ra ís hatással volt fiatalemberként a Frankeinstein olvasása. 
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lehetséges, hogy a számítógépek meghódítanak minket abban az értelemben, hogy szol- 
gálatukkal elengedhetetlenné válnak, csakúgy, mint az autók meghódították (ebben az 
értelemben) az iparosodott világot. Egy forgatókönyv részletesebb tanulmányozást érde- 
mel. I. J. Good (Good, 1965) írta ezt: 


Definiáljuk az ultraintelligens gépet olyan gépként, amely messze túlhaladja a lehető legintelligen- 
sebb ember intellektuális tevékenységét is. Mivel a gépek tervezése az intellektuális tevékenységek 
egyike, egy ultraintelligens gép még jobb gépeket tud tervezni; nem kérdés, hogy egy ,intelligen- 
ciarobbanás" történne, ami messze lehagyja az emberi intelligenciát. Az ultraintelligens gép így 
egyben az emberiség utolsó szükséges felfedezése, feltéve persze, hogy a gép elég engedelmes, és 
elmondja, hogyan tarthatjuk ellenőrzésünk alatt. 


Az , intelligenciarobbanás"-t technológiai szingularitásnak (technological singularity) 
is nevezte a matematika-professzor és sci-fi író Vernor Vinge, aki így fogalmaz (Vinge, 
19939: , Harminc éven belül rendelkezni fogunk a technológiai eszközökkel egy ember- 
feletti intelligencia létrehozására. Röviddel ezután befejeződik az ember korszaka." Good 
és Vinge (és még sokan mások) jól figyelik meg, hogy a technológiai fejlődés jelenleg az 
exponenciális görbe szerint nő (gondoljunk csak a Moore-törvényre). Azonban ebből 
csak egy előreugrással lehet arra következtetni, hogy ez a görbe így fog folytatódni a 
közel végtelen növekedés szingularitásához. Eddig minden más technológia egy S ala- 
kú görbét követett, ahol az exponenciális növekedés végül lecsengett. 

A bekövetkező szingularitásról író Vinge-et rémíti ez a lehetőség, de más számító- 
géptudósok és futuristák örömmel várják. Hans Moravec a Robot: Mere Machine to 
Transcendent Mind c. írásában azt jósolja, hogy a robotok ötven éven belül elérik az 
emberi intelligenciát, majd pedig meghaladják azt. Ezt írja: 


Egész gyorsan kiszorítanak minket a létezésből. Másokkal szemben engem ez a lehetőség nem tölt 
el aggodalommal, én ezeket a jövőbeli gépeket a leszármazottainknak, , elmebeli gyermekeink"-nek 
tartom, akiket képünkre és hasonlatosságunkra építettünk, önmagunkként egy jóval nagyobb képes- 
ségű alakban. A korábbi generációk biológiai gyermekeihez hasonlóan az emberiség hosszú távú 
jövőről alkotott legjobb reményét testesítik meg. Belső kötelességünk minden előnyt megadni nekik. 
és ellépni útjukból, ha már többet nem tudunk segíteni. (Moravec, 2000) 


A The Age of Spiritual Machines (Kurzweil, 2000) c. művében Ray Kurzweil azt jósolja, 
hogy 2000-re már , erős trend lesz összekapcsolni az emberi gondolkodást az eredetileg 
az emberi faj teremtette gépek világával". Még egy új szó is van: transzhumanizmus 
(transhumanism), amely az ezt a jövőt váró aktív társadalmi mozgalmat jelöli. Elegendő 
csak annyit mondani, hogy az ilyen kérdések kihívást jelentenek a legtöbb mai erkölcsi 
gondolkodónak, akik az emberi élet és az emberi faj megőrzését jó dolognak tartják. 

(Gondoljunk bele végül a robotok nézőpontjába. Ha a robotok tudatossá válnak, akkor 
immorális lehet puszta , gépként" kezelni őket (például darabokra szedni). A robotok- 
nak maguknak is morálisan kell cselekedniük: beléjük kell programozni a jó és a rossz 
elméletét. A sci-fi írók, kezdve Isaac Asimovval (Asimov, 1942), már el is kezdtek fog- 
lalkozni a robotjogok és robotfelelősségek kérdéseivel. A jól ismert — Mesterséges 
intelligencia (A.1.) (Spielberg, 2001) c. mozifilm Brian Aldiss történetén alapul, amely- 
ben egy intelligens robot, akit arra programoztak, hogy embernek képzelje magát, 
képtelen feldolgozni, hogy nem kell tulajdonos-anyjának. A történet (és persze a film) 
a robotok polgárjogi mozgalmának megalapozottságáról győzhet meg egyeseket. 
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Ebben a fejezetben a következő kérdésekkel foglalkoztunk: 


s A filozófusok szóhasználata szerint a gyenge MI kifejezés azt a feltevést jelenti, 
hogy a gépek valószínűleg képesek intelligensen viselkedni, az erős MI pedig azt a 
feltevést, hogy az ilyen gépek elmével rendelkezőknek számítanának (és nem elmét 
szimulálóknak). 

. Alan Turing visszautasította a ,, Tudnak-e gondolkodni a gépek?" kérdést, és egy 
viselkedési tesztet állított a helyébe. Sok, a gondolkodó gépek lehetőségével szem- 
ben felhozható ellenvetést megelőlegezett. A mesterséges intelligencia kutatói közül 
kevesen szentelnek figyelmet a Turing-tesztre, előnyben részesítik, ha a rendszerek 
gyakorlati problémamegoldó képességére összpontosítunk, nem pedig az emberek 
utánzására való képességükre. 

s A modern korban általánosan egyetértenek abban, hogy a mentális állapotok agy- 
állapotok. 

s Sem az etős MI ellen, sem a mellette felhozható érvek nem meggyőzők. Kevés első 
vonalbeli MI-kutató gondolja azt, hogy bármi fontos is függ ennek a vitának a kime- 
netelétől. 

s A tudatosság rejtély maradt. 

§ A mesterséges intelligencia és a kapcsolódó technológiák által a társadalomra jelen- 
tett veszélyek hat fajtáját azonosítottuk. Arra a következtetésre jutottunk, hogy né- 
hány veszély valószínűtlen, kettő azonban további megfontolást érdemel. Az első 
az, hogy az ultraintelligens gépek, a maitól nagyon különböző, ámde ránk nézvést 
korántsem kedvező jövőhöz vezethetnek. A második pedig az, hogy a robottechno- 
lógia a pszichopatáknak is a kezébe adhatja a tömegpusztító fegyverek kulcsát. Arra 
jutottunk azonban, hogy ez a fenyegetés inkább származik a biotechnológiából és a 
nanotechnológiából, mintsem a robotikából. 


Irodalmi és történeti megjegyzések 


Az elme természete az ókortól napjainkig a filozófiai elméletalkotás állandó témája. 
Platón a Phaidón c. dialógusában kifejezetten megvizsgálta, majd elvetette azt a lehető- 
séget, hogy az elme a test részeinek , egybehangoltsága", szerveződési mintája lenne 
(ez az álláspont közelít ahhoz, amit a modern elmefilozófiában funkcionalizmusnak ne- 
vezünk). Ehelyett arra az álláspontra helyezkedett, hogy az elme egy halhatatlan, nem 
anyagi lélek, amely a testtől elválasztható, és szubsztanciájában (lényegi alkotóelemét 
tekintve) különbözik: ez a dualizmus álláspontja. Arisztotelész az élő lényekre jellemző 
lélek (görögül sux) több fajtáját különítette el, és legalábbis néhányukra funkcionalis- 
ta leírást adott (erről bővebben lásd (Nussbaum, 1978)). 

Hírhedt Descartes dualisztikus elmefelfogása, de ironikus módon történelmi hatása 
inkább a mechanisztikus és materialista elmefelfogás felé mutat. Az állatokat kifejezet- 
ten automatának tartotta, és megelőlegezte a Turing-tesztet: , azt nem tudjuk elképzel- 
ni, hogy (egy gép] a szavakat különféleképpen elrendezze, s ezáltal értelmesen tudjon 
felelni arra, amit a jelenlétében mondanak, amint ezt a legtompábbeszű emberek is meg 
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tudnak tenni" (Descartes, 1637).!! Azzal, hogy hevesen kardoskodott az állatok automa- 
ta mivolta mellett, Descartes valójában könnyebbé tette, hogy az embereket is automatá- 
nak véljük, noha maga ezt a lépést sohasem tette meg. A L"Homme Machine (La Mettrie, 
1748) c. könyv pontosan amellett érvelt, hogy az emberek automaták. 

A modern analitikus filozófia általában elfogadja a materializmust (gyakran az agy- 
állapot-azonosság elmélet (identity theory) formájában (Place, 1956; Armstrong, 
1968], ami szerint a mentális állapotok azonosak az agyi állapotokkal), de sokkal meg- 
osztottabb a funkcionalizmust, az emberi elme gépi analógiáját tekintve, valamint 
abban a kérdésben, hogy szó szerinti értelemben véve tudnak-e gondolkodni a gépek. 
Turing (Turing, 1950) Computing Machinery and Intelligence c. cikkére adott korai fi- 
lozófiai válaszok egy része, például Scriven (Scriven, 1953), megpróbálta cáfolni, hogy 
értelmes lenne azt mondani, hogy a gépek gondolkodhatnak, arra alapozva, hogy ez 
sértené a szó jelentését. Ezt a nézetet, legalábbis Scriven, cikkének újranyomásához 
illesztett függelékének tanúsága szerint 1963-ra visszavonta (Anderson, 1964). A számí- 
tástechnika-kutató Edsger Dijkstra szerint , Az a kérdés, hogy tud-e egy gép gondolkod- 
ni, nem érdekesebb annál, hogy tud-e úszni egy tengeralattjáró." Ford és Hayes (Ford 
és Hayes, 1965) amellett érvelnek, hogy a Turing-teszt semmi segítséget sem nyújt a 
mesterséges intelligencia számára. 

Mivel az elmefilozófiában a mesterséges intelligencia alapján a funkcionalizmus 
választása tűnik a legtermészetesebbnek, a funkcionalizmus kritikája tehát gyakran a 
mesterséges intelligencia kritikájának formáját ölti (mint Searle esetében). Block (Block, 
1980) osztályozását követve többféle funkcionalizmust különböztethetünk meg. Az agy- 
állapot-azonosság elmélet egyik variánsa, a funkcionális specifikáció elmélete (functio- 
nal specification theory) (Lewis, 1966; 1980) a mentális állapotokkal identifikálandó 
agyi állapotokat a funkcionális szerepük választja ki. A gépi analógiához szorosabban kö- 
tődik a funkcionális állapotazonosság elmélet (functional state identify theory) 
(Putnam, 1960; 1967). E szerint a mentális állapotokat nem fizikai agyi állapotokkal, 
hanem a kifejezett számítóeszközként felfogott agy absztrakt számítási állapotaival kell 
azonosítani. Ezek az absztrakt állapotok feltételezés szerint függetlenek az agy specifi- 
kus felépítésétől, ami azonban néhányakat arra késztet, hogy a funkcionális állapot- 
azonosság elméletet a dualizmus egy formájának tartsák! 

Mindkét agyállapot-azonosság elméletet, valamint a különböző formájú funkcio- 
nalizmusokat támadják azok a szerzők, akik szerint ezek az elméletek nem meg- 
felelők a mentális állapotok gualia, azaz , milyen érzés is ez" aspektusának meg- 
magyarázására (Nagel, 1974). Searle ehelyett az intencionalitás funkcionalizmusbeli 
állítólagos megmagyarázhatatlanságára koncentrált (Searle, 1980; 1984; 1992). 
Churchland és Churchland (Churchland és Churchland, 1982) mindkét fajta kritikát 
visszautasítják. 

Az eliminatív (kiküszöbölő) materializmus (eliminative materialism) (Rorty, 1965; 
Churchland, 1979) abban különbözik az elmefilozófia többi jelentős elméletétől, hogy 
meg sem kísérli a , népies pszichológia", az elméről alkotott hétköznapi elképzeléseink 
igazolását, hanem mindet elveti, és megpróbálja az elme tisztán tudományos elméleté- 
vel helyettesíteni. Elméletileg akár a klasszikus mesterséges intelligencia is szolgáltat- 


11 A szöveget a magyar fordítás alapján idéztük: Értekezés a módszerről (ford. Szemere Samu és Boros Gá- 
bor). (A ford.) 
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hatná ezt a tudományos elméletet, de valójában az eliminatív materialisták inkább az 
idegtudománytól és a neurális hálók kutatásától kölcsönöznek (Churchland, 1986), arra 
alapozva, hogy a klasszikus mesterséges intelligencia, különösen a 10. fejezetben 
bemutatotthoz hasonló , tudásreprezentációs" kutatási irány, hajlamos a népies pszicho- 
lógia igazságaira alapozni. Ugyan az ,intencionális beállítottság" álláspont (Dennett, 
1971) értelmezhető funkcionalistaként, de valószínűleg az eliminatív materializmus 
egyik formájának kell tekinteni, mivel az intencionális beállítottság nem objektív tulaj- 
donsága az ágensnek, akire vonatkozik. Azt is vegyük figyelembe, hogy lehetünk 
eliminatív materialisták egyes mentális jelenségekkel kapcsolatban, miközben másokat 
nem így elemzünk. Dennett (Dennett, 1978) például a gualiákat illetően sokkal inkább 
eliminativista, mint az intencionalitással kapcsolatban. 

A fejezetben szóltunk a gyenge MI-vel szembeni kritika lehetséges forrásairól. 
Ugyan a posztneurális hálók korszakában divatossá vált idejétmúltnak tartani a szimbo- 
likus megközelítéseket, nem minden filozófus kritikus a , Jófajta, régivágású MI"-vel 
szemben. Akadnak ennek még elkötelezett, sőt akár gyakorló hívei is. Zenon Pylyshyn 
(Pylyshyn, 1984) amellett érvelt, hogy a számítási modell nemcsak elviekben a legjobb 
modell a megismerés megértéséhez, hanem a jelenlegi kutatás útja is lehet, és kifejezet- 
ten megcáfolta Dreyfus kritikáját az emberi megismerés számítási modelljéről. Gilbert 
Harman (Harman, 1983) a hiedelemmódosítás vizsgálatát az igazság-karbantartó mes- 
terséges intelligencia rendszerek kutatásához kapcsolta. Micheal Bratman az emberi 
pszichológiáról alkotott , hiedelem-vágy-intenció" modelljét (Bratman, 1987) alkalmaz- 
ta a tervkészítéssel kapcsolatos mesterséges intelligencia kutatásokra (Bratman, 1992). 
Aaron Sloman (Sloman, 1978, iii. 0.), a mesterséges inteltigencia erős hipotézisének ra- 
dikális híve odáig elment, hogy rasszistának nevezte Joseph Weizenbaumot (Weizen- 
baum, 1976), mert szerinte a feltételezett intelligens gépeket nem kellene személyeknek 
tekinteni. 

Az elméről, az agyról és a kapcsolódó témákról szóló filozófiai irodalom kiterjedt, 
és a megfelelő szaknyelv és érvelési módozatokra vonatkozó megalapozott képzés hi- 
ányában gyakran nehezen olvasható. Ehhez a folyamathoz az Encyclopedia of 
Philosophy (Edwards, 1967) felettébb hasznos segítséget nyújthat meggyőzően infor- 
matív szócikkeivel. A The Cambridge Dictionary of Philosophy (Audi, 1999) rövi- 
debb, de közérthetőbb mű, noha a fő szócikkek (mint például az , elmefilozófia") még 
így is akár több mint tíz oldal hosszúak is lehetnek. A MIT Encyclopedia of Cognitive 
Science (Wilson és Keil, 1999) egyaránt foglalkozik az elme filozófiájával, biológiá- 
jával és pszichológiájával. Az elmefilozófiáról (beleértve ebbe a funkcionalizmust és 
más, a mesterséges intelligenciához kötődő álláspontokat) szóló cikkek általános gyűj- 
teménye található a Materialism and the Mind-Body Problem-ben (Rosenthal, 1971) 
és a Readings in the Philosophy of Psychology (Block, 1980) első kötetében. Biro és 
Shanan (Biro és Shanan, 1980) a funkcionalizmus ellen és mellett érvelő cikkekből 
állított össze antológiát. Más cikkgyűjtemények kifejezetten a filozófia és a mestersé- 
ges intelligencia kapcsolatával foglalkoznak: Minds and Machines (Anderson, 1964); 
Philosophical Perspectíves in Artificial Inteltigence (Ringle, 1979); Mind Design 
(Haugeland, 1981) és a The Philosophy of Artificial Intelligence (Boden 1990). Szám- 
talan bevezető létezik a filozófiai , MI-kérdés"-hez (Boden, 1977; 1990; Haugeland, 
1985; Copeland, 1993). A The Behavioral and Brain Sciences, rövidítve BBS, fontos 
folyóirat, amelyet a mesterséges intelligenciával és az idegtudományokka! kapcsolatos 
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vitáknak szentelnek. Több újság foglalkozik a mesterséges intelligencia etikai és fele- 
lősségi kérdéseivel: AZ and Society, Law, Computers and Artificial Intelligence, vala- 
mint az Ártificial Intelligence and Law.2 


Feladatok 


26.1. 


26.2. 


26.3. 


26.5. 


12 


Haladjon végig Turing állítólagos gépi , fogyatékosságokról" alkotott listáján, 
keresse meg, melyeket valósítottak már meg, melyeket lehet elvben megvaló- 
sítani egy programmal, és melyek problematikusak azért, mert tudatos mentális 
állapotokat igényelnek. 


Szükségszerűen bizonyítja-e a kínai szoba érv cáfolata, hogy a megfelelően 
programozott számítógépek mentális állapotokkal rendelkeznek? Szükségsze- 
rűen együtt jár-e az érv elfogadása azzal, hogy a számítógépeknek nem lehetnek 
mentális állapotaik? 


Az agyprotézis érv fontos része, hogy képesnek kell lennünk a kísérleti személy 
agyát visszaállítani a normális állapotába, hogy külső viselkedése ugyanolyan 
legyen, mintha a műtét nem is történt volna meg. Megalapozott lehet-e egy 
olyan szkeptikus ellenvetés, miszerint ez azzal járna, hogy módosítani kell a 
neuronoknak a tudatossághoz kötődő neurofiziológiai tulajdonságait, melyek 
különböznek a funkcionális viselkedésben résztvevőktől. 


Keressen ki a populáris médiából egy vagy több, a mesterséges intelligencia 
lehetetlenségére irányuló érvet, és elemezze azt. 


Próbáljon meg definíciókat adni az , intelligencia", a , gondolkodás" és a , tuda- 
tosság" fogalmakra. Vessen fel lehetséges ellenvetéseket is a definíciókkal 
szemben. 


Elemezze a mesterséges intelligenciának a társadalomra jelentett potenciális ve- 
szélyeit. Mely fenyegetések a legsúlyosabbak, és hogy lehetne küzdeni ellenük? 
Hogyan viszonyulnak ezek a potenciális előnyökhöz? 


A mesterséges intelligencia jelentette potenciális fenyegetések hogyan viszo- 
nyulnak más számítástechnikai, vagy bio-, nano- és nukleáris technológiákból 
eredő veszélyekhez? 


Néhány kritikus ellenvetése szerint a mesterséges intelligencia lehetetlen, mások 
szerint meg túlságosan is lehetséges, és az ultraintelligens gépek veszélyt jelen- 
tenek. A két felhozott ellenvetés közül melyiket tartja valószínűnek? Ellentmon- 
dásos-e a kettőt együtt állítani? 


A. magyar olvasó a mesterséges intelligencia filozófiájáról Darabos Famás művéből tájékozódhat: A gé- 


Pesített értelem. Vázlatok a mesterséges intelligencia filozófiájáról. Áron Kiadó, Budapest, 1991. (A ford.) 
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Ebben a fejezetben felmérjük, hogy hol vagyunk és merre tartunk, mielőtt folytatnánk. 
Talán nem felesleges. 


Az L részben bevezettük a racionális ágensrendszert mint a mesterséges intelligencia 
egységes szemléleti keretét. Bemutattuk, hogy a tervezési probléma az ágens rendelke- 
zésére álló észleléseken és cselekvéseken, az ágens viselkedésével kielégítendő célon 
és a környezet természetén múlik. Az ágensrendszertervek egész sorát lehet elképzelni, 
a reflexszerű ágenstől kezdve egészen a teljesen céltudatos, tudásalapú ágensig. Továb- 
bá ezen rendszertervek komponensei többféle konkrét alakot ölthetnek — például logi- 
kait, valószínűségit vagy , neurálist". Az ilyen jellegű komponensek működésével a 
megfelelő fejezetek foglalkoztak. 

Az ágensrendszer és komponensei tekintetében mind tudományos megértésünk, 
mind technológiai képességünk hatalmasat fejlődött. Ebben a fejezetben hátrébb lépünk 
a részletektől, és azt kérdezzük: ,, Elvezet-e ez a fejlődés egy változatos környezetekben 
működésre képes, általános célú intelligens ágenshez?" A 27.1. alfejezetben számba 
vesszük az intelligens ágens komponenseit, hogy meghatározhassuk, mi az, amit isme- 
rünk, és mi az, ami még hiányzik. A 27.2. alfejezetben az általános ágensarchitektúra 
kapcsán tesszük ugyanezt. A 27.3. alfejezetben azt vizsgáljuk, hogy a , racionális ágens 
tervezése"-e az elsődlegesen helyes cél. (A válasz: , Nem igazán, de egyelőre megte- 
szi.") Végül a 27.4. alfejezetben azzal foglalkozunk, milyen következményekkel járhat 
vállalkozásunk sikere. 


27.1. ÁGENSÖSSZETEVŐK 


A 2. fejezetben számos ágenstervet és azok komponenseit mutattuk be. Figyelmünket 
összpontosítandó itt csak a hasznosságalapú ágenssel foglalkozunk, amelyet a 27.1. ábrán 
mutatunk be újra. Ez a legáltalánosabb ágenstervünk; de megvizsgáljuk tanulási képessé- 
gekkel való kiterjesztését is (lásd 2.15. ábra). 

Interakció a környezettel szenzorok és beavatkozószervek segítségével. Ez a mestersé- 
ges intelligencia történetének nagy részében komoly hiányosság. Néhány tiszteletre méltó 
kivétellel minden MI-rendszert úgy építettek fel, hogy embereknek kellett szolgáltatniuk 
a bemeneteket, és értelmezni a kimeneteket, a robotika pedig alacsony szintű feladatokra 
összpontosított, ahol nagyrészt hiányzott a magas szintű következtetés és tervkészítés. 
Ez részben a magas költségek és a komoly tervezői erőfeszítés miatt volt így, ami ahhoz 
kellett, hogy egyáltalán valódi, működő robotokat kapjunk. Az elmúlt években az előre 
elkészített, programozható robotok — mint például a 25.4. (b.) ábrán látható négylábú 





27.1. ÁGENSÖSSZETEVŐK 1097 


robot — megjelenésével a helyzet rohamosan megváltozott. Ez a változás végső soron 
a kicsi, olcsó, nagy felbontású CCD-kameráknak és a kompakt, megbízható motoros 
hajtásoknak köszönhetően következett be. Az MEMS- (mikro-elektromechikai rendsze- 
rek) technológia miniatürizált gyorsulásmérőket és giroszkópokat hozott létre, napjaink- 
ban pedig olyan beavatkozószerveket állít elő, amelyek például egy mesterséges repülő 
rovart bizonyos képességekkel ruháznak majd fel. (Talán MEMS-beavatkozószervek mil- 
liói kapcsolhatók majd össze, hogy nagy teljesítményű makroszkopikus beavatkozókat 
kapjunk.) A fizikai környezeteket illetően az MI-rendszereknek nem lehet több kifogása. 
Továbbá egy teljességgel új környezet, az internet is létrejött. 


Állapot 
Jan néz ki 
Hogyan változik a világ? kissé világ? 


3 H kinézni, ha 
Mit okoznak a cselekvéseim? ezékvé tajtomt véget 


Milyen boldog leszek 
lnéssásstt egy ilyen állapotban? 


Milyen cselekvéseket 
kell most végrehajtanom? 


27.1. ábra. Egy modell- és hasznosságalapú ágens, ahogyan először a 2.14. ábrán bemutattuk 


Nyomon követni a világ állapotát. Ez az intelligens ágens számára szükséges legfon- 
tosabb képességek egyike, amelyhez egyaránt szükség van érzékelésre és a belső rep- 
tezentáció frissítésére. A 7. fejezetben ítéletlogikát alkalmaztunk a világ állapotának 
nyomon követésére; a 10. fejezetben kiterjesztettük ezt az elsőrendű logikára; a 15. 
fejezetben pedig szűrő algoritmusokat (filtering algorithms) mutattunk be, hogy a 
bizonytalan környezeteket is követni tudjuk. Ezekre a szűrőeszközökre van szükség, 
amikor igazi — tehát tökéletlen — érzékelésre kerül sor. A jelenlegi szűrő és érzékelési 
algoritmusokat lehet úgy kombinálni, hogy elég jó teljesítményt kapjunk alacsony szín- 
tű predikátumok leírásánál, mint például ,a csésze az asztalon van", de van még 
megteendő út előttünk, míg az algoritmusok azt is ki tudják jelenteni, hogy: , dr. Russell 
teázik dr. Norviggel." Egy másik probléma az, hogy ugyan az approximációs szűrő al- 
goritmusok képesek elég nagy környezeteket kezelni, lényegüket tekintve azonban még 
mindíg propozicionálisak: a propozicionális logikához hasonlóan nem kezelik explicit 
módon az objektumokat és a relációkat. A 14. fejezetben bemutattuk, hogyan lehet en- 
nek a problémának a megoldására elsőrendű logikát alkalmazni; elvárásaink szerint 
nagy előrelépéssel fog majd járni, ha a komplex környezetek kezelésére is alkalmazzák 
ezeket az elgondolásokat. Továbbá, mihelyt egy bizonytalan környezetben elkezdünk 
objektumokról beszélni, felmerül a bizonytalan azonosság (identity uncertainty) prob- 
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lémája: nem tudjuk, melyik objektum melyik. A logika alapú mesterséges intelligen- 
ciában meglehetősen elhanyagolták ezt a problémát, mivel általában feltételezték, hogy az 
észleletek állandó szimbólumokat tartalmaznak az objektumok azonosítására. 

Előrevetíteni, értékelni és kiválasztani jövőbeli cselekvéseket. Az alapvető tudásrep- 
rezentációs elvárások itt is ugyanazok, mint a világ állapotának nyomon követésénél; 
az elsődleges nehézség a cselekvésekkel (mint például beszélgetni és teázni) való bol- 
dogulásból származik, amelyek esetenként az igazi ágens elemi lépéseinek ezreit vagy 
millióit tartalmazhatják. Az emberek is csak úgy tudnak ezzel megbirkózni, hogy a 
viselkedést egy hierarchikus struktúrába (hierarchial structure) szervezik. A 12. 
fejezetben bemutatott tervezési algoritmusok némelyike az ehhez hasonló méretű prob- 
lémák kezelésére hierarchikus és elsőrendű logikai reprezentációt használ; másrészt pe- 
dig a 17. fejezetben megadott bizonytalansági döntéshozó algoritmusok lényegileg 
ugyanazon az elven alapulnak, mint a 3. fejezet állapottérbeli kereső algoritmusai. Látha- 
tóan itt sok a tennivaló, talán a hierarchikus megerősítéses tanulás (hierarchial rein- 
forcement learning) újabb fejleményei mentén. 

Hasznosság mint a preferenciák kifejezése. A racionális döntéseket az elvárt hasz- 
nosság maximalizálására alapozni elméletileg teljesen általános, és megóv a tisztán 
célorientált megközelítések számtalan hibájától (mint például az ellentmondó célok 
És a bizonytalan elérésük). Mindeddig azonban kevés munka folyt a realisztikus hasz- 
nossági függvények előállítása terén — képzeljük el például az egymással kölcsön- 
hatásban lévő preferenciák komplex hálózatát, amelyeket az emberek irodai asszisz- 
tenseként működő ágensnek meg kell értenie. Elég nehéznek bizonyult az összetett 
állapotokkal kapcsolatos preferenciákat dekomponálni az összetett állapotokról szóló 
bizonyosságok Bayes-hálós dekompozíciójához hasonlóan. Ennek az egyik oka az 
lehet, hogy az állapotok preferenciái valójában az állapotok múltbeli preferenciáiból 
lettek összeszerkesztve, amelyeket jutalomfüggvények (reward functions) írnak le 
(lásd 17. fejezet). A keletkező hasznossági függvény akkor ís nagyon összetett lehet, 
ha a jutalomfüggvény egyszerű. Mindez azt sugallja, hogy komolyan kell vennünk a 
jutalomfüggvények tudásmérnöki konstrukcióját, mert ezzel tudjuk az ágens értésére 
adni, mit akarunk tőle. 

Tanulás. A 18-20. fejezetben leírtuk, hogy az ágens tanulása miként fogalmazható 
meg az ágens különböző komponenseinek induktív (ellenőrzött, nem ellenőrzött vagy 
megerősítéses) tanulásaként. Nagyon hatékony logikai és statisztikai technikákat fej- 
lesztettek ki, amelyek egész nagy problémákkal ís meg tudnak birkózni, és gyakran 
elérik, sőt meghaladják az embernek azt a képességét, amellyel egy adott szótár feletti 
prediktív mintákat azonosít. Másrészt viszont abban a fontos problémában, hogy a be- 
meneti szótárnál absztraktabb szintű, új reprezentációkat hozzanak létre, a gépi tanulás 
kevés haladást ért el. Hogyan tud például egy autonóm robot létrehozni az emberektől 
meg nem kapott olyan új predikátumokat, mint például az Iroda és a Kávé? Hasonló 
megfontolások alkalmazhatók a viselkedés tanulására is: a Teázás fontos, magas szintű 
cselekvés, de hogyan kerül be egy olyan cselekvéskönyvtárba, ahol eredetileg csak jóval 
egyszerűbb cselekvések szerepeltek, mint például a KezetFelemelni és a Lenyelni. Amíg 
nem értjük meg ezeket a problémákat, addig a hatalmas józan ész tudásbázisok kézi 
létrehozásának csüggesztő feladatával nézünk szembe. 
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, ha azt kérdezzük: , Melyik architektúrát alkalmazzam a 2. fejezetben bemu- 
" A válasz: , Mindegyiket!" Láttuk, hogy a reflexszerű válaszok alkalmasak 
az időkritikus helyzetekben, míg a tudásalapú elhatározás lehetővé teszi, hogy az ágens 
előre tervezzen. Egy teljes ágensnek egy hibrid architektúra (hybrid architecture) segít- 
ségével képesnek kell lennie mindkettőre. A hibrid architektúra egyik fontos tulajdonsága, 
hogy a különböző döntési komponensek határa nem rögzített. A szerkesztés vagy kom- 
pilálás (compilation) például az elhatározás szintjén megjelenő deklaratív információt fo- 
lyamatosan hatékonyabb reprezentációkká alakítja át, eljutva végül a reflexszerű szintre 
(27.2. ábra). (Ez a célja a 19. fejezetben bemutatott magyarázatalapú tanulásnak.) Az olyan 
rendszereknek, mint a SOAR (Laird és társai, 1987) és a THEo (Mitchell, 1990), pontosan 
ez a struktúrájuk. Minden alkalommal, amikor explicit elhatározás révén jutnak el egy 
probléma megoldásáig, a megoldás általánosított verzióját is eltárolják a reflexszerű kom- 
ponens részére. Ennek a folyamatnak a fordítottját kevésbé tanulmányozták még: a környe- 
zet változásakor a megtanult reflexek lehet, hogy többé már nem érvényesek, és az ágens- 
nek vissza kell térnie a tudatos konstrukció szintjére, hogy új viselkedést hozhasson létre. 









Tudásalapú 


elhatározás 





Észleletek 








27.2. ábra. A kompilálás célja a megfontolt (deliberatív) döntéshozatal hatékonyabb, reflexszerű mecha- 
nizmussá való átalakítása 


Egy ágensnek saját következtetéseit is az ellenőrzése alá kell tudnia vonni. A követ- 
keztetést abba kell hagynia, ha cselekvésre van szükség, és a következtetésre rendelke- 
zésre álló időt a legígéretesebb számításokra kell fordítania. Egy taxisofőr ágensnek, 
például, ha közvetlenül maga előtt balesetet észlel, nem félórák alatt, hanem a másod- 
perc töredéke alatt el kelt tudnia dönteni, hogy fékezni fog, vagy inkább kikerüli a bal- 
esetet. A másodperc ezen töredékét a legfontosabb kérdések vizsgálatára kell fordítania, 
hogy balra, illetve jobbra szabad-e a sáv, és nincs-e közvetlenül mögötte egy nagy teher- 
autó, és nem arra, hogy milyen az idő, mennyire kopnak a gumik, vagy hogy hol találja 
a következő utast. Az ilyen problémákkal a valós idejű MI (real-time AJ) foglalkozik. 
Ahogy az intelligens rendszerek egyre bonyolultabb tárgyterületekre vonulnak be, min- 
den probléma valós idejűvé válik, hiszen az ágensnek soha nem lesz elegendő ideje arra, 
hogy a döntési problémát egzakt módon oldja meg. 

Világos, hogy sürgető szükség van az általánosabb döntéshozó helyzetekben is 
működő módszerekre. Az utóbbi időben két kecsegtető módszertan is napvilágot látott. 
Az első az akármikor algoritmusok (anytime algorithms) alkalmazása (Dean és 
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Boddy, 1988; Horvitz, 1987). Egy akármikor algoritmusnál az algoritmus kimenetének 
minősége az idő múlásával fokozatosan javul, bármikor szakítjuk is meg tehát az algo- 
ritmust, ésszerű döntéshez jutunk. Az ilyen algoritmus vezérlését egy metadöntési 
eljárás végzi, amely meghatározza, hogy érdemes-e a számításokat tovább folytatni. 
Az akármikor algoritmusra egy egyszerű példa a kétszemélyes játékoknál ismertetett 
iteratív mélyítő keresés. Azonban bonyolultabb rendszerek — amelyek számos ilyen, 
együttesen működő algoritmusból állnak — is konstruálhatók (Zilberstein és Russell, 
1996). A másik módszer a döntéselméleti metakövetkeztetés (decision-theoretic meta- 
reasoning) (Horvitz, 1989; Russell és Wefald, 1991; Horvitz és Brecse, 1996). Ebben a 
megközelítésben az információérték elméletét (16. fejezet) a számítások megválasztására 
használjuk. A számítás értéke mind a költségétől (a késleltetett cselekvés miatt), mind a 
hasznosságától (a döntés javított minősége miatt) függ. A metakövetkeztetési sémákkal 
jobb keresési algoritmusokat lehet előállítani, automatikusan garantálva az akármikor 
tulajdonságot. A metakövetkeztetés természetesen költséges, de a kompilálás arra ís fel- 
használható, hogy a túlmunka költsége eltörpüljön a számítás költsége mellett, lévén 
hogy a számítás is felügyelt. 

A metakövetkeztetés csupán egyik aspektusa az általános reflektív architektúrának 
(reflective architecture): ezek az architektúrák lehetővé teszik a magán az architektú- 
rán belül keletkező számítási entitások és cselekvések fölötti tudatosságot. A reflektív 
architektúrák elméleti alapja úgy építhető fel, hogy a környezet állapotából és magának 
az ágensnek a számítási állapotából álló, közös állapotteret definiálunk. Döntési eljárá- 
sokat és tanulási algoritmusokat lehet úgy tervezni, hogy ebben a közös állapottérben 
működjenek, ezzel segítve és javítva az ágens számítási teljesítményét. 

Végső soron azt várjuk, hogy az olyan feladatspecifikus algoritmusok, mint amilyen 
az alfa-béta keresés és a hátrafelé láncolás, eltűnnek az MI-rendszerekből, továbbá, 
hogy ezek olyan általános módszerekkel lesznek helyettesíthetők, amelyek az ágens 
számításait jó minőségű döntések hatékony létrehozása felé irányítják. 


27.3. EGYÁLTALÁN A JÓ IRÁNYBA HALADUNK? 


Az előző fejezetekben sok előrelépést soroltunk fel, és még több lehetőséget a jövőbeli 
fejlődésre. De hova vezet mindez? Dreyfus analógiaként azt hozza fel (Dreyfus, 1992), 
hogy amikor valaki egy fa megmászásával akar a Holdra jutni, az illető állandó haladás- 
ról számolhat be egészen a fa csúcsáig. Ebben a fejezetben az a kérdésünk, hogy a mes- 
terséges intelligencia fejlődése a famászásra hasonlít-e, vagy inkább a holdrakétára. 

Az 1. fejezetben azt mondtuk, hogy célunk a racionálisan cselekvő ágens építése. 
Azonban arra is figyelmeztettünk, hogy 


. . komplex környezetben a tökéletes racionalitást - mindig helyesen cselekedni — lehetetlen elér- 
ni. A számítási szükségletek egyszerűen túl komolyak. A könyv nagyobb részében azonban azzal 
a munkahipotézissel fogunk élni, hogy a tökéletes döntéshozatal megértése jó kiindulópont. 


Itt az ideje ismét végiggondolni, mi is az MI pontos célja. Ágenseket akarunk építeni, de 
milyen specifikáció van közben a fejünkben? Íme, négy lehetőség: 
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. Tökéletes racionalitás (perfect rationality): A tökéletesen racionális ágens min- 
den pillanatban úgy cselekszik, hogy a környezetről szerzett információja alapján 
várható hasznosságát maximalizálja. Mivel láttuk, hogy a legtöbb környezetben 
túlságosan időrablók a tökéletes racionalitáshoz szükséges számítások, ezért ez nem 
realisztikus cél. 

2. Számítható racionalitás (calculative rationality): Ez az a megközelítés, amit imp- 
licit módon a logikai és döntéselméleti ágensek tervezésekor használtunk. Egy szá- 
mithatóan racionális ágens végül meghatározza azt, ami racionális választás lehetett 
volna következtetéseinek az elején. Ez érdekes tulajdonsága egy rendszernek, de a 
legtöbb környezetben a rosszkor érkező jó válasznak nincs semmi értéke. A gyakor- 
latban az MI-rendszerek tervezői rá vannak kényszerítve arra, hogy a tervezési minő- 
séget illetően egy elfogadható általános teljesítmény érdekében kompromisszumot 
hozzanak; szerencsétlen módon azonban a kalkulatív racionalitás elméleti alapja nem 
nyújt jól kidolgozott lehetőséget egy ilyen kompromisszum meghozatalára. 

Korlátozott racionalitás (bounded rationality): Herbert Simon elvetette a tökéletes 

(vagy akár a közelítőleg tökéletes) racionalitás gondolatát, és a korlátozott racionalitást 

állította a helyére (Simon, 1957), ami a valódi ágensek döntéseinek leíró elmélete. 

A következőt írta: 

A valósvilág-beli objektív racionális viselkedéshez, vagy akár csak ennek az objektív racionális vi- 
selkedésnek az elfogadható megközelítéséhez megoldandó problémák méretéhez képest túl kicsi 
az emberi elme komplex problémák megfogalmazására és megoldására szolgáló kapacitása. 


Azt javasolta, hogy a korlátozott racionalitás elsődlegesen az elfogadhatóságban 
(satisficing) nyilvánul meg: olyan hosszú ideig kell foglalkozni a döntéssel, ami ele- 
gendő egy , elfogadhatóan jó" válasz megtalálásához. Ezért a munkájáért Simon 
közgazdasági Nobel-díjat kapott, és később részletesen is írt még róla (Simon, 1982). 
Ez az emberi viselkedésnek sok esetben hasznosnak tűnő modellje, azonban nem ad 
formális specifikációt az intelligens ágensek számára, mert az elmélet nem adja meg 
az , elfogadhatóan jó" definícióját. Továbbá az elfogadhatóság láthatóan csak egyike 
a korlátozott erőforrások leküzdését szolgáló technikáknak. 

4. Korlátozott optimalitás, KO (bounded optimality, BO): Egy korlátozottan optimá- 
lis ágens adott számítási erőforrások mellett a lehető legjobban cselekszik. Egy ilyen 
ágens esetén az ágensprogram várható hasznossága legalább olyan magas, mint az 
ugyanazon a gépen futó bármilyen más ágensprogramé. 


bal 





A négy lehetőség közül, úgy tűnik, a , korlátozott optimalitás" választása adja a leg- 
több esélyt az MI erős elméleti megalapozására. Megvan az az előnye, hogy elérhető: 
mindig van legalább egy legjobb program — a tökéletes racionalitásról ugyanez nem 
mondható el. A korlátozottan optimalitás ágensek hasznosak a mindennapi gyakorlat- 
ban is, a számítható racionalitású ágensek általában nem, míg az elfogadhatóságra 
törekvő ágenseknél ez a szeszélyeiken múlik. 

A hagyományos megközelítés az MI-ben az volt, hogy a számítható racionalitással kez- 
dünk, majd az erőforráskorlátok kielégíthetősége érdekében kompromisszumokat hozunk. 
Ha ezek a korlátok csak kis problémákat okoznak, akkor a keletkező terv várhatóan a KO 
ágens tervéhez lesz hasonló. Ha azonban az erőforráskorlátok kritikussá válnak — például 
mert a környezet egyre összetettebbé válik —, akkor a két terv várhatóan el fog térni egy- 
mástól. A korlátozott optimalitás elmélete ezen korlátok kezelésére kínál elveket. 
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A korlátozott optimalitásról egyelőre keveset tudunk. Nagyon egyszerű gépekhez és 
valamilyen mértékben korlátozott környezetekhez korlátozottan optimális programok 
konstruálhatók (Etzioni, 1989; Russell és társai, 1993). Bonyolult környezetekben mű- 
ködő nagy, általános rendeltetésű számítógépek esetén azonban fogalmunk sincs, hogy 
milyenek legyenek a KO-programok. Ha a korlátozott optimalítás konstruktív elmélete 
valaha is megfogalmazható lesz, hinnünk kell, hogy a korlátozottan optimális programok 
tervezése nem fog túlságosan függni a használt számítógép részleteitől. A tudományos 
kutatást nagyon megnehezítené, ha például kiderülne, hogy egy gigabájtos memóriájú 
gép néhány kbájt memóriával való bővítése lényegi különbséget jelentene a KO- 
program tervében. Ahhoz, hogy ez ne történjen meg, a korlátozott optimalitás kritériu- 
mait kissé lazábban kell kezelni. Az aszimptotikus bonyolultság (A) függelék) mintájára 
definiálhatjuk az aszimptotikus korlátozott optimalitást, AKO) (asymptotic bounded 
optimality, ABO) (Russell és Subramanian, 1995). Tegyük fel, hogy egy P program 
egy M gép esetén korlátozottan optimális a környezetek E osztályában, ahol a környe- 
zetek komplexitása nem korlátozott. Ekkor a P" program egy AKO-program M részére 
E-ben, ha egy P programot egy kM gépen futtatva a teljesítményében túlszárnyalja, és 
ahol a kM gép k-szor gyorsabb (vagy nagyobb), mint M. Ha k nem bizonyulna óriásinak, 
elégedettek lehetnénk, ha nemtriviális környezetek és nemtriviális architektúrák esetén 
AKO-programokkal rendelkezünk. Kevés ráció lenne abban, hogy óriási erőfeszítések 
árán inkább KO-, mint AKO-programokat keressünk, ha a használható gépek nagysága 
és sebessége, úgy tűnik, egy adott idő alatt konstans mértékben úgyis nő. 

Megkockáztathatjuk azt is, hogy a KO- vagy az AKO-programok - nagy teljesítőké- 
pességű számítógépek és bonyolult környezetek esetén - nem fognak szükségszerűen 
egyszerű és elegáns struktúrával rendelkezni. Láttuk már, hogy az általános rendelteté- 
sű intelligenciához bizonyos fokú reflexszerű és tudatos képesség szükséges, ami a tu- 
dás és a döntéshozatali formák sokaságát, ezen formák mindegyikéhez a tanuló és 
a kompilálási mechanizmusokat, a következtetés vezérlésének módszereit és a tárgyte- 
rületre vonatkozó specifikus tudás nagy tárát jelenti. A korlátozottan optimális ágensnek 
adaptálódnia kell ahhoz a környezethez, amelyben tartózkodik, így belső szervezettsége 
végül az adott környezetre jellemző optimalizálási sémákat tükrözheti. Ez elvárható, 
hasonlóképpen ahhoz, ahogy a súlyukban és a lóerőben korlátozott versenyautók szélső- 
ségesen komplikált konstrukciókig jutottak el. Az a sejtésünk, hogy a korlátozott opti- 
malitáson alapuló mesterséges intelligencia tudománya nagy részben olyan folyamatok 
tanulmányozásából fog állni, amelyek révén egy ágensprogram a korlátozott optúmalitás- 
hoz fog konvergálni, és talán kevésbé fog az eredményül kapott, nehezen áttekinthető 
programok részleteivel törődni. 

Összegezve, a korlátozott optimalitás koncepcióját jól definiált és kivitelezhető ku- 
tatási feladatnak javasoljuk a mesterséges intelligencia kutatása számára. A korlátozott 
optimalitás az optimális programokat specifikálja, és nem az optimális cselekvést. A cse- 
lekvést úgyis a programok generálják, és a programok azok, amelyek felett a tervező 
befolyással rendelkezik. 
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David Lodge az irodalomkritikusok egyetemi világáról szóló Small world (Kis világ) 
(Lodge, 1984) c. novellájában a főhős megdöbbenést okoz, amikor a ki" imde egy- 
mással vitatkozó tagokból álló irodalomelméleti bizottságtól megkérdezi: , Mi van, ha 
igazuk van?" Az elméletalkotók egyike sem gondolt még erre a kérdésre (valószínűleg 
azért, mert megcáfolhatatlan elméleteken vitatkozni csak öncél lehet). Néha hasonló 
zavart okozhatunk, ha MI-kutatóktól kérdezzük azt: , Mi van, ha sikerrel jársz?" A mes- 
terséges intelligencia izgalmas dolog, az intelligens számítógépek pedig nyilvánvalóan 
jobbak, mint buta társaik, miért hát az aggodalom? 

Ahogy a 26.3. alfejezetben felvetettük, bizonyos etikai kérdéseket is meg kell fon- 
tolni. Az intelligens gépek sokkal többre képesek, de vajon erejüket jóra vagy rosszra 
fordítják? A mesterséges intelligencia kifejlesztésén fáradozók felelőssége, hogy meg- 
bizonyosodjanak munkájuk pozitív hatásáról. Hogy a hatás mennyire lesz széles körű, az 
a siker mértékétől függ. Már a mesterséges intelligencia mérsékelt sikere is változásokat 
hozott a számítógép-tudomány tanításában (Stein, 2002) és a szoftverek fejlesztésében. 
Az MI olyan új alkalmazásokat tett lehetővé, mint például a beszédfelismerő, készlet- 
ellenőrző vagy megfigyelő rendszerek, robotok és keresőgépek. 

A mesterséges intelligencia közepes méretű sikere várhatóan befolyásolná a legkü- 
lönbözőbb emberek mindennapi életét. A számítógépesített kommunikációs rendszerek 
(mint például a mobiltelefonok és az internet) már eddig is mélyreható változásokat 
okoztak a társadalomban, a mesterséges intelligencia esetében azonban ez még várat 
magára. Könnyű elképzelni, hogy a tényleg hasznos otthoni és irodai személyi asszisz- 
tensek komoly pozitív hatással lennének az emberek életére, habár rövid távon valószí- 
nűleg némi gazdasági zavart is okozna. Az ilyen fejlettségi szintű technológiai kapacitás 
azonban alkalmazható lenne autonóm fegyverek létrehozására is, és ez a legtöbbek sze- 
rint nemkívánatos eredmény lenne. 

Végül pedig valószínűnek tűnik, hogy a mesterséges intelligencia nagyarányú sikere — 
az emberihez hasonló vagy annál magasabb szintű intelligencia létrehozása — megváltoz- 
tatná az emberiség többségének életét. Átalakulna munkánk és játékunk belső természe- 
te, csakúgy, mint az intelligenciáról és a tudatosságról vallott nézeteink, sőt megváltozna 
az emberi faj jövőbeli sorsa is. Ezen a szinten az MI-rendszerek közvetlen fenyegetést 
jelenthetnének az emberi autonómiára, szabadságra, sőt akár a fennmaradásunkra is. 
Mindezek miatt a mesterséges intelligencia kutatásától nem válaszhatók el az etikai kö- 
vetkezményei. 

Mit hoz majd a jövő? A sci-fi írók láthatóan jobban kedvelik a negatív utópiákat, 
mint a pozitívakat, valószínűleg azért, mert ez ad lehetőséget az érdekesebb cselekmé- 
nyekre. De a mesterséges intelligencia mindeddig más forradalmi technológiákhoz 
(nyomtatás, csővezetékek, légi utazás, telefónia) hasonlóan viselkedett: pozitív aspektu- 
saik ellensúlyozták negatív hatásaikat. 

Összefoglalásul azt mondhatjuk, hogy láttuk, a mesterséges intelligencia mekkora 
haladást tett meg rövid története alatt, de ma is érvényes Alan Turing Computing 
Machinery and Intelligence c. esszéjének zárómondata: 












Csak rövid távolságra látunk előre, de azt látjuk, hogy sok a tennivaló. 


A) MATEMATIKAI ALAPOK 


A1. BONYOLULTSÁGANALÍZIS ÉS AZ O() JELÖLÉS 


A számítógépes szakembereknek gyakran szembe kell nézniük azzal a feladattal, hogy 
eldöntsék, két algoritmus közül melyik fut gyorsabban, vagy melyik igényel kevesebb 
memóriát. Ezt a feladatot kétféle módon lehet megközelíteni. Az első a teljesítménymé- 
rés (benchmarking) — aho! az algoritmusokat számítógépen futtatjuk, és megmérjük, 
milyen a sebességük másodpercekben, valamint a memóriafogyasztásuk bájtokban. 
Hiszen végül is ez az, ami igazából számít. A teljesítménymérés azonban nem biztos, 
hogy kielégítő mérték, mivel igen specifikus: egy konkrét program teljesítményét méri, 
amely program egy konkrét programozási nyelven íródott, konkrét gépen fut, konkrét 
fordító és bemeneti adatok mellett. A teljesítménymérő program által szolgáltatott egy- 
szerű adatokból nehéz lenne arra következtetni, hogy az algoritmus milyen jól vizsgá- 
zik más fordító, más számítógép vagy más adathalmaz esetén. 


Aszimptotikus analízis 


A második megközelítés az algoritmusok matematikai elemzésén (analysis of algo- 
rithms) alapul, konkrét implementációtól és bemenetektől függetlenül. Ezt a megköze- 
lítést egy példa kapcsán, egy számsorozatot összeadó program esetén fogjuk ismertetni: 





function ÖSSZEGZÉS(szekvencia) returns egy szám 
összeg — 0 
for ; — 1 to Hossz(szekvencia) 
összeg — összeg 4 szekvencia[í) 
end 
return összeg 











Az elemzés első lépése a bemenetektől való eltekintés, olyan paraméter vagy paramé- 
terek megkeresése, amely vagy amelyek jellemzők a bemenet méretére. Jelen példában 
a bemenetet a szekvencia hosszával jellemezhetjük, aminek a jele legyen s. Második 
lépés az implementációktól való eltekintés, azaz egy olyan mérték megkeresése, amely 
tükrözi az algoritmus futásiidő-igényét, de nem kötődik egy konkrét fordítóhoz vagy 
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számítógéphez. Az ÖSSZEGZÉS program esetén ez lehetne például a végrehajtott kód 
sorainak a száma. A mérték részletesebb is lehetne, külön specifikálva az algoritmus ál- 
tal végrehajtott összeadások, értékadások, tömbhívatkozások és elágazások számát. 
Mindkét esetben megkapjuk az algoritmus által végzett lépések teljes számának a jel- 
lemzését a bemenet nagyságának függvényében, amit 7(/1)-nek fogunk nevezni. Ha 
megszámoljuk a kód sorait, a példánk esetében az eredmény T(n) — 2n - 2. 

Ha minden program olyan egyszerű lenne, mint az ÖSSZEGZÉS, az algoritmusok elem- 
zése triviális lenne. Két probléma miatt a helyzet azért bonyolultabb. Először is, ritka 
eset olyan paramétert találni, mint az n, amely teljes egészében jellemzi az algoritmus 
által végrehajtott lépések számát. A legjobb, amivel ehelyett rendelkezhetünk, 
a legrosszabb esetet jelentő Tiegrosszabbí7?) vagy az átlagos 7 suae(n) számítása. Az átlag 
kiszámításához az elemzőnek fel kell tételeznie a bemenetek valamilyen eloszlását. 

A másik probléma az, hogy az algoritmusok ellenállnak az egzakt elemzésnek. Ilyen 
esetben közelítésekre szükséges támaszkodnunk. Azt mondhatjuk, hogy az ÖSSZEGZÉS 
algoritmus 0(n) — avagy nagy ordó n — jelezvén, hogy a mértéke, néhány kis értékű 
n kivételével, a legtöbb esetben n konstans-szorosa. Formálisan: 


T(n) OXf (n)) mértékű, ha T() £ kf(n) valamilyen £-ra, minden n 5 hg esetén. 


Az 0(n) jelölés az aszimptotikus analízist (asymptotic analysis) jelenti. Külön vizs- 
gálat nélkül azt mondhatjuk, hogy ha n aszimptotikusan közeledik a végtelenhez, egy 
0(n) algoritmus jobb, mint egy O(n?) algoritmus. Egy egyedi teljesítménymérő adat 
egy ilyen kijelentést nem tudna alátámasztani. 

Az 00 jelölés a konstans szorzóktól eltekint, emiatt kevésbé precíz, viszont könnyebb 
használni, mint a 7()-t. Így például egy O(1?) algoritmus egy 20 algoritmusnál hosszú 
távon mindig: rosszabb lesz, azonban ha a két algoritmus Tr? -- 1) és T(100n -t- 1000), 
akkor az 0(n?) algoritmus n £ 110-re jobb lesz. 

E hátránya ellenére az aszimptotikus elemzés az algoritmuselemzés legelterjedteb- 
ben használt módszere. Ez azért van így, mert az elemzés mind a műveletek egzakt 
számától (a k konstans tényezőt figyelmen kívül hagyva), mind a bemenet egzakt tar- 
talmától (csupán n nagyságát figyelembe véve) elvonatkoztat. Ily módon az elemzés 
matematikailag kivitelezhetővé válik. Az 0() jelölés jó kompromisszum a precizitás És 
a könnyű elemzés között. 


NP és az inherensen nehéz problémák 


Az algoritmusok elemzése és az O() jelölés lehetővé teszi, hogy egy konkrét algoritmus 
hatékonyságáról nyilatkozzunk. Arról azonban nem tudunk mondani semmit, hogy az 
adott problémához van-e nála jobb algoritmus. A bonyolultságelmélet (complexity 
analysis) területe nem az algoritmusokat, hanem inkább a problémákat elemzi. Az első 
nagy szakadék a polinom időben megoldható és a polinom idejű megoldást nélkülöző 
problémák között van, akármilyen algoritmust is használnánk. A polinom idejű problé- 
mák osztályát — azokét, amelyek O(r") időben oldhatók meg valamilyen k esetén — P-vel 
jelöljük. Ezeket néha , könnyű" problémáknak hívjuk, mert az osztályhoz O(logn) és 
0(n) futási idejű problémák is tartoznak. Idetartoznak azonban O(rr!990) problémák is, a 
akönnyű" elnevezést tehát túlságosan szó szerint venni nem lehet. 
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A problémák másik fontos osztálya az NP osztály, a nemdeterminisztikus polinom 
idejű problémák osztálya. Egy probléma akkor tartozik ide, ha létezik egy algoritmus, 
ami polinom időben meg tud találni egy megoldást, és még ellenőrizni is tudja, hogy a 
megtalált megoldás korrekt-e. Az ötlet az, hogy ha tetszőlegesen nagyszámú procesz- 
szorral rendelkezünk ahhoz, hogy az összes sejtést egyszerre próbáljuk ki, vagy pedig 
ha szerencsések vagyunk, és mindig elsőre eltaláljuk a helyes megoldást, az NP prob- 
léma P problémává válik. A számítógépes tudomány egyik nagy nyitott kérdése az, 
hogy az NP osztály ekvivalens-e a P osztállyal akkor, ha nélkülözzük a végtelen pro- 
cesszorhalmaz, illetve a mindentudó sejtés luxusát. A legtöbb számítógépes szakember 
meg van győződve arról, hogy P - NP, vagyis, hogy az NP problémák inherens módon 
nehezek, és nincsenek számukra polinom idejű algoritmusok. Ezt azonban még soha 
sem bizonyították be. 

Akik a P — NP eldöntése iránt érdeklődnek, azok figyelmébe az NP osztály egy al- 
osztályát, az NP-teljes (NP-complete) problémák alosztályát ajánljuk. A teljes szó itt 
a ,legvégsőt" jelenti, és az NP osztály legnehezebb problémáit jelöli ki. Azt bebizonyí- 
tották már, hogy vagy minden NP-teljes probléma P-ben van, vagy egyik sem. Emiatt 
ez az osztály elméletileg érdekes, de gyakorlati jelentősége is van, mert sok fontos 
problémáról tudjuk, hogy NP-teljes. Egy lehetséges példa a Boole-kifejezések kielégít- 
hetőségének problémája: egy adott logikai kifejezés esetén létezik-e az ítéletváltozói- 
nak olyan logikaiérték-hozzárendelése, hogy a kifejezés igaz legyen? Hacsak egy cso- 
dának nem leszünk tanúi, és aP — NP nem lesz igaz, nincs olyan algoritmus, amely 
minden kielégíthetőségi problémát polinomiális időben megold. Az MI azonban jobban 
érdekelt abban, hogy vajon léteznek-e hatékony algoritmusok típikus, előre rögzített el- 
oszlásokból sorsolt problémák esetén. Ahogy ezt a 7. fejezetben láttuk, vannak olyan 
algoritmusok, mint a WALKSAT, amelyek sok probléma esetén egészen jól teljesítenek. 

A co-NP osztály az NP komplemense abban az értelemben, hogy minden NP-beli 
döntési probléma esetén létezik egy neki megfelelő co-NP-beli probléma felcserélt 
igen" és ,nem" válaszokkal. Tudjuk, hogy a P mind az NP, mind a co-NP osztályok 
részhalmaza, és azt gondoljuk, hogy vannak olyan co-NP-beli problémák, amelyek 
P-nek nem elemei. A co-NP osztály legnehezebb problémái a co-NP-teljes problémák. 

A j8P osztály az NP-beli döntési problémáknak megfelelő számlálási problémák 
halmaza. Döntési problémáknak igen-nem a megoldásuk: például létezik-e megoldása 
ennek a 3-SAT mondatnak? A számlálási problémáknak egész számok a megoldásaik; 
mennyi megoldása van ennek a 3-SAT mondatnak? Egyes esetekben a számlálási prob- 
léma a döntési problémánál sokkal nehezebb. Így példáui annak az eldöntése, hogy egy 
Páros gráfhoz létezik-e egy tökéletes párosítása O(VE) idejű (ahol a gráfnak V csúcsa 
és E éle van). A , hány tökéletes párosítása létezik egy konkrét páros gráf esetén" szám- 
lálási probléma viszont $£P-teljes, amin azt kell érteni, hogy legalább olyan nehéz, mint 
a $4P-beli problémák bármelyike, és így legalább olyan nehéz, mint az NP-beli problé- 
mák bármelyike. 

A P-TÁR - a polinom-tárigényű — problémák osztályát szintén tanulmányozták még 
nemdeterminisztikus gép esetén is. Az az általános vélekedés, hogy a P-TÁR-nehéz 
problémák az NP-teljes problémáknál nehezebbek, bár kiderülhet, hogy NP — P-TÁR, 
mint ahogy az is kiderülhet, hogy P — NP. 
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A2. VEKTOROK, MÁTRIXOK ÉS LINEÁRIS ALGEBRA 


A matematikusok egy vektort egy vektortérelemként definiálnak. Mi azonban konk- 
rétabb definíciót fogunk használni. Egy vektor az értékek egy rendezett szekvenciája. 
A kétdimenziós térben például olyan vektoraink vannak, mint: x — (3, 4) és y — (0, 2). 
A szokásos konvencióhoz folyamodunk vastagon szedett betűket használva a vektorne- 
veknek, bár egyes szerzők a nevek fölé nyilat vagy vonalat húznak: X vagy y. Egy vek- 
tor elemeire indexekkel lehet hivatkozni: z — (Z4, 22. ..., Zn)- 

A vektorokon értelmezett két alapvető művelet a vektorok összeadása és egy 
skalárral való szorzása. Az x 4 y vektorösszeadás az elemenkénti összegzés: X ty — 
(3-0, 4 4-2) — (3, 6). A skalárszorzás mindegyik elemet egy konstans értékket szo- 
rozza be: 5x — (5 x 3,5 x 4) — (15, 20). 

Egy vektor hosszát az IX] jelöli, amelynek értéke egyenlő a vektor elemeinek négyzet- 
összegéből vett négyzetgyökével: ix] — V(32 14-42) — 5. Két vektor skalárszorzata, x - y a 
megfelelő vektorelemek szorzatának összege, azaz x : y — 3; X;y;, vagy konkrét esetünk- 
benx:y—3x04t4x27-8. 

A vektorokat sokszor egy "n-dimenziós euklideszi tér irányított vonalszakaszainak 
(nyilaknak) képzeljük. Ekkor a vektorösszeadás annak felel meg, mintha az egyik vek- 
tor kezdő pontját a másik vektor végpontjához illesztenénk, az x : y skalárszorzat vi- 
szont [xIIylcos6-vel lesz egyenlő, ahol 8 az x és az y közötti szög. 

Egy mátrix az értékek négyszögletes elrendezése sorokba és oszlopokba. Itt egy 3 x 4 
méretű m mátrixot látunk: 


Min Mi2 Mizo my 
Ma mz2 mzz my 
zá Big Hgy Bá 


tény m; ; első indexe a sort, a második az oszlopot jelöli. Programozási nyelvekben 
gjt gyakranm[i, j1, vagy m(i) (j1-nek írják. 

gé mátrix összegét a megfelelő elemek összeadásával definiáljuk: (m - n), 
m; ; 4 n; . (Az összeg különböző méretű m és n mátrixokra nincs definiálva.) Egy mátrix- 
nak egy skalárral történő szorzatát szintén definiálhatjuk: (cm); ; ij — CM; j. . A mátrixszorzat 
(két mátrix szorzata) már bonyolultabb. Az mn szorzat csak akkor definiált, ha az m 
mátrix a x b, az n mátrix pedig b x c méretű (azaz a második mátrixnak annyi sora van, 
mint amennyi oszlopa az első mátrixnak). Az eredmény egy a x c méretű mátrix. Ez 
azt jelenti, hogy a mátrixszorzat nem kommutatív: általánosságban mn 5 nm. Ha a 
mátrixok megfelelő méretűek, akkor az eredmény: 

(mn),, — 2.m, JN 
AzI egységmátrix I; ; elemei egységnyiek, ha i — j, különben müllélee Az egységmátrix 
tulajdonsága, hogy mI — m, minden m-re. Az m transzponáltját, m-t, megkapjuk, ha 
az m sorait és oszlopait felcseréljük, formálisan: m"; íj 7 Mg. 

A mátrixokat lineáris egyenletrendszerek megoldására a Gauss-Jordan-eliminációs 
(Gauss-Jordan elimination) algoritmussal használjuk, ami egy 0(n?) komplexitású 
algoritmus. Tekintsünk az alábbi egyenletrendszert, amelynek x, y és z megoldására va- 
gyunk kíváncsiak: 
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2x-Hy-z—8 
—3x-y-H22—-11 
—2x--y22—-3 


Ezt az egyenletrendszert kifejezhetjük mátrixos formában is: 
XX W ze 


2 1-I 8 
-3 -I 2 -I 
-2 IL 2 -3 


Itt az x y z c nem része a mátrixnak, csak emlékeztetőül szolgál. Tudjuk, hogy ha egy 
egyenlet mindkét oldalát egy konstanssal megszorozzuk, vagy ha két egyenletet egy- 
máshoz hozzáadunk, akkor szintén egy érvényes egyenlethez jutunk el. A Gauss- 
Jordan-elimináció ezeket a lépéseket ismételten alkalmazza úgy, hogy először az első 
változót (az x-et) elimináljuk, az elsőt kivéve az összes egyenletből, majd folytatjuk 
minden í-re, az i-edik változót minden egyenletből eliminálva, az i-edik egyenletet 
kivéve. Az x-et a második egyenletből úgy elimináljuk, hogy az első egyenletet 3/2-vel 
megszorozzuk, az eredményt pedig a második egyenlethez hozzáadjuk. Ezzel! az aláb- 
bi mátrixhoz jutunk el: 


xy z c 


2 1 - 8 
005 05 1 
-2 1 2-3 


Folytatjuk így eliminálva az x-et, az y-t és a z-t, míg végül a: 


£ 


90. m 
5-OtL 
—m—o0 

9 


-I 


mátrixot kapjuk, amely jelzi, hogy a megoldás x — 2, y — 3, z — -1. (Próbálja ki!) 
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A valószínűség az eseményhalmazokon definiált olyan mérték, amely az alábbi három 
axiómát elégíti ki: 


1. Minden esemény mértéke egy 0 és I közötti szám. Ezt a következőképpen írjuk: 
0£ RE — ej £ I, ahol az E egy eseményt képviselő véletlen változó, és az e;-k az 
Elehetséges értékei. Általánosságban a véletlen változókat nagybetűkkel, az értéke- 
it pedig kisbetűkkel jelöljük. 

2. Az egész halmaz mértéke 1; azaz 927 PREze)-i 
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3. Diszjunkt halmazok uniójának a valószínűsége az egyedi események valószínű- 
ségeinek összege, azaz P(E — ej V E — e) — P(E — ep) 4 P(E — €e7), ahol ej és ez 
díszjunktak. 

Egy valószínűségi modell (probabilistic model) a kölcsönösen egymást kizáró, lehet- 

séges kimenetelek mintateréből áll, és minden kimenetel valószínűségi mértékéből. A 

holnapi időjárás modelljében például a kimenetelek a következők lehetnek: napos, fel- 

hős, esős vagy havas. Ezen kimenetelek egy részhalmaza képvisel egy eseményt. 

A ág enszésajd például az (esős, havas) részhalmaz. 

A (P(E — ej), ..., P(E — e,)) értékekből képzett vektor jelölésére a P(F)-t fogjuk 

használni. A Pte;) jelölést szintén használni fogjuk a P(E — e;) rövidítésére, hasonlóan a 

1P(E—ep-t bag P(e)-ként rövidítjük. 
A A P(BIA) feltételes Valószínűséget a P(BN A)/P(A) definiálja. A és B feltételesen füg- 
getlenek, ha P(BJA) — P(B) [vagy ekvivalens módon P(AJB) — P(A)J. Folytonos változók 
esetén az értékek halmaza végtelen, és hacsak pontszerű tüskék nincsenek, mindegyik 





function) definiálunk, amit szintén P(X)-szel fogunk jelölni. P(X) jelentése a P(A) diszk- 
rét valószínűségi függvénytől kissé eltér. A P(X — c) sűrűségfüggvény-érték az a való- 
színűség, hogy az X a c körüli intervallumba esik, elosztva az intervallum hosszával, és 
határátmenetet képezve, ahogy az intervallum hossza tart a 0-hoz: 


PRX-o)- aim Pe SX £c-tdx)ldx 
A sűrűségfüggvénynek nemnegatívnak kell lennie minden x-re, és teljesítenie kell, hogy: 
JE Po0d-1 
—o0 


Definiálhatunk egy valószínűségi eloszlásfüggvényt (cumulative probability density 
function), F(X)-et is, ami annak a valószínűsége, hogy a véletlen változó x-nél kisebb: 


FO - (ő P(Z)dz 


Jegyezzük meg, hogy a valószínűségi sűrűségfüggvénynek létezik egysége, az eloszlás- 
függvény viszont egység nélküli. Ha az X-et például másodpercben mérjük, akkor a sűrű- 
séget Hz-ben (azaz 15) fogjuk. Ha X a méterben mért háromdimenziós tér egy pontja, 
akkor a sűrűséget 1/m?-ben mérjül 

Az egyik legfontosabb valószínűség-eloszlás a Gauss-etoszlás (Gaussian distri- 
bution), amit normális eloszlásnak (normal distribution) is szokás nevezni, A , közép- 
értékű és a szórású (c? varianciájú) Gauss-eloszlás definíciója: 





— A e-6-ny/20) 
P(x) a NT eyrj e 
ahol x egy folytonos változó —o0-től 4-oo-ig terjedő értékkészlettel.  — 0 és 0? — 1 
mellett kapjuk a standard normális eloszlás (standard normal distribution) speciális 
esetet. Egy d dimenziós x vektor feletti eloszlás a többváltozós Gauss-eloszlás 
(multivariate Gaussian distribution): 

1 erve se-n) 


very Iz 


P(x) — 
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ahol s az eloszlás középértékvektora, 3 pedig a kovarianciamátrix (covariance 
matrix). a 
A standard normális eloszlás egydimenziós eloszlásfüggvénye: 





4 
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ahol az erf(x) az ún. hibafüggvény (error function), amelynek zárt alakja nincs. 

A központi határeloszlás tétele (central limit theorem) azt mondja, hogy n véletlen 
változó középértékének az eloszlása a normális eloszláshoz tart, ha n tart végtelenhez. 
Igaz ez a véletlen változók majdnem minden halmazára, hacsak valamelyik véges 
alhalmaz varianciája a többit nem fogja dominálni. 


Irodalmi és történeti megjegyzések 


A számítógépes tudományokban ma oly elterjedten használt 00 jelölést (nagy ordó) 
P. G. H. Bachmann német matematikus vezette be a számelmélettel kapcsolatban 
(Bachmann, 1894). Az NP-teljesség koncepcióját Cook (Cook, 1971) dolgozta ki, míg a 
problémák egymásra redukálásának modern módszertanát Karpnak köszönhetjük (Karp, 
1972). Munkásságukért mindketten Turing-díjban — a számítógépes tudományok legma- 
gasabb elismerésében — részesültek. 

Az algoritmusok elemzésére és tervezésére irányuló klasszikus munkák között talál- 
juk a (Knuth, 1973; Aho és társai, 1974) műveket. Újabb adalékok Tarjantól (Tarjan, 
1983) és a Cormen, Leiserson és Rivest szerzőhármastól (Cormen és társai, 1990) szár- 
maznak. Ezekben a művekben a hangsúlyt a kezelhető problémákat megoldó algorit- 
musok tervezésére és elemzésére helyezték. Az NP-teljességnek, illetve a kezelhetet- 
lenség más formáinak az elméletébe a legjobb bevezetők (Garey és Johnson, 1979) és 
(Papadimitriou, 1994). Az elmélet tárgyalásán túlmenően Garey és Johnson meggyőző- 
en, példákkal illusztrálják, hogy a számítógépes szakemberek miért a polinom és az ex- 
ponenciális futási időigény határára teszik egyhangúan a kezelhető és kezelhetetlen 
problémák közötti határvonalat. A szerzők az NP-teljesként vagy más szempontból ke- 
zelhetetlennek ismert problémák terjedelmes katalógusát is mellékelik. 

A valószínűség-számításról jó művek (Chung, 1979; Ross, 1988; Bertsekas-Tsítsiklis, 
2002; Feller, 1971). 


Mig 


B. MEGJEGYZÉSEK A NYELVEKRŐL 
ÉS AZ ALGORITMUSOKRÓL 


B.1. NYELVEK DEFINIÁLÁSA 
BACKUS-NAUR-FORMÁBAN (BNF) 


Jelen könyvben definiáltunk néhány nyelvet, az ítéletlogika nyelvét (258. oldal), az 
elsőrendű logika nyelvét (304. oldal) és az angol nyelv részhalmazát (921. oldal). Egy 
formális nyelvet mondathalmazként definiálunk, ahol egy-egy mondat a szimbólumok 
halmaza. A számunkra érdekes nyelvek mindegyike végtelen sok mondatból áll, követ- 
kezésképpen szükségünk van e halmaz tömör jellemzésére. A jellemzést egy nyelvtan 
(grammar) segítségével kíséreljük meg. Nyelvtanunkat Backus-Naur-forma (Backus- 
Naur form) vagy BNF-formalizmusban fejezzük ki. Egy BNF-nyelvtannak négy kom- 
ponense van: 


s A zárószímbólumok vagy a terminálisok (terminal symbols) halmaza. Ezekből a 
szimbólumokból, másképpen szavakból, állnak össze a nyelv mondatai. Ezek lehet- 
nek betűk (A, B, C, ...) vagy szavak (a, aardvark, abacus, ...). 

s A nyelv részkifejezéseit kategorizáló nemzáró szimbólumok vagy nemterminá- 
lisok (nonterminal symbols) halmaza. Az angol nyelvben például a FőnéviKifejezés 
(NounPhrase) nemzáró szimbólum a , you" és a , the big slobbery dog" mondatokat 
is tartalmazó végtelen halmazt jelenti. 

s A kezdő szimbólum (start symbol) a nyelv teljes mondatait jelentő nemzáró szim- 
bólum. Az angol nyelv esetén ez a Mondat (Sentence), az aritmetika esetén ilyen 
szimbólum lehet a Kifejezés (Expr). 

" A képzési szabályok (rewrite rules) halmaza, ahol egy-egy szabály LHS — RHS for- 
májú. LHS egy nemzáró szimbólum, az RHS pedig 0 vagy több (záró vagy nemzáró) 
szimbólumból állhat. 


A 
Mondat — FőnéviKifejezés IgeiKifejezés 


alakú képzési szabály azt jelenti, hogy ha bármikor is van két, egy FőnéviKifejezés-ként 
és egy IgeiKifejezés-ként kategorizált mondatunk, akkor azokat összekapcsolhatjuk, és 
az eredményt Mondat-ként kategorizálhatjuk. A ] szimbólum az alternatív jobb oldali 
kifejezéseket választja szét. Nézzük most az egyszerű aritmetikai kifejezések BNF- 
nyelvtanát: 
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Kifejezés — Kifejezés Operátor Kifejezés ] ( Kifejezés ) ] Szám 


Szám — Számjegy I Szám Számjegy 
Számjegy ——— OJAf2I3Í4]516]718]9 
Operátor 54]-]I§]x 


A nyelvekkel és a nyelvtanokkal bővebben a 22. fejezetben foglalkoztunk. Előfordul, 
hogy más forrásokban a BNF-re kissé módosított jelölést használnak. Nemzáró szimbó- 
lum esetén (Számjegy)-gyel találkozhatunk a Számjegy helyett, a zárószímbólum esetén 
"szó"-val a szó helyett, illetve szabályokban a : : — jelöléssel a — helyett. 
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A könyvünkben több mint 80 algoritmust definiáltunk részletesen. Ahelyett hogy egy 
programozási nyelvet választottuk volna (és ahelyett, hogy azt kockáztattuk volna, hogy 
a nyelvet nem ismerő olvasó elveszti a fonalat), úgy döntöttünk, hogy pszeudokóddal 
írjuk le az algoritmusokat. Ezek legtöbbje érthető lesz azoknak, akik Javát, C-t--t, 
Lispet vagy hasonló nyelveket használnak. Helyenként azonban matematikai formulá- 
kat, illetve mindennapi nyelvet használunk olyan részek leírásához, amelyek máskülön- 
ben nehezebben lennének olvashatók. Néhány egyéni vonásról is szót kell ejtenünk. 

Statikus változók. A static kulcsszót egy olyan változó megjelölésére használjuk, 
amely kezdeti — vagy a rákövetkező értékadásból adódó — értékét a függvény első hívá- 
sánál kapja meg, és megtartja a függvény minden azt követő hívásánál. A statikus vál- 
tozó tehát hasonlít egy globális változóra abban, hogy a függvény egyedi hívását túléli, 
értéke azonban csak a függvényen belül férhető hozzá. A könyv ágensprogramjai statikus 
változókat , memória" létesítésére használnak. A statikus változókat kezelő programok 
, objektumként" implementálhatók olyan objektumorientált nyelvekben, mint a Java vagy 
a Smalltalk. A funkcionális nyelvekben az implementálásuk könnyen oldható meg a 
lambda-kifejezés végrehajtásával egy olyan környezeten belül, amelyben a szükséges 
változót definiáltuk. 

Függvények mint értékek. A függvények és eljárások jelölésére nagybetűs neveket, 
a változók jelölésére pedig kis-, dőlt betűs neveket használunk. Egy függvényhívás leg- 
több esetben tehát FN(x) képet nyújt. Megengedjük azonban, hogy egy változó függ- 
vényértéket is felvehessen. Ha az f értéke például a négyzetgyökfüggvény, akkor az 
f(9) által visszaadott érték a 3. 

A tömbök 1-től kezdődnek. Ha másképpen nincs specifikálva, egy tömb első indexe 
mindig I, ahogy ez a matematikában szokás, és nem 0, mint a Javában vagy a C-ben. 

A beljebb szedett bekezdés fontos. A beljebb szedett bekezdést a hurok vagy a fel- 
tételes kifejezés hatáskörének megjelölésére használjuk, mint például a Python nyelv- 
ben, ellentétben a Javával és a C4-4-szal (ahol a zárójelezés használatos), illetve a 
Pascallal és a Visual Basickel (ahol egy end használatos). 


(ér 
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B3. ONLINE SEGÉDNYÚJTÁS 


A könyvben található algoritmusok többségét online kódtárunkban implementáltuk, 
amelynek címe: 

aima.cs.berkeley.edu 
Ha Önnek megjegyzései lennének a könyvünkkel kapcsolatban, hibákat vett észre, 
illetve ha ötletei vannak, amelyekkel a könyv javítható, keressen meg bennünket. Kér- 
jük, látogassa meg a weboldalunkon a vitafórumunkat, vagy küldjön e-mail üzenetet a 
következő címre: 

aimaC€cs.berkeley.edu 
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